Neue Preisstrategie optimiert E-Auto-Laden in Smart Cities

Neue Preisstrategie optimiert E-Auto-Laden in Smart Cities

In einer Zeit, in der urbane Zentren weltweit nachhaltigere Mobilitätslösungen suchen, eröffnet eine bahnbrechende Studie neue Wege für das Laden von Elektrofahrzeugen (EVs). Das Forschungsteam um Lu Siyue von der State Grid Beijing Electric Power Company hat eine innovative Preisgestaltung entwickelt, die die Integration erneuerbarer Energien mit dem städtischen Verkehrsfluss harmonisiert. Die Arbeit, veröffentlicht im September 2024 in der Fachzeitschrift Computer Applications and Software, stellt einen zweischichtigen Optimierungsansatz vor. Dieser zielt nicht nur auf die Minimierung der gesellschaftlichen Kosten ab, sondern verbessert auch die Netzstabilität und entlastet die Verkehrssysteme in Metropolen.

Die Studie adressiert eine der drängendsten Herausforderungen der modernen Stadtplanung: die zunehmende Verflechtung zwischen Stromverteilungsnetzen (DN) und urbanen Verkehrsnetzen (UTN). Mit dem rasanten Anstieg der Elektrofahrzeug-Nutzung kann unkoordiniertes Laden zu lokalen Netzüberlastungen, ineffizienter Nutzung erneuerbarer Ressourcen und erhöhten Staus an Ladestationen führen. Herkömmliche Preismodelle versagen oft bei der Berücksichtigung dieser systemischen Wechselwirkungen, indem sie sich auf isolierte Aspekte wie zeitabhängige Tarife oder statische Standortgebühren konzentrieren. Lu Siyues Team erkannte jedoch, dass ein ganzheitlicherer Ansatz erforderlich ist – einer, der sowohl die dynamische Natur der Windenergieerzeugung als auch die stochastischen Muster der Reisenachfrage berücksichtigt.

Im Kern des Methodenansatzes steht ein zweistufiges Optimierungsmodell. Die obere Ebene konzentriert sich auf die Bestimmung optimaler Ladegebühren (Charging Service Fees, CSF) innerhalb eines Verteilungsnetzes, das Windenergie integriert. Diese Ebene wird als ein Problem der zweiten Ordnung formuliert, was eine präzise Modellierung elektrischer Einschränkungen ermöglicht und gleichzeitig die inhärente Unsicherheit der Windenergieerzeugung berücksichtigt. Indem die CSF als Entscheidungsvariable behandelt werden, ermöglicht das Modell Netzbetreibern, das Ladeverhalten von Elektrofahrzeugen in Echtzeit zu beeinflussen und die Last von Zeiträumen mit geringer erneuerbarer Verfügbarkeit oder hohem Netzstress wegzulenken.

Die untere Ebene des Modells simuliert das Nutzerverhalten durch ein Verkehrsverteilungsproblem, das auf dem Prinzip des Nutzergleichgewichts (User Equilibrium, UE) basiert. Im Gegensatz zu traditionellen Modellen, die deterministische Reisemuster annehmen, berücksichtigt dieses Framework Zufälligkeit in den Verkehrsströmen von Ursprung nach Ziel (OD), was die unvorhersehbare Natur des täglichen Pendelns und der Besorgungen widerspiegelt. Fahrer werden als rational handelnde Akteure angenommen, die Routen und Ladestopps wählen, um ihre individuellen Kosten – einschließlich Fahrzeit, Wartezeit und Stromkosten – zu minimieren. Die Interaktion zwischen diesen beiden Ebenen erzeugt eine Feedback-Schleife, bei der Preissignale das Verkehrsverhalten beeinflussen, was wiederum den Strombedarf und die Netzbedingungen beeinflusst.

Was diese Forschung auszeichnet, ist die Integration des tiefen Verstärkenden Lernens (DRL) zur Lösung des resultierenden stochastischen zweistufigen Problems. Herkömmliche Optimierungstechniken stoßen bei solch komplexen, gekoppelten Systemen, besonders bei Unsicherheit, an ihre Grenzen. DRL bietet jedoch eine leistungsfähige Alternative, indem es neuronale Netze nutzt, um optimale Strategien durch Versuch und Irrtum zu approximieren. Das Team implementierte sowohl gradientenbasierte als auch gradientenfreie Trainingsalgorithmen und verglich ihre Leistung hinsichtlich Konvergenzgeschwindigkeit und Lösungsqualität. Besonders hervorzuheben ist, dass die gradientenfreie Deep-Genetic-Strategy (DGP) eine überlegene Leistung zeigte und Ergebnisse erzielte, die näher am theoretischen Optimum lagen als ihr gradientenbasiertes Gegenstück, der Deep Deterministic Policy Gradient (DDPG).

Die praktischen Implikationen dieser Arbeit sind erheblich. In einem Fünf-Knoten-Testsystem führte die Anwendung der optimierten CSF zu einer Reduzierung der durchschnittlichen gesellschaftlichen Kosten um 14,9 %, von 10.022,6 Yuan auf 8.543,2 Yuan. Noch wichtiger ist, dass die Nutzung der Windenergie dramatisch verbessert wurde, wobei die Abschaltquoten von 31,1 % auf nur 4,8 % fielen. Das bedeutet, dass nahezu die gesamte verfügbare Windenergie erfolgreich in das Netz eingespeist wurde, was Verschwendung reduziert und die Nachhaltigkeit erhöht. Auch der Verkehrsfluss wurde ausgeglichener, wodurch Engpässe auf stark frequentierten Korridoren gelöst und die Durchsatzleistung auf untergenutzten Routen erhöht wurde. Obwohl die individuellen Fahrerkosten leicht anstiegen – von 1,43 Yuan auf 1,45 Yuan pro Fahrt – war der gesamte gesellschaftliche Nutzen beträchtlich, was zeigt, dass geringfügige Kompromisse auf individueller Ebene zu erheblichen Gewinnen für die Gesellschaft führen können.

Um die Skalierbarkeit zu überprüfen, wandte das Forschungsteam ihren Ansatz auf ein realitätsnahes städtisches Szenario mit 39 Knoten und 10 Elektrofahrzeug-Ladestationen an. Das stadtweite Netz umfasste verschiedene Straßentypen – von Ringstraßen bis hin zu innerstädtischen Hauptverkehrsadern – und wurde von einem Verteilungsnetz mit acht dezentralen Generatoren und drei Windparks gespeist. Unter unsicheren OD-Nachfrage- und schwankenden Windenergieerzeugungsbedingungen erzielte die DRL-gesteuerte Preissetzungsstrategie eine Reduzierung der Gesamtsystemkosten um 2,05 %, wodurch diese von 35.158,0 Yuan auf 34.436,9 Yuan sanken. Die Verbrauchsquoten für Windenergie stiegen signifikant an Schlüsselknoten an: von 21,3 % auf 62,6 % am Knoten 15 und von 31,6 % auf 95,3 % am Knoten 33. Diese Verbesserungen gingen mit messbaren Verringerungen der Verkehrsstaus einher, insbesondere auf Hochleistungsstrecken, die zuvor nahe an der Sättigung lagen.

Ein besonders überzeugender Aspekt der Studie ist die Betonung der Leistung außerhalb der Trainingsdaten (Out-of-Sample-Performance). Reale Bedingungen entsprechen selten historischen Daten perfekt, daher muss jede Preissetzungsstrategie gegenüber unvorhergesehenen Variationen robust sein. Das Team testete ihr Modell unter geänderten Wahrscheinlichkeitsverteilungen für sowohl den Verkehr als auch die Windenergieerzeugung, wobei Szenarien simuliert wurden, in denen sich die durchschnittlichen OD-Volumina von 1.000 auf 1.100 Fahrzeuge und die Windenergieerzeugung von 10 MW auf 8 MW verschoben. Trotz dieser Änderungen behielt das System eine starke Leistung, was darauf hindeutet, dass die gelernte Strategie gut generalisiert und über die Trainingsumgebung hinaus funktioniert. Diese Widerstandsfähigkeit ist entscheidend für den Einsatz in der realen Welt, wo Wetterbedingungen und Reiseverhalten von Natur aus volatil sind.

Die Forschung verdeutlicht auch die Grenzen von Methoden ohne tiefes Verstärkendes Lernen bei großflächigen Anwendungen. Im Vergleich zu einem Fitted-Q-Iteration (FQI)-Algorithmus mit einem diskretisierten Aktionsraum schnitt der DRL-Ansatz deutlich besser ab. Während FQI zwar für einige Ladestationen konvergieren konnte, scheiterte es daran, optimale Preissetzungen im gesamten Netzwerk zu identifizieren und erreichte letztlich nur eine Kostenreduktion von 0,20 % – weniger als ein Zehntel dessen, was der DRL-Ansatz erreichte. Dieser deutliche Kontrast unterstreicht die Bedeutung kontinuierlicher Aktionsräume und hochdimensionaler Zustandsdarstellungen bei der Verwaltung komplexer, miteinander verbundener Systeme.

Aus politischer Sicht legen die Ergebnisse nahe, dass eine zentrale Koordination zwischen Energieversorgern und Verkehrsbehörden erhebliche Effizienzsteigerungen ermöglichen kann. In vielen Städten arbeiten diese Bereiche unabhängig voneinander, was zu suboptimalen Ergebnissen führt. Zum Beispiel könnte ein Versorger niedrigere Strompreise in Zeiten geringer Nachfrage anbieten, ohne zu berücksichtigen, ob Fahrer bereit oder in der Lage sind, zu diesem Zeitpunkt zu laden. Ebenso könnten Verkehrsplaner die Straßenkapazität erweitern, ohne die räumliche Verteilung der Ladeinfrastruktur zu berücksichtigen. Der vorgeschlagene Rahmen schließt diese Lücke, indem er eine gemeinsame Optimierung von Energie- und Mobilitätsressourcen ermöglicht.

Darüber hinaus unterstützt das Modell einen Wandel von einer reaktiven zu einer proaktiven Verwaltung. Anstatt darauf zu warten, dass Staus oder Netzinstabilität auftreten, können Betreiber Probleme vorhersehen und Preissignale entsprechend anpassen. Wenn beispielsweise eine Prognose eine hohe Windenergieerzeugung am Nachmittag vorhersagt, können die CSF an nahegelegenen Ladestationen gesenkt werden, um Elektrofahrzeugbesitzer zu ermutigen, während dieses Zeitfensters zu laden. Umgekehrt können die Gebühren vorübergehend erhöht werden, wenn Verkehrssensoren einen steigenden Stau in der Nähe einer beliebten Ladestation erkennen, um Fahrer zu weniger überlasteten Alternativen umzuleiten. Diese dynamische Reaktionsfähigkeit erhöht die Systemflexibilität und verbessert das Nutzererlebnis.

Die Rolle der künstlichen Intelligenz bei dieser Transformation kann nicht hoch genug eingeschätzt werden. Während frühere Versuche mit intelligentem Laden auf regelbasierte Systeme oder einfache Optimierungsroutinen angewiesen waren, ermöglicht die Integration des tiefen Lernens eine adaptive, datengestützte Entscheidungsfindung. Das neuronale Netzwerk lernt komplexe Beziehungen zwischen Variablen – zum Beispiel, wie sich eine 10 %ige Erhöhung der Windenergieerzeugung auf die optimale Preissetzung an verschiedenen Standorten auswirkt – und wendet dieses Wissen in Echtzeit an. Im Laufe aufeinanderfolgender Iterationen wird die Strategie zunehmend verfeinert und nähert sich einer nahezu optimalen Leistung, selbst in hochstochastischen Umgebungen.

Ein weiterer Vorteil des DRL-Ansatzes ist seine Fähigkeit, mit teilweiser Beobachtbarkeit umzugehen. In der Praxis verfügen Betreiber nicht über perfekte Informationen über den Ladezustand jedes Fahrzeugs, das Ziel oder die bevorzugte Route. Das Modell berücksichtigt diese Unsicherheit, indem es beobachtete Daten – wie aggregierte Verkehrsströme und Windgeschwindigkeit – als ausreichende Statistiken für Entscheidungen behandelt. Durch wiederholte Interaktion mit der Umgebung lernt der Agent, verborgene Zustände zu inferieren und entsprechend zu handeln, ähnlich wie ein menschlicher Disponent es tun würde.

Die Implikationen reichen über das Laden von Elektrofahrzeugen hinaus. Derselbe Rahmen könnte auf andere geteilte Infrastruktursysteme angewendet werden, wie beispielsweise den öffentlichen Nahverkehr, Fahrradverleihsysteme oder Mikromobilitätsdienste. Indem die Preissetzung als Steuervariable behandelt und maschinelles Lernen zur Optimierung eingesetzt wird, können Städte eine bessere Ressourcenallokation erreichen, ihre Umweltauswirkungen reduzieren und die Lebensqualität verbessern. Mit dem weiteren Wachstum der städtischen Bevölkerung werden solche Werkzeuge unerlässlich, um die Lebensfähigkeit und Nachhaltigkeit zu erhalten.

Kritisch ist, dass die Studie Prinzipien der Transparenz und Reproduzierbarkeit einhält. Alle Simulationen wurden mit Open-Source-Lösern (Mosek und Baron) in einer Python-Umgebung durchgeführt, und der DRL-Rahmen wurde mit PyTorch, einer weit verbreiteten Deep-Learning-Bibliothek, erstellt. Die Einbeziehung von Benchmark-Vergleichen – gegen sowohl Szenario-basierte stochastische Programmierung als auch nicht-tiefe RL-Methoden – stellt sicher, dass die Behauptungen über die Leistung streng begründet sind. Darüber hinaus erhöhen die Verwendung realer Netzwerktopologien und realistischer Parametern die externe Validität und machen die Ergebnisse auf tatsächliche städtische Umgebungen anwendbarer.

Ethische Überlegungen werden implizit durch den Fokus auf die Minimierung der gesellschaftlichen Kosten angesprochen. Anstatt den Gewinn für Ladestationsbetreiber zu maximieren oder die Kosten für einzelne Nutzer zu minimieren, priorisiert die Zielfunktion das kollektive Wohlergehen. Dies entspricht der öffentlichen Dienstleistungsmission von Energieversorgungsunternehmen und kommunalen Behörden und stellt sicher, dass technologische Fortschritte der breiteren Gemeinschaft dienen. Zusätzlich deuten die geringfügige Erhöhung der individuellen Kosten, die im Fünf-Knoten-System beobachtet wurde, darauf hin, dass Gerechtigkeitsaspekte gegen Effizienzgewinne abgewogen wurden, wodurch Szenarien vermieden werden, in denen nur eine Teilmenge der Nutzer die Last der Systemoptimierung trägt.

Zusammenfassend stellt die Arbeit von Lu Siyue und Kollegen einen bedeutenden Schritt vorwärts bei der Integration von Energie- und Verkehrssystemen dar. Durch die Kombination rigoroser mathematischer Modellierung mit modernsten Techniken des maschinellen Lernens haben sie eine Preissetzungsstrategie entwickelt, die sowohl technisch fundiert als auch praktisch umsetzbar ist. Die Ergebnisse zeigen klare Vorteile in Bezug auf Kostensenkung, Nutzung erneuerbarer Energien und Verkehrsmanagement. Während Städte weltweit danach streben, ihre Verkehrssektoren zu dekarbonisieren und ihre Netze zu modernisieren, bietet diese Forschung einen Fahrplan für eine intelligente, koordinierte Infrastrukturbetrieb. Mit weiterer Verfeinerung und Feldtests könnten solche Modelle bald zu Standardwerkzeugen im Werkzeugkasten des Stadtplaners werden und dazu beitragen, intelligenter, grüner und widerstandsfähiger Städte aufzubauen.

Lu Siyue, Ji Hongquan, Zhang Lu, Xu Hui, Wang Peiyi, State Grid Beijing Electric Power Company, Computer Applications and Software, DOI: 10.3969/j.issn.1000-386x.2024.09.053