Intelligentes Laden und KI steigern Netzstabilität in neuer Studie

Intelligentes Laden und KI steigern Netzstabilität in neuer Studie

Die zunehmende Verbreitung von Elektrofahrzeugen (EVs) auf globalen Märkten stellt Stromnetze vor neue Herausforderungen und Chancen. Während EVs eine sauberere Zukunft im Transportwesen versprechen, führt ihre breite Einführung zu wachsenden Komplexitäten in den Stromverteilungsnetzen. Plötzliche Spitzen in der Nachfrage nach Ladestrom, kombiniert mit der schwankenden Natur erneuerbarer Energiequellen wie Solar- und Windkraft, können lokale Netze destabilisieren und zu Spannungsschwankungen sowie erhöhten Energieverlusten führen. Die Lösung dieser Probleme ist entscheidend für den Aufbau widerstandsfähiger und nachhaltiger Energiesysteme.

Eine bahnbrechende Studie, die in Power System Protection and Control veröffentlicht wurde, bietet eine vielversprechende Lösung durch die Kombination von künstlicher Intelligenz mit strategischem Netzmanagement. Die Forschung unter der Leitung von Shidan Li und Hang Li vom Key Laboratory of Control of Power Transmission and Conversion der Shanghai Jiao Tong University stellt eine neuartige Spannungsoptimierungsstrategie vor, die auf tiefem verstärkendem Lernen, Netzwerkpartitionierung und Imitationslernen basiert, um die Stabilität und Effizienz von Verteilnetzen zu verbessern.

Die Studie erscheint zu einem entscheidenden Zeitpunkt. Regierungen weltweit drängen auf Dekarbonisierung, wobei der Verkehrs- und Energiesektor im Mittelpunkt dieses Übergangs stehen. In China, wo die Forschung durchgeführt wurde, ist das Bestreben nach neuen Energiefahrzeugen (NEVs) besonders aggressiv und wird durch nationale Politiken unterstützt, die auf die Erreichung von Kohlenstoffspitzen- und Neutralitätszielen abzielen. Da jedoch immer mehr EVs, insbesondere während der Spitzenzeiten, an das Netz angeschlossen werden, stehen Energieversorger unter wachsendem Druck, die Stromqualität und Zuverlässigkeit aufrechtzuerhalten. Traditionelle Methoden der Spannungsregelung, die stark auf Prognosen und zentralisierter Optimierung basieren, sind in dynamischen Echtzeitumgebungen oft unzureichend.

Der Ansatz des Teams überdenkt, wie verteilte Energiequellen – wie EV-Cluster, verteilte Photovoltaik (PV)-Systeme und Blindleistungskompensatoren wie statische Blindleistungsgeneratoren (SVGs) – koordiniert werden können, um die Netzspannung zu stabilisieren. Anstatt das gesamte Netz als ein monolithisches System zu behandeln, schlagen die Forscher einen dezentralen Multi-Agenten-Ansatz vor, bei dem jedes steuerbare Gerät als autonomer Entscheidungsträger agiert. Dieser Wechsel von zentralisierter zu verteilter Steuerung entspricht der sich entwickelnden Architektur moderner intelligenter Netze, in denen Edge Computing und lokale Entscheidungsfindung immer wichtiger werden.

Im Zentrum der neuen Methode steht ein fortschrittlicher maschineller Lernalgorithmus namens GS-MADDPG – kurz für Guidance Signal-based Multi-Agent Deep Deterministic Policy Gradient. Dieser Algorithmus baut auf bestehenden Techniken des tiefen verstärkenden Lernens (DRL) auf, adressiert jedoch zwei wesentliche Einschränkungen: die Zuordnung von Verdienst und die Ineffizienz der Exploration. In Multi-Agenten-Systemen ist es oft schwierig zu bestimmen, welcher Agent am meisten zu einem erfolgreichen Ergebnis beigetragen hat, ein Problem, das als Credit Assignment bekannt ist. Darüber hinaus kann zufällige Exploration in frühen Trainingsphasen zu schlechter Leistung und langsamer Konvergenz führen, was den Lernprozess ineffizient und potenziell unsicher für reale Anwendungen macht.

Um diese Herausforderungen zu bewältigen, führten die Forscher zwei wichtige Innovationen ein. Erstens wendeten sie eine Netzwerkpartitionierungsstrategie an, die das Verteilnetz in kleinere, handhabbare Zonen unterteilt. Jede Zone arbeitet halbunabhängig, sodass lokale Agenten Feedback auf der Grundlage ihrer spezifischen Auswirkungen auf die regionale Spannung und die Verluste erhalten. Diese zonale Entkopplung der Belohnungen stellt sicher, dass der Beitrag jedes Agents genauer bewertet wird, was die Fairness und Effektivität des Lernprozesses verbessert. Sie reduziert auch die Komplexität des globalen Optimierungsproblems und ermöglicht eine schnellere und stabilere Konvergenz.

Zweitens integrierte das Team Imitationslernen in die Trainingspipeline. Anstatt mit zufälligen Aktionen von Grund auf neu zu beginnen, werden die KI-Agenten zunächst von Experten-Demonstrationen geleitet, die aus konventionellen Optimierungsmethoden wie der Optimierung mit Kegelprogrammierung zweiter Ordnung abgeleitet sind. Diese Demonstrationen dienen als „Leitsignale“, die das frühe Verhalten der Agenten formen und sie zu effektiveren Strategien lenken. Dieser hybride Ansatz – die Kombination von Imitation mit verstärkendem Lernen – beschleunigt das Training, verbessert die Stichprobeneffizienz und verringert das Risiko gefährlicher oder suboptimaler Aktionen während der Lernphase.

Einer der innovativsten Aspekte der Studie ist die Modellierung von EV-Clustern als verallgemeinerte Energiespeichereinheiten (GES). Anstatt jedes Fahrzeug einzeln zu verwalten, was rechenintensiv wäre, verwendeten die Forscher die Minkowski-Summation, um die Ladekapazitäten aller EVs innerhalb einer bestimmten Ladestation zu aggregieren. Diese mathematische Technik ermöglicht es dem System, die kollektive Flexibilität von Hunderten von Fahrzeugen als eine einzige, steuerbare Ressource darzustellen. Das resultierende GES-Modell erfasst die aggregierten Ladegrenzen, Ladezustandsbeschränkungen (SOC) und Nutzerbewegungsmuster, was es dem System ermöglicht, Ladepläne zu optimieren und gleichzeitig die individuellen Bedürfnisse der Nutzer zu berücksichtigen.

Das Modell geht davon aus, dass EV-Besitzer beim Anschließen Informationen über ihre Ankunfts- und Abfahrtszeiten, den anfänglichen SOC und den gewünschten endgültigen SOC bereitstellen. Diese Daten, die üblicherweise von modernen Ladeprogrammen gesammelt werden, ermöglichen es dem System, machbare Ladetrajektorien für jedes Fahrzeug zu berechnen. Durch die Aggregation dieser Trajektorien kann die Ladestation ihre gesamte verfügbare Kapazität dem Netz als flexible Last oder sogar als virtuelle Batterie anbieten, die in der Lage ist, überschüssige erneuerbare Erzeugung aufzunehmen oder während der Spitzennachfrage Strom einzuspeisen.

Die Integration von verteilten PV-Systemen verbessert die Fähigkeiten des Systems weiter. Im Gegensatz zu konventionellen Generatoren können moderne PV-Wechselrichter Blindleistungsunterstützung bieten, ohne ihre Wirkleistungsabgabe zu reduzieren. Das bedeutet, dass sie durch Anpassen ihres Leistungsfaktors zur Regulierung der Spannungsniveaus beitragen können und als dynamische VAR-Quellen fungieren. In Kombination mit SVGs und EV-basierten Speichern bilden diese Geräte ein leistungsstarkes Werkzeug für die Echtzeit-Spannungsregelung.

Die Forscher testeten ihren Ansatz an einem modifizierten IEEE-33-Knoten-Verteilnetz, einem Standardbenchmark in der Netzwerkforschung. Das Testsystem umfasste zwei EV-Ladestationen, drei PV-Anlagen und zwei SVGs, was einer realistischen städtischen oder vorstädtischen Netzkonfiguration entspricht. Unter Verwendung von Monte-Carlo-Simulationen generierten sie diverse Betriebsszenarien, die die Unsicherheit der Solarerzeugung und der Lastnachfrage einfingen und so die Robustheit ihrer Lösung sicherstellten.

Das Training des GS-MADDPG-Algorithmus umfasste eine zentralisierte Lernphase, in der alle Agenten gemeinsam unter Verwendung historischer Netzdaten trainiert wurden, die in einem Wiedergabepuffer gespeichert waren. Nach dem Training wurden die Steuerungsrichtlinien dezentral eingesetzt, wobei jeder Agent Entscheidungen lokal auf der Grundlage seiner eigenen Beobachtungen traf. Dieses Paradigma des „zentralisierten Trainings mit dezentraler Ausführung“ (CTDE) eignet sich besonders gut für den realen Einsatz, da es den Kommunikationsaufwand reduziert und die Systemresilienz erhöht.

Die Ergebnisse waren überzeugend. Im Vergleich zu traditionellen DRL-Methoden erreichte der vorgeschlagene GS-MADDPG-Algorithmus eine schnellere Konvergenz, höhere Stichprobeneffizienz und eine überlegene Spannungsregelung. In der Simulation reduzierte das System Spannungsverletzungen in allen Testszenarien auf null und hielt alle Knotenspannungen innerhalb des sicheren Bereichs von 0,95 bis 1,05 pro Einheit. Die Netzverluste wurden ebenfalls erheblich reduziert und übertrafen sowohl konventionelles DRL als auch einen zentralisierten Optimierungsansatz am Vortag, der auf perfekten Prognosen basierte.

Vielleicht am beeindruckendsten zeigte der Algorithmus eine starke Robustheit unter extremen Bedingungen. Beim Test unter einem 110%-Lastszenario – das unerwartete Nachfragespitzen oder Prognosefehler simuliert – hielt der GS-MADDPG-Controller stabile Spannungsniveaus aufrecht, während die zentralisierte Methode Verletzungen nicht verhindern konnte. Dies unterstreicht einen entscheidenden Vorteil datengesteuerter, adaptiver Steuerung: die Fähigkeit, effektiv auf unvorhergesehene Ereignisse zu reagieren, ohne auf präzise Vorhersagen angewiesen zu sein.

Aus praktischer Sicht sind die Implikationen dieser Forschung bedeutsam. Energieversorger und Netzbetreiber können solche KI-gesteuerten Systeme nutzen, um steigende Niveaus verteilter Energiequellen zu verwalten, ohne in kostspielige Infrastrukturupgrades investieren zu müssen. Durch die Nutzung der inhärenten Flexibilität des EV-Ladens und der wechselrichterbasierten Erzeugung können sie Kapitalausgaben für neue Transformatoren, Kondensatoren oder Übertragungsleitungen verschieben oder sogar vermeiden.

Darüber hinaus unterstützt der Ansatz die breitere Vision der Vehicle-to-Grid (V2G)-Integration, bei der EVs nicht nur Stromverbraucher, sondern aktive Teilnehmer an Netzdienstleistungen sind. Da die Batteriepreise weiter fallen und bidirektionales Laden immer häufiger wird, wird das Potenzial von EVs, Nebenleistungen wie Frequenzregelung, Lastspitzenglättung und Spannungsunterstützung zu bieten, nur noch wachsen. Diese Studie bietet einen skalierbaren und intelligenten Rahmen, um dieses Potenzial zu erschließen.

Der Erfolg des GS-MADDPG-Algorithmus unterstreicht auch die Bedeutung interdisziplinärer Zusammenarbeit in der modern Energieforschung. Die Arbeit befindet sich an der Schnittstelle von Energiesystemtechnik, maschinellem Lernen und Operations Research und zieht Techniken aus jedem Bereich heran, um eine effektivere Lösung zu schaffen. Sie spiegelt einen wachsenden Trend in der Industrie wider: die Verschmelzung von Domain-Expertise mit modernster KI, um komplexe, reale Probleme zu lösen.

Für Automobilhersteller und Ladendienstleister bieten die Erkenntnisse wertvolle Einblicke. Bei der Gestaltung der nächsten Generation von EVs und Ladeinfrastrukturen wird die Einbeziehung intelligenter Ladekapazitäten, die netzfreundliches Verhalten unterstützen, immer wichtiger. Fahrzeuge mit fortschrittlichen Kommunikations- und Steuerungssystemen könnten automatisch auf Netzsiganle reagieren und ihre Laderate anpassen, um zur Stabilität beizutragen. Dies kommt nicht nur dem Netz zugute, sondern eröffnet Fahrzeugbesitzern auch neue Einnahmequellen durch Demand-Response-Programme.

Auch Regulierungsbehörden und politische Entscheidungsträger sollten Notiz nehmen. Die Studie zeigt, dass bei den richtigen technologischen Werkzeugen eine hohe EV-Durchdringung nicht auf Kosten der Netzzuverlässigkeit gehen muss. Die Verwirklichung dieser Vision erfordert jedoch unterstützende Politiken wie standardisierte Kommunikationsprotokolle, faire Vergütung für Netzdienstleistungen und Anreize für die Einführung intelligenter Ladelösungen. Regulatorische Rahmen müssen sich weiterentwickeln, um diese neuen Paradigmen zu berücksichtigen.

In Zukunft plant das Forschungsteam, seine Arbeit auf größere, komplexere Verteilnetze auszudehnen und die Integration zusätzlicher Energiespeichertechnologien zu untersuchen. Sie erforschen auch, wie die gleichen Prinzipien auf Microgrids und industrielle Energiesysteme angewendet werden könnten, wo Spannungsstabilität ebenso kritisch ist.

Zusammenfassend repräsentiert die Studie von Shidan Li, Hang Li und ihren Kollegen einen bedeutenden Schritt vorwärts in der Suche nach intelligenteren, widerstandsfähigeren Stromnetzen. Durch die Kombination von Netzwerkpartitionierung, Imitationslernen und Multi-Agenten-verstärkendem Lernen haben sie ein leistungsstarkes Werkzeug entwickelt, um die wachsende Komplexität moderner Verteilungssysteme zu bewältigen. Da die Welt sich in eine Zukunft bewegt, die von elektrischer Mobilität und erneuerbaren Energien dominiert wird, werden solche Innovationen entscheidend für einen reibungslosen und nachhaltigen Übergang sein.

Shidan Li, Hang Li, Guojie Li, Bei Han, Jin Xu, Ling Li, Hongtao Wang, Key Laboratory of Control of Power Transmission and Conversion, Ministry of Education (Shanghai Jiao Tong University), Shanghai PeiKe Technology Co., Ltd., Jiaxing Power Supply Company, State Grid Zhejiang Electric Power Co., Ltd., Power System Protection and Control, DOI: 10.19783/j.cnki.pspc.240117