Intelligente Netzkontrolle nutzt E-Autos zur Stabilisierung erneuerbarer Energien

Intelligente Netzkontrolle nutzt E-Autos zur Stabilisierung erneuerbarer Energien

Die globale Energiewende vollzieht sich nicht nur in den Kraftwerken, sondern zunehmend auch in unseren Garagen. Elektrofahrzeuge (E-Autos), einst ausschließlich als Stromverbraucher betrachtet, entwickeln sich zu entscheidenden Akteuren im intelligenten Stromnetz der Zukunft. Ihre Batterien können nicht nur geladen werden, sondern auch als mobile Energiespeicher dienen, die bei Bedarf Strom ins Netz zurückspeisen – ein Konzept, das als Vehicle-to-Grid (V2G) bekannt ist. Dieses Potenzial verspricht eine tiefgreifende Transformation der Energieversorgung, indem es hilft, die Schwankungen erneuerbarer Energien wie Wind und Sonne auszugleichen. Doch diese neue Rolle bringt immense Herausforderungen mit sich. Die Verfügbarkeit von E-Autos für das Netz ist hochgradig unvorhersehbar, abhängig von den Fahr- und Ladeentscheidungen ihrer Besitzer. Gleichzeitig müssen Netzbetreiber die Frequenz und Spannung des Stromnetzes mit höchster Präzision stabil halten, um Blackouts zu verhindern. Die traditionellen Methoden der Netzregelung stoßen hier an ihre Grenzen.

Ein bahnbrechendes Forschungsprojekt der Wuhan University in China liefert nun eine wegweisende Lösung für dieses komplexe Problem. Die Wissenschaftler Peixiao Fan, Jun Yang, Yuxin Wen, Song Ke und Lilong Xie haben eine neuartige, intelligente Kontrollstrategie entwickelt, die die Vorhersagekraft modernster KI-Technologien mit der Zuverlässigkeit etablierter Regelungssysteme verbindet. Ihr Ziel ist es, ein robustes, anpassungsfähiges und sicheres Kontrollsystem zu schaffen, das die volle Leistungsfähigkeit von E-Autos als Netzstütze ausschöpfen kann, ohne dabei die Stabilität des gesamten Stromnetzes zu gefährden. Ihre Arbeit, veröffentlicht in der angesehenen Fachzeitschrift Transactions of China Electrotechnical Society, stellt einen signifikanten Fortschritt im Bereich der intelligenten Netzkontrolle dar.

Die zentrale Schwierigkeit, mit der Netzbetreiber konfrontiert sind, ist die „starke Unsicherheit“ des gesamten Systems. Diese Unsicherheit entsteht aus mehreren Quellen. Erstens die erneuerbaren Energien selbst: Die Leistung einer Windanlage oder einer Photovoltaik-Anlage schwankt ständig und ist von Wetter und Tageszeit abhängig. Zweitens die Last im Netz: Der Stromverbrauch von Haushalten und Industrie unterliegt ebenfalls zufälligen Schwankungen. Und drittens, und das ist der neuartige Aspekt, die E-Autos. Die Forschergruppe um Fan und Yang hebt hervor, dass der Beitrag von E-Autos zur Netzstabilität nicht konstant ist. Die Menge an Strom, die eine Ladestation von ihren angeschlossenen Fahrzeugen für die Frequenzregelung abrufen kann, ist eine sich ständig verändernde Größe. Diese Obergrenze hängt von der Anzahl der angeschlossenen Fahrzeuge, deren aktuellem Ladezustand (State of Charge, SOC) und, am wichtigsten, von den individuellen Fahrplänen der Besitzer ab. Ein Fahrer, der sein Auto am Abend nach der Arbeit ansteckt und um 7 Uhr morgens wieder losfährt, bietet eine lange Zeitspanne für Netzinteraktionen. Ein anderer, der sein Fahrzeug nur für eine kurze Mittagspause auflädt, ist kaum als Stützressource nutzbar. Diese Dynamik macht die Planung für das Netz extrem schwierig. Herkömmliche Kontrollsysteme, die mit festen Parametern arbeiten, sind nicht in der Lage, solche plötzlichen Änderungen in der verfügbaren Kapazität zu berücksichtigen. Wenn sich beispielsweise zur Hauptverkehrszeit viele Fahrzeuge von den Ladestationen entfernen, bricht die verfügbare Leistung für die Frequenzregelung dramatisch ein. Ein traditioneller Regler, der nicht in der Lage ist, diese Veränderung zu erkennen und darauf zu reagieren, kann das Netz nicht mehr stabil halten.

Ein weiterer, bisher oft vernachlässigter Aspekt, den die Wuhan-Universität-Gruppe in ihre Modellierung einbezieht, ist die Kopplung zwischen Frequenz- und Spannungsregelung. In einem Stromnetz sind diese beiden Systeme nicht unabhängig voneinander. Die Forscher zeigen, dass das automatische Spannungsregelungssystem (Automatic Voltage Regulation, AVR), das den Ausgangsstrom der Generatoren anpasst, um die Spannung stabil zu halten, indirekt auch Störungen in der aktiven Leistung verursacht. Wenn das AVR-System eingreift, um die Spannung zu korrigieren, verändert es die Erregung des Generators, was wiederum die aktive Leistung beeinflusst und somit die Frequenz des Netzes beeinträchtigt. Dies bedeutet, dass ein Frequenzregler nicht nur auf Laständerungen reagieren muss, sondern auch die ungewollten Nebenwirkungen des Spannungsreglers ausgleichen muss. Die meisten bestehenden Modelle haben diese komplexe Wechselwirkung ignoriert, was zu einer unvollständigen und weniger realitätsnahen Darstellung des Netzes führt.

Um diese multifazetierten Herausforderungen zu meistern, haben die Forscher eine innovative, zweischichtige Kontrollarchitektur entwickelt. Diese Architektur kombiniert zwei mächtige Technologien: das Modellprädiktive Regelung (Model Predictive Control, MPC) und das tiefe Verstärkungslernen (Deep Reinforcement Learning, DRL), speziell den Multi-Agent Deep Deterministic Policy Gradient (MA-DDPG) Algorithmus. Dieses hybride Design ist ingenieurtechnisch brillant, da es die Stärken beider Ansätze optimal nutzt.

Die untere Schicht des Systems ist der MPC-Regler. MPC ist eine fortschrittliche Regelungsstrategie, die auf der Vorhersage des zukünftigen Verhaltens des Systems basiert. Anstatt nur auf den aktuellen Zustand zu reagieren, berechnet der MPC-Regler die optimalen Steuerbefehle für einen definierten Zeitraum in die Zukunft. Er löst dabei bei jedem Zeitschritt ein Optimierungsproblem, das es ihm ermöglicht, proaktiv mit Beschränkungen umzugehen – wie etwa der maximalen Leistungsanstiegsrate eines Mikroturbinengenerators oder der momentan verfügbaren Lade-/Entladeleistung einer E-Auto-Flotte. Durch die Umwandlung des Regelproblems in eine Optimierungsaufgabe ist MPC von Natur aus gut geeignet, um die komplexen Nebenbedingungen eines modernen Mikronetzes zu handhaben. Der entscheidende Nachteil eines klassischen MPC-Reglers ist jedoch seine Unflexibilität: Die Gewichtungsmatrizen, die bestimmen, wie stark der Regler auf Frequenzabweichungen reagiert im Vergleich zu den Kosten der Regelung (z. B. Verschleiß an Generatoren), sind in der Regel fest vorgegeben. Wenn sich die Betriebsbedingungen ändern – etwa durch eine plötzliche Abnahme der verfügbaren E-Auto-Kapazität –, sind diese festen Parameter möglicherweise nicht mehr optimal, was zu einer deutlichen Verschlechterung der Regelqualität führt.

Hier kommt die obere Schicht ins Spiel: der MA-DDPG-Agent. DRL, und DDPG im Speziellen, ist eine Form des maschinellen Lernens, bei der ein „Agent“ durch Versuch und Irrtum lernt, optimales Verhalten zu erlernen, gesteuert durch eine Belohnungsfunktion. Der Agent erhält Informationen über den aktuellen Zustand des Systems (z. B. Frequenzabweichungen in allen Mikronetzen, Spannungspegel, verfügbare E-Auto-Leistung) und führt eine „Aktion“ aus. Wenn diese Aktion zu einem besseren Ergebnis führt (einer stabileren Frequenz), erhält der Agent eine positive Belohnung und lernt, diese Aktion in ähnlichen Situationen zu wiederholen. Der „Multi-Agent“-Aspekt ist für ein System aus mehreren Mikronetzen entscheidend. Anstatt einen zentralen Kontroller zu haben, gibt es mehrere Agenten, einen für jedes Untermikronetz, die Informationen austauschen und miteinander kooperieren können. Dieses „zentralisierte Training, dezentrale Ausführung“-Konzept ermöglicht eine Form der dezentralen Koordination, die für die Resilienz eines Netzwerks unerlässlich ist.

In der vorgeschlagenen Strategie ist die Aktion des MA-DDPG-Agents nicht die direkte Steuerung der Generatoren oder E-Autos. Stattdessen besteht seine Aktion darin, die Gewichtungsparameter des untergeordneten MPC-Reglers dynamisch anzupassen. Der Agent überwacht kontinuierlich den Echtzeit-Zustand des gesamten Mikronetzsystems. Erkennt er, dass die verfügbare Leistung der E-Auto-Flotte zurückgeht, kann er das Gewicht für die E-Auto-Leistung in der Kostenfunktion des MPC erhöhen, was dem MPC signalisiert, sich stärker auf andere Ressourcen wie Mikroturbinen zu verlassen. Wenn das AVR-System starke Störungen verursacht, kann der Agent die Parameter anpassen, um den MPC aggressiver bei der Gegensteuerung dieser Störungen zu machen. Auf diese Weise entsteht ein „evolvierender“ oder „anpassungsfähiger“ MPC-Regler. Der MPC liefert das robuste, beschränkungshandelnde Fundament, während der DRL-Agent als „Abstimmer“ fungiert, der die Strategie des MPC kontinuierlich an die sich ständig verändernden Bedingungen im Netz anpasst.

Die Forscher führten umfangreiche Simulationen durch, um ihre Strategie zu validieren. Sie erstellten ein Modell eines Mikronetzsystems mit drei miteinander verbundenen Untermikronetzen, die jeweils mit Mikroturbinen, Windkraft und E-Auto-Ladestationen ausgestattet waren. Das System wurde verschiedenen anspruchsvollen Szenarien ausgesetzt. In einem Szenario wurde das System starken, zufälligen Störungen durch Wind und Last ausgesetzt, um einen typischen, realen Tag zu simulieren. In einem anderen Szenario fiel ein kritischer Mikroturbine-Generator in einem Untermikronetz komplett aus – ein schwerwiegender Ausfall, der die Resilienz des Systems auf die Probe stellte. Die Ergebnisse waren überzeugend. Im Vergleich zu traditionellen PID- und Fuzzy-Reglern sowie einem Standard-MPC-Regler zeigte die vorgeschlagene LBMPC-Strategie eine deutlich überlegene Leistung. Sie erreichte eine signifikant niedrigere durchschnittliche und maximale Frequenzabweichung, eine schnellere Wiederherstellungszeit (unter einer Sekunde) und eine viel höhere „Exzellenzrate“, was bedeutet, dass die Frequenz über einen weitaus größeren Teil der Zeit innerhalb eines engen, akzeptablen Bandes blieb.

Der wahre Beweis für die Intelligenz des Systems kam in einem Szenario, das den täglichen Rhythmus der E-Auto-Nutzung nachbildete. Die Forscher simulierten eine Störung um 17:00 Uhr, wenn die meisten Fahrzeuge unterwegs sind und nicht für das Netz zur Verfügung stehen, im Vergleich zu einer ähnlichen Störung um 00:00 Uhr, wenn die meisten Fahrzeuge angeschlossen und aufladen. Traditionelle Regler mit festen Parametern schnitten um 17:00 Uhr schlecht ab, weil sie nicht auf die drastisch reduzierte E-Auto-Kapazität reagieren konnten. Ihre Fähigkeit zur Frequenzregelung brach zusammen. Im Gegensatz dazu passte der LBMPC-Regler seine MPC-Parameter dynamisch an. Er erkannte die veränderten Bedingungen und verlagerte die Last der Frequenzregelung auf andere verfügbare Ressourcen, wodurch eine hervorragende Regelqualität aufrechterhalten wurde. Dies demonstrierte die Fähigkeit des Reglers, sich an vorhersehbare, periodische Änderungen im System anzupassen – eine Fähigkeit, die für den realen Einsatz unerlässlich ist.

Ein besonders innovativer und sicherheitskritischer Aspekt des Designs ist seine inhärente Fehlertoleranz. Die Autoren erkennen ein grundlegendes Risiko reiner DRL-basierter Regler an: das „Black-Box“-Problem. Wenn ein DRL-Agent auf eine Situation stößt, die radikal anders ist als alles, was er während des Trainings gesehen hat, kann er katastrophal versagen und unsinnige oder gefährliche Steuersignale ausgeben. Für ein Stromnetz, bei dem Stabilität oberste Priorität hat, ist dies ein inakzeptables Risiko. Die zweischichtige Struktur löst dieses Problem elegant. Wenn der obere MA-DDPG-Agent ausfällt oder keine gültige Ausgabe erzeugen kann, schaltet der untere MPC-Regler nicht ab. Stattdessen kehrt er nahtlos zu einem Satz vorab eingestellter, konservativer Parameter zurück. Obwohl dieser „Sicherheitsmodus“ möglicherweise nicht optimal ist, garantiert er die Stabilität des Systems. Dies stellt sicher, dass ein Ausfall der KI-Komponente nicht zum Ausfall des gesamten Kontrollsystems führt – eine entscheidende Eigenschaft für jede sicherheitskritische Infrastruktur.

Die Implikationen dieser Forschung sind weitreichend. Sie liefert einen Bauplan für die nächste Generation intelligenter Netzkontroller, die nicht nur automatisiert, sondern auch wirklich intelligent sind. Durch die Schaffung eines Systems, das lernen, sich anpassen und selbst optimieren kann, haben die Forscher einen bedeutenden Schritt hin zu einem praktikablen Stromnetz mit hohem Anteil erneuerbarer Energien gemacht. Die erfolgreiche Integration von E-Autos als flexible Netzressource ist der Schlüssel zu dieser Zukunft. Diese Kontrollstrategie verwandelt ein potenzielles Quelle der Instabilität in ein mächtiges Werkzeug für Resilienz. Sie ermöglicht es, dass die Fahrzeuge, die die Elektrifizierung des Verkehrs vorantreiben, auch eine zentrale Rolle bei der Stabilisierung des Netzes spielen, das sie speist. Die Arbeit von Fan, Yang, Wen, Ke und Xie stellt einen bedeutenden Sprung vorwärts im Bereich der Netzkontrolle dar und bietet eine robuste, adaptive und sichere Lösung für die komplexen Energiesysteme von morgen.

Peixiao Fan, Jun Yang, Yuxin Wen, Song Ke, Lilong Xie, School of Electrical and Automation, Wuhan University. Transactions of China Electrotechnical Society. DOI:10.19595/j.cnki.1000-6753.tces.222138

Schreibe einen Kommentar 0

Your email address will not be published. Required fields are marked *