Evolutionär-PID: E-Autos als Schlüsselakteure für Frequenzstabilität in Inselnetzen

Evolutionär-PID: E-Autos als Schlüsselakteure für Frequenzstabilität in Inselnetzen

In einer abgeschiedenen Leitwarte am Rande eines testweisen Inselnetzes fegt eine plötzliche Böe über eine Gruppe von Windturbinen. Innerhalb von Millisekunden sackt die Frequenz ab – knapp unter 59,97 Hz. Doch anstatt von eskalierenden Alarmen oder manuellen Notfallmaßnahmen korrigiert sich das System selbst. Eine Flotte von Elektrofahrzeugen, die nahegelegen an intelligenten Ladestationen angeschlossen ist, moduliert sekundenschnell ihren Leistungsaustausch – nicht als passive Verbraucher, sondern als agile, responsive Netzakteure. Innerhalb weniger Sekunden ist die Stabilität wiederhergestellt. Kein menschliches Eingreifen. Kein Blackout. Einfach nahtlose, intelligente Orchestrierung.

Dies ist keine Szene aus einer futuristischen Tech-Demo. Es ist das Resultat einer neu validierten Regelungsstrategie – eine, die neu definieren könnte, wie die dezentralen Netze von morgen angesichts von Volatilität im Gleichgewicht bleiben. Im Kern liegt eine elegante Fusion: die robuste Zuverlässigkeit klassischer PID-Regler, aufgerüstet mit der adaptiven Intelligenz von Deep Reinforcement Learning. Getauft auf den Namen Evolutionär-PID, verwirft dieser Ansatz nicht jahrzehntelange Ingenieursweisheit – er entwickelt sie weiter.

Für Automobil- und Energie-Insider ist diese Entwicklung von erheblicher Bedeutung. Während die globale Elektrofahrzeug-Verbreitung rasant zunimmt – Prognosen zufolge werden bis 2030 über 150 Millionen Einheiten auf den Straßen unterwegs sein –, repräsentiert ihre kollektive Batteriekapazität einen beispiellosen mobilen Energiespeicher. Bis vor kurzem jedoch behandelten die meisten Strategien zur EV-Netz-Integration diese Fahrzeuge entweder als statische Ladegeräte oder als grobe Backup-Batterien. Die eigentliche Chance, E-Fahrzeuge als dynamische Frequenzregler in Echtzeit einzusetzen, scheiterte an einem hartnäckigen Problem: Unvorhersehbarkeit.

Man stelle sich vor: Ein Pendler steckt sein E-Auto um 18:15 Uhr an, erschöpft nach einem langen Tag, mit nur noch 28 % Ladestand (State of Charge, SOC). Es muss bis 7 Uhr morgens wieder vollständig geladen sein. Ein anderer Fahrer kommt um 18:45 Uhr an, bereits bei 85 % SOC, und möchte vor einer Wochenendreise nur noch etwas nachladen. Ein Fahrzeug kann ins Netz einspeisen; das andere darf nicht. Nun skaliere man dies auf Hunderte – oder Tausende – von Fahrzeugen auf einem Campus, in einem Gewerbepark oder einer Inselgemeinschaft. Füge man Solarschwankungen, Windböen und plötzliche Lastspitzen hinzu. Man verwaltet kein Stromsystem mehr – man dirigiert ein Sinfonieorchester, bei dem die Hälfte der Musiker mitten im Stück die Instrumente wechselt.

Herkömmliche Regelsysteme versagen bei solchem Chaos. Klassische PID-Regler – Proportional, Integral, Derivativ – funktionieren in stabilen, linearen Umgebungen hervorragend. Stimmt man die Kp-, Ki– und Kd-Parameter einmal ab, halten sie einen Dieselgenerator jahrelang stabil am Laufen. Doch bei starker Nichtlinearität – wie sie durch die Dynamik einer E-Fahrzeug-Flotte entsteht, bei der die insgesamt verfügbare steuerbare Kapazität während abendlicher Pendelspitzen innerhalb von zwei Stunden um 60 % schwanken kann – geraten Festparameter-PIDs schnell an ihre Grenzen. Reaktionsverzögerungen treten auf. Überschwinger schleichen sich ein. Frequenzabweichungen überschreiten Sicherheitsgrenzwerte.

Ingenieure haben versucht, dies mit Fuzzy Logic, modellprädiktiver Regelung oder hybriden regelbasierten Systemen zu flicken. Einige zeigen in Simulationen vielversprechende Ergebnisse. Doch wenn reale Unvorhersehbkeiten eintreten – wie ein Sturm, der die Hälfte der Turbinen lahmlegt, während gleichzeitig nach Fabrikschichtende E-Fahrzeuge eine Ladestation überfluten – versagen diese Regler. Sie sind entweder zu starr, um sich anzupassen, oder zu undurchsichtig, um ihnen zu vertrauen.

An dieser Stelle kommt der Evolutionär-PID-Regler ins Spiel. Entwickelt von einem Team unter der Leitung von Jun Yang von der Schule für Elektrotechnik und Automatisierung der Wuhan-Universität, handelt es sich nicht nur um eine weitere KI-Überlagerung. Es ist eine kooperative Architektur – eine, die die Physik von Energiesystemen respektiert und gleichzeitig die Lernfähigkeit moderner Algorithmen nutzt.

So funktioniert es in der Praxis: Im Kern bleibt eine konventionelle PID-Regelschleife für die Echtzeit-Frequenzkorrektur verantwortlich. Doch anstelle fester Parameter werden die Kp-, Ki– und Kd-Werte kontinuierlich angepasst – nicht von einem Ingenieur mit einem Einstellknopf, sondern von einem Deep Deterministic Policy Gradient (DDPG)-Agenten. DDPG gehört zur Familie der Deep Reinforcement Learning (DRL)-Methoden. Im Gegensatz zu Black-Box-Neuronalen Netzen, die direkt Steuersignale ausgeben – was bei Netzbetreibern, die „nicht nachvollziehbare“ Entscheidungen misstrauisch betrachten, für Stirnrunzeln sorgt – spielt dieser DDPG-Agent eine unterstützende Rolle. Er beobachtet. Er lernt. Er schlägt bessere PID-Parameter vor – basierend auf dem, was im Hier und Jetzt im Mikronetz tatsächlich passiert.

Der Zustandsraum, den er überwacht, ist bewusst transparent: der aktuelle Frequenzfehler (∆f) plus die Echtzeit-Ober- und Untergrenzen der verfügbaren E-Fahrzeug-Leistung – Einschränkungen, die dynamisch aus dem Ladestand (SOC) jedes angeschlossenen Fahrzeugs, seiner Ankunftszeit, seiner geplanten Abfahrtszeit und den benutzerdefinierten Mindestladeanforderungen (z.B. „Ich brauche morgens mindestens 70 %“) berechnet werden. Keine versteckten Schichten. Keine nicht überprüfbaren Abstraktionen. Nur messbare Netzvariablen und physikalische Batteriegrenzen.

Seine Belohnungsfunktion spiegelt entscheidend die Prioritäten menschlicher Operatoren wider. Geringe Frequenzabweichungen (unter 0,03 Hz) erhalten neutrale oder positive Verstärkung – dies ist die „Totbandzone“, in der keine Aktion erforderlich ist und Überkorrektur verschwenderisch wäre. Doch wenn die Abweichung wächst – in die Zone der „normalen Regelung“ bei 0,10 Hz, dann 0,15 Hz „Hilfsregelung“, dann 0,20 Hz „Notfall“ – eskaliert die Strafe rapide. Der Agent lernt schnell: Innerhalb von 0,03 Hz zu bleiben ist nicht nur ideal – es ist zwingend erforderlich.

Und der Lohn? Die Zahlen sprechen eine deutliche Sprache.

In simulierten Stresstests, die auf einem MATLAB/Simulink-Inselnetzmodell durchgeführt wurden – bestehend aus einer Mikroturbine, stochastischen Windeinträgen und einer dynamischen E-Fahrzeug-Ladestation – übertraf der Evolutionär-PID den Standard-PID in jedem Szenario.

Während einer frühmorgendlichen Windstörung (4:00 Uhr, wenn die E-Fahrzeug-Flotte größtenteils geparkt und fast vollständig geladen ist), ließ der konventionelle PID-Regler die Frequenz auf 0,0485 Hz schwanken – technisch innerhalb einiger Betriebsgrenzen, aber an der Schwelle zum unerwünschten Bereich. Die Erholungszeit zog sich über 22 Sekunden hin. Der Evolutionär-PID hingegen hielt die Abweichung bei 0,0282 Hz und war innerhalb von 9 Sekunden vollständig stabil. Auffälliger war, dass er eine 100 %ige Excellent-Rate-Leistung erreichte – definiert als der Anteil der Zeit, in der die Frequenz innerhalb von ±0,03 Hz blieb – im Vergleich zu weniger als 95 % für die Basislinie.

Die eigentliche Bewährungsprobe kam jedoch zur Mittagszeit.

Um 12:00 Uhr sind die meisten E-Fahrzeuge zur Arbeit oder für Besorgungen unterwegs. Die steuerbare Kapazität der Ladestation bricht ein – im Modell um über 70 %. Eine ähnliche Windstörung trifft nun auf ein viel schwächeres System. Hier kämpfte der klassische PID-Regler sichtbar. Die Frequenz schoss auf 0,0689 Hz hoch, durchbrach damit die empfohlenen Grenzwerte für Inselnetze. Die Excellent-Rate fiel auf unter 75 %. Betreiber wären gezwungen gewesen, Last abzuwerfen oder die Mikroturbine aggressiv hochzuregeln – was zusätzlichen Treibstoff verbraucht, Emissionen erhöht und den mechanischen Verschleiß beschleunigt.

Der Evolutionär-PID-Regler zuckte jedoch kaum. Immer noch bei 100 % Excellent-Rate, maximale Abweichung bei nur 0,0288 Hz – nahezu identisch mit seiner Leistung vor Mittag. Wie? Weil der DDPG-Agent, der über Tausende von simulierten Tag-Nacht-Zyklen trainiert wurde, wusste, dass mittags die EV-Verfügbarkeit niedrig ist. Er erhöhte präemptiv den Integralanteil, um die Regelung bei niedrigen Frequenzen zu verstärken, während er die Differentialkomponente sorgfältig begrenzte, um eine Rauschverstärkung während des Turbinenhochfahrens zu vermeiden. Er reagierte nicht – er antizipierte.

Diese adaptive Feinabstimmung geschieht in zwei Zeitskalen. Auf der kurzen Skala (Sub-Sekundenbereich) werden die Parameter angepasst, um plötzliche Windflauten oder Lastsprünge zu bekämpfen. Auf der langen Skala (stündlich) führt er „Phasenanpassungen“ durch – rekonfiguriert das gesamte PID-Profil, um es dem tageszeitlichen Rhythmus der E-Fahrzeug-Verfügbarkeit anzupassen: hohe Kapazität über Nacht, spärlich mittags, abendlicher Ansturm.

Kritisch ist, dass dies keine vorprogrammierte Zeitplanung ist. Der Regler lernt die Muster. In Simulationen passte er sich gleichermaßen gut an Werktage vs. Wochenenden, Feiertagsanomalien und sogar simulierte EV-Batterieverschleiß (der die SOC-Dynamik subtil verschiebt) an. Das ist der „evolutionäre“ Teil – nicht im biologischen Sinne genetischer Algorithmen, sondern kontinuierliche Leistungsverbesserung durch Erfahrung.

Für die Automobilindustrie ergeben sich weitreichende Implikationen.

Erstens: V2G (Vehicle-to-Grid) wandelt sich von einer Nischenpilotierung zu einer Kernnetzdienstleistung. Automobilhersteller können den Besitz von E-Fahrzeugen nun glaubwürdig nicht nur als Verkehrselektrifizierung, sondern als aktive Teilhabe an der Energieresilienz vermarkten. Man stelle sich eine Zukunft vor, in der das Bordsystem eines E-Fahrzeugs „Netzguthaben“ nicht nur für das Laden in Schwachlastzeiten verdient, sondern für Präzisions-Frequenzunterstützung – eine Dienstleistung mit höherem Wert und besserer Vergütung.

Zweitens: Anbieter von Ladeinfrastruktur erschließen sich eine neue Einnahmequelle. Intelligente Ladestationen, die mit Evolutionär-PID-fähigen Reglern ausgestattet sind, werden zu Mini-Netzstabilisierungszentren. Ein Universitätscampus, ein Logistikdepot oder ein abgelegenes Resort könnte „netzfertiges E-Fahrzeug-Parken“ anbieten – wo jedes angeschlossene Fahrzeug zur Systemrobustheit beiträgt und die Abhängigkeit von teuren rotierenden Reservekraftwerken oder Diesel-Backups verringert.

Drittens: Regulierungsbehörden und Übertragungsnetzbetreiber erhalten ein vertrauenswürdigeres KI-Werkzeug. Da der Evolutionär-PID den PID-Regler als finalen Aktor beibehält – interpretierbar, überprüfbar, normenkonform – umgeht er die „Black-Box“-Skepsis, die die DRL-Einführung in sicherheitskritischen Energieanwendungen verlangsamt hat. Der DDPG-Agent ist funktional ein fortgeschrittener Auto-Tuner. Netzcodices erlauben bereits adaptive Parameteradaption; dies macht es einfach schlauer.

Natürlich steht die Implementierung in der realen Welt vor Hürden. Die Cybersicherheit muss verstärkt werden – nicht nur auf der Controllerebene, sondern über die gesamte Fahrzeug-Ladestation-Cloud-Kommunikationskette hinweg. Interoperabilitätsstandards (wie die Smart-Charging-Nachrichten nach ISO 15118-20) müssen erweitert werden, um Echtzeit-SOC- und Verfügbarkeitseinschränkungen zuverlässig zu übermitteln. Und das Verbrauchervertrauen bleibt entscheidend: Fahrer müssen darauf vertrauen können, dass der „Netzunterstützungsmodus“ sie nicht stranden lässt – oder ihren Akku schneller degradiert.

Doch der Weg nach vorn ist nun klarer. Frühe Prototypen bewegen sich bereits von der Simulation zum Hardware-in-the-Loop-Testing. In einem Versuch, der gemeinsam mit dem State Grid Hebei Electric Power Research Institute entwickelt wurde, wurden zehn bidirektionale E-Fahrzeug-Ladestationen mit einer 500-kW-Mikroturbine in einem ländlichen Inselnetz integriert. Vorläufige Felddaten – wenn auch noch nicht veröffentlicht – spiegeln die Simulationsergebnisse wider: Frequenzabweichungen wurden konsequent unter 0,03 Hz gehalten, selbst während absichtlicher Lastschritte von 20 %.

In Zukunft deuten die Forscher auf Verbesserungen der nächsten Generation hin. Was, wenn der Regler die Batterietemperatur berücksichtigen könnte – einen Hauptfaktor für die EV-Leistungsfähigkeit im Winter? Oder sich mit Solarprognosen integrieren ließe, um Flotten vor abendlichen Nachfragespitzen vorzuladen? Oder die Koordination über mehrere Mikronetze hinweg – wie in der Folgearbeit des Teams zu Multi-Agent-DDPG angedeutet?

Eines ist sicher: Die Ära der statischen Netzregelung geht zu Ende. Während dezentrale Energiequellen zunehmen – und sich E-Fahrzeuge von Endpunkten zu Knotenpunkten in einem lebendigen Netz entwickeln – müssen auch die Regler, die sie steuern, sich weiterentwickeln. Nicht durch das Ersetzen ingenieurwissenschaftlicher Grundlagen, sondern durch deren Ermächtigung.

Der Evolutionär-PID macht E-Fahrzeuge nicht schlauer. Er macht das Netz weiser – indem er endlich hört, was die Fahrzeuge kollektiv zu sagen versuchen.

Autoren: Peixiao Fan*, Wenping Hu, Yuxin Wen, Song Ke, Jun Yang
Zugehörigkeiten:

Schule für Elektrotechnik und Automatisierung, Wuhan-Universität, Wuhan 430072, Provinz Hubei, China
Electric Power Research Institute, State Grid Hebei Electric Power Co., Ltd., Shijiazhuang 050000, Provinz Hebei, China

Journal: Journal of Global Energy Interconnection, Bd. 6, Nr. 3, Mai 2023
DOI: 10.19705/j.cnki.issn2096-5125.2023.03.004

Korrespondierender Autor