Intelligente Netzregelung: KI steuert Spannung bei Solar- und E-Auto-Integration

Intelligente Netzregelung: KI steuert Spannung bei Solar- und E-Auto-Integration

Die Integration erneuerbarer Energien und elektrischer Fahrzeuge (E-Autos) in die bestehende Stromnetzinfrastruktur ist eine der zentralen Herausforderungen des globalen Energieumwandlungsprozesses. Während Photovoltaikanlagen (PV) und E-Autos einen unverzichtbaren Beitrag zur Dekarbonisierung leisten, bringen sie gleichzeitig komplexe technische Probleme mit sich, die die Stabilität und Zuverlässigkeit der Stromversorgung gefährden können. Die fluktuierende Einspeisung von Solarstrom und das unvorhersehbare Ladeverhalten von Tausenden von E-Autos können zu erheblichen Spannungsschwankungen im Verteilnetz führen. Diese sogenannten Spannungsabweichungen – sei es durch Über- oder Unterspannung – können nicht nur die Leistung elektrischer Geräte beeinträchtigen, sondern im Extremfall auch zu Netzinstabilitäten und sogar Ausfällen führen. Angesichts der rasanten Verbreitung dieser Technologien ist die Entwicklung intelligenter, adaptiver Steuerungsstrategien nicht mehr nur wünschenswert, sondern dringend erforderlich. In einer bahnbrechenden Studie, die in der renommierten Fachzeitschrift Power System Protection and Control veröffentlicht wurde, präsentiert ein Forscherteam der Shandong University eine neuartige Lösung, die auf einer hierarchischen Tiefen Verstärkenden Lernmethode (Deep Reinforcement Learning, DRL) basiert. Diese KI-gestützte Strategie koordiniert in Echtzeit eine Vielzahl von steuerbaren Ressourcen, von PV-Wechselrichtern über Kompensationsanlagen bis hin zum Ladeverhalten von E-Autos, um die Spannungsqualität im Netz effizient und zuverlässig zu stabilisieren.

Die vorliegende Forschungsarbeit, geleitet von QI Xianglong, CHEN Jian, ZHAO Haoran, ZHANG Wen und ZHANG Keyu vom Schwerpunkt Labor für Intelligente Netzbetriebsführung und -steuerung der Shandong University, stellt einen paradigmatischen Wechsel in der Netzführung dar. Statt auf traditionelle, modellbasierte Ansätze zu setzen, die auf präzisen mathematischen Beschreibungen des Netzverhaltens angewiesen sind und bei zunehmender Komplexität an ihre Grenzen stoßen, setzen die Forscher auf einen datengesteuerten, künstlich intelligenten Ansatz. Ihr Ziel ist es, die Herausforderung der Spannungsregelung durch eine kooperative Steuerung auf mehreren Zeitskalen zu meistern. Das Kernproblem liegt in der unterschiedlichen Reaktionsgeschwindigkeit der verfügbaren Steuerungselemente. Schnell reagierende Geräte wie statische Var-Kompensatoren (SVC) oder PV-Wechselrichter können ihre Blindleistung innerhalb von Sekunden oder Minuten anpassen und eignen sich somit für die Feinregelung. Im Gegensatz dazu ist die Beeinflussung des Ladeverhaltens von E-Autos ein viel langsamerer Prozess, der sich über Stunden erstreckt, da er auf menschlichem Entscheidungsverhalten basiert. Eine einheitliche Steuerung all dieser Ressourcen würde zu ineffizienten oder sogar widersprüchlichen Steuerbefehlen führen.

Um diesem Dilemma zu begegnen, haben die Forscher eine zweischichtige, hierarchische Kontrollarchitektur entwickelt. Diese Architektur trennt die Steuerungsaufgaben bewusst nach Zeithorizonten und Reaktionsgeschwindigkeit. Die untere Schicht, die auf einer kurzen Zeitskala von 15 Minuten operiert, ist für die direkte, feinmaschige physikalische Steuerung zuständig. Sie kontrolliert die Blindleistung der PV-Wechselrichter und der SVC-Anlagen. Diese Geräte können Blindleistung erzeugen oder aufnehmen, was entscheidend ist, um lokale Spannungsprobleme zu korrigieren, ohne die übertragene Wirkleistung zu beeinflussen. Diese Schicht nutzt einen Multi-Agenten-Ansatz (Multi-Agent DRL, MADRL), bei dem jeder Wechselrichter und jede SVC-Anlage einen eigenen intelligenten Agenten besitzt. Diese Agenten werden zentral trainiert, was ihnen ermöglicht, aus den Interaktionen des gesamten Netzwerks zu lernen und kooperativ zu handeln. In der praktischen Anwendung jedoch agieren sie dezentral, basierend ausschließlich auf lokalen Messungen an ihrem jeweiligen Netzanschlusspunkt. Dieses Konzept der „zentralen Ausbildung mit dezentraler Ausführung“ (CTDE) ist ein entscheidender Vorteil, da es die Robustheit des Systems erhöht. Selbst wenn die Kommunikation zwischen den verschiedenen Geräten ausfällt, können die lokalen Agenten weiterhin ihre Steuerungsaufgaben autonom und effektiv erfüllen, was die Resilienz des gesamten Netzes stärkt.

Die obere Schicht der Architektur agiert auf einer längeren Zeitskala, mit Entscheidungsintervallen von einer Stunde. Ihr primäres Steuerungselement ist nicht ein physikalisches Gerät, sondern ein wirtschaftliches Signal: der Echtzeitstrompreis. Anstatt die Ladeleistung der E-Autos direkt zu steuern, beeinflusst diese Schicht indirekt das Verhalten der Fahrzeugbesitzer durch dynamische Preisgestaltung. Indem der Strompreis in Echtzeit angepasst wird, schafft das System finanzielle Anreize für die Nutzer, ihre Ladevorgänge in Zeiten zu verlegen, die für das Netz günstig sind. Wenn beispielsweise eine hohe Solarstromproduktion am Mittag zu einer Überspannung führt, kann der Preis gesenkt werden, um die E-Autobesitzer zu ermutigen, ihre Fahrzeuge genau dann zu laden und so den überschüssigen grünen Strom zu verbrauchen. Umgekehrt kann der Preis in den Abendstunden, wenn die Solarproduktion nachlässt und gleichzeitig der allgemeine Strombedarf steigt, erhöht werden, um eine zusätzliche Belastung durch gleichzeitiges Laden vieler E-Autos zu verhindern. Diese Schicht betrachtet die aggregierte Ladeleistung der E-Autos als eine grobkörnige, langsam reagierende Ressource, die durch wirtschaftliche Anreize gesteuert werden kann.

Ein entscheidender Erfolgsfaktor dieser Strategie ist die präzise Modellierung des menschlichen Verhaltens. Die Wirksamkeit der oberen Schicht hängt davon ab, wie genau vorhergesagt werden kann, wie die Nutzer auf Preisänderungen reagieren werden. Die Forscher haben daher ein detailliertes probabilistisches Modell entwickelt, das die unterschiedlichen Reise- und Parkmuster von E-Autobesitzern berücksichtigt. Sie klassifizierten die Nutzer nach ihrem primären Reisezweck – Pendeln zur Arbeit, Rückkehr nach Hause oder Freizeitaktivitäten –, da diese jeweils charakteristische Ankunfts- und Abfahrtszeiten an Ladestationen aufweisen. Diese Muster wurden mit statistischen Verteilungen (Normalverteilungen) modelliert. Zusätzlich berücksichtigt das Modell den aktuellen Ladezustand (State of Charge, SOC) der Fahrzeugbatterie und die gewünschte Reichweite beim Verlassen des Ladepunkts. Durch die Kombination dieser Faktoren kann das Modell die „Ladefenster“ jedes Nutzers vorhersagen. Es berechnet dann den finanziellen Anreiz – die Differenz zwischen den Kosten des Ladens zum aktuellen Preis und den Kosten eines potenziell günstigeren Zeitpunkts – und leitet daraus die Wahrscheinlichkeit ab, dass ein Nutzer sein Ladeverhalten ändert. Dies ermöglicht es der oberen Steuerungsschicht, fundierte Prognosen über die aggregierte Auswirkung ihrer Preisentscheidungen zu treffen.

Um die Effektivität ihrer hierarchischen DRL-Strategie zu bewerten, führten die Forscher umfangreiche Simulationen auf einem modifizierten IEEE 33-Knoten-Netzwerk durch, einem Standardmodell in der Stromnetzforschung. Das Testnetz enthielt drei 1,5-Megawatt-PV-Anlagen, drei SVC-Anlagen, schaltbare Kondensatorbänke (SC) sowie drei Ladestationen, die jeweils 700 E-Autos bedienen. Für eine realitätsnahe Simulation wurden echte PV- und Lastdaten aus Belgien verwendet. Die Ergebnisse waren überzeugend: Die vorgeschlagene Strategie hielt die Spannung an allen Knotenpunkten des Netzes innerhalb des sicheren Betriebsbereichs von 0,93 bis 1,07 p.u. (per unit) und verhinderte so effektiv sowohl Über- als auch Unterspannung.

Zur objektiven Bewertung wurde die neue Strategie mit mehreren Vergleichsszenarien konfrontiert. Ein Basisszenario, das nur die schnellen Geräte (PV und SVC) nutzte, ohne E-Autos durch Preisanreize zu beeinflussen, führte zu erheblichen Spannungsschwankungen, insbesondere während der Abendlastspitze. Ein Szenario mit einem festen, am Vortag festgelegten Zeitpreis (Time-of-Use) für E-Autos verbesserte die Situation, konnte aber die dynamischen Schwankungen des Tages nicht ausreichend kompensieren. Ein weiteres Szenario, das versuchte, alle Geräte auf der gleichen stündlichen Zeitskala zu steuern, zeigte eine schlechte Leistung, was die Notwendigkeit der zeitskalenbasierten Trennung unterstreicht. Selbst ein etabliertes Optimierungsverfahren, der Particle Swarm Optimization (PSO)-Algorithmus, wurde von der DRL-Strategie übertroffen.

Die hierarchische DRL-Strategie erreichte die niedrigste durchschnittliche Spannungsabweichung. Im Vergleich zum Basisszenario konnte sie diese um 38% reduzieren, und im Vergleich zu den anderen fortgeschrittenen Strategien um 16-18%. Diese Leistungssteigerung bedeutet eine signifikante Verbesserung der Netzqualität, Zuverlässigkeit und Effizienz. Die Implikationen dieser Forschung sind weitreichend. Für Netzbetreiber bietet sie ein leistungsfähiges Werkzeug, um die zunehmende Durchdringung von erneuerbaren Energien und E-Autos zu bewältigen, ohne auf kostspielige und zeitaufwendige Netzausbauten angewiesen zu sein. Sie kann Investitionen in neue Transformatoren oder Leitungen hinauszögern oder sogar vermeiden. Für Verbraucher eröffnet sie die Möglichkeit, aktiver am Energiemarkt teilzunehmen und durch intelligentes Laden ihre Stromkosten zu senken, während sie gleichzeitig zur Stabilität des Netzes beitragen. Für Energiepolitiker liefert diese Technologie eine konkrete technologische Grundlage, um ambitionierte Klimaziele mit einem hohen Maß an Versorgungssicherheit zu erreichen.

Diese Arbeit markiert einen bedeutenden Fortschritt in der Anwendung von Künstlicher Intelligenz auf kritische Infrastrukturen. Im Gegensatz zu vielen „Black-Box“-KI-Systemen bietet die hierarchische Struktur dieser Steuerung eine gewisse Interpretierbarkeit. Ingenieure können nachvollziehen, wie die langfristigen wirtschaftlichen Anreize (obere Schicht) von den kurzfristigen physikalischen Steuerungen (untere Schicht) getrennt werden. Die Verwendung des CTDE-Frameworks gewährleistet eine inhärente Robustheit gegenüber Kommunikationsausfällen. Ein weiterer entscheidender Vorteil ist, dass die Strategie „modellfrei“ ist. Sie benötigt kein perfektes, ständig aktualisiertes mathematisches Modell des gesamten Stromnetzes, was eine enorme Herausforderung darstellt, da sich die Netztopologie ständig ändert. Stattdessen lernt das System die optimale Steuerungsstrategie direkt aus den Daten, was es äußerst anpassungsfähig an sich verändernde Bedingungen macht.

Die Anwendungsmöglichkeiten dieser Technologie gehen über die Spannungsregelung hinaus. Das gleiche hierarchische DRL-Framework könnte auf andere Herausforderungen der Netzführung angewendet werden, wie z.B. die Frequenzregelung, die Entlastung von überlasteten Leitungen oder die Optimierung des Lademanagements für einen Fuhrpark von E-Autos in einem Ride-Sharing-Service. Es könnte auch in Mikrogrids integriert werden, um lokale Energiegemeinschaften mit hohem Eigenverbrauch zu steuern. Während sich die Energiewelt weiterhin rasant verändert, wird die Fähigkeit, intelligente, Echtzeit-Entscheidungen über mehrere Zeitskalen hinweg zu treffen, von entscheidender Bedeutung sein. Die Forschung von QI Xianglong und seinen Kollegen an der Shandong University liefert hierfür einen robusten und skalierbaren Bauplan für die intelligenten, sich selbst optimierenden Stromnetze der Zukunft.

Diese Studie ist ein eindrucksvolles Beispiel für interdisziplinäre Forschung, die tiefes Fachwissen aus der Stromnetztechnik mit den neuesten Fortschritten der Künstlichen Intelligenz verbindet. Sie geht über eine rein theoretische Untersuchung hinaus und präsentiert eine praktische, validierte Lösung für eine der dringendsten Herausforderungen im modernen Energiesektor. Indem sie die Kraft der KI nutzt, um den komplexen Tanz der Elektronen in einem Netzwerk aus Solarpanels, E-Autos und traditionellen Verbrauchern zu orchestrieren, ebnet diese Arbeit den Weg für ein nachhaltigeres, resilienteres und verbraucherzentrierteres Energiesystem. Die Zukunft des intelligenten Stromnetzes ist nicht nur vernetzt; sie ist intelligent, adaptiv und lernt aus jeder Interaktion.

QI Xianglong, CHEN Jian, ZHAO Haoran, ZHANG Wen, ZHANG Keyu, Key Laboratory of Power System Intelligent Dispatch and Control, Shandong University. Power System Protection and Control, DOI: 10.19783/j.cnki.pspc.240122