Zespół naukowców opracował framework Supervised Reinforcement Learning do koordynacji rozproszonych zasobów energii, łączący podejścia z dużych modeli językowych z zarządzaniem sieciami elektroenergetycznymi. Tradycyjne metody optymalizacyjne mają trudności ze zmiennością i złożonością tych zasobów, dlatego uczenie ze wzmacnianiem stało się obiecującą alternatywą - choć dotąd cierpiało na nieefektywność próbkowania i suboptymalne wyniki przy trenowaniu od podstaw.

Proponowana metoda najpierw pre-trenuje politykę decyzyjną na danych demonstracyjnych w stylu uczenia nadzorowanego, a następnie doskonali ją za pomocą RL w dwuetapowym procesie. Pierwszy etap to offline fine-tuning poprawiający wydajność polityki, drugi to online fine-tuning adaptujący model do rzeczywistej dynamiki systemu. To rozwiązanie stanowi znaczący krok naprzód, inspirując się paradygmatami z obszaru dużych modeli języka.

Eksperymenty wykazały, że implementacje RL oparte na tym framework'u osiągają znacznie lepsze wyniki niż wszystkie benchmarki, zachowując wysoką efektywność kosztową nawet przy słabszej jakości danych treningowych. Dla sektora energetyki odnawialnej to potencjalny przełom, który może przyspieszyć pełną integrację rozproszonychźródeł energii w istniejące sieci elektroenergetyczne.