Agenci AI uczą się sami przez ewolucję w naturalnym języku

Naukowcy zaprezentowali RSEA - Recursive Self-Evolving Agent, system pozwalający agentom opartym na dużych modelach językowych ulepszać się poprzez przepisywanie artefaktów w naturalnym języku bez aktualizacji wag. RSEA utrzymuje trójwarstwowy stan złożony ze strategii imperatywnej, wielokrotnie użytecznych umiejętności oraz proceduralnego playbooka, które ewoluują na podstawie trajektorii agenta z użyciem mechanizmu held-out selection - nowe wersje są zatwierdzane tylko jeśli nie pogorszą wyników na oddzielnym zbiorze testowym.

Badacze przeprowadzili kompleksową ewaluację na czterech różnych benchmarkach: ALFWorld, GAIA, tau-bench i WebShop, porównując RSEA z sześcioma liniami bazowymi včetnie ReAct, Reflexion i Dynamic Cheatsheet, wszystko na wspólnym lokalnym modelu backbone. Wyniki pokazują, że RSEA osiąga najlepszy wynik na ALFWorld jako metoda single-pass z 69,3% dokładności wobec 64,6% dla ReAct, oraz 79,4% z możliwością retry'u - to ogólnie najlepszy rezultat na tym benchmarku. Jednak AWM, reprezentujący indukcję konkretnych workflowów, dominuje na zadaniach tool-use'u.

Kluczowe odkrycie dotyczy bezpieczeństwa: nieostrożna ewolucja kontekstu bez mechanizmu held-out selection daje wysoką wariancję i jest niebezpieczna. Dynamic Cheatsheet, który kształtuje kontekst online bez bramy held-out, osiąga wprawdzie 70,7% na ALFWorld, ale wprowadza nieprzewidywalność. To sugeruje, że kontrolowana ewolucja artefaktów naturalnego języka to obiecujący kierunek dla samodoskonalenia się agentów, ale wymaga wdrożenia zachowawczych mechanizmów weryfikacji, aby uniknąć regresji wydajności.