Badacze z arXiv przedstawili nową metodę wzmacniającą niezawodność dużych modeli językowych w zadaniach planowania długoterminowego poprzez framework oparty na symbolicznych opiniach i iteracyjnym samocorrectingu. Problem, który rozwiązują, jest rzeczywisty - LLM-y mają trudności z generowaniem wykonalnych i poprawnych planów w skomplikowanych scenariuszach decyzyjnych, co ogranicza ich praktyczne zastosowanie w systemach wymagających wysokiej niezawodności.

Rozwiązanie działa na trzech poziomach. Po pierwsze, mechanizm prompt-based mapuje logiczne symbole (warunki, ograniczenia) na naturalny język, który LLM-y lepiej rozumieją. Po drugie, tzw. symbolic verifier bada wygenerowany plan, identyfikuje błędy i konwertuje je na konkretne instrukcje naprawcze interpretowalne przez model. Po trzecie, plan recognizer ocenia czy osiągnięty cel jest w ogóle możliwy do zrealizowania, co kieruje model w stronę realistycznych rozwiązań.

Wyniki empiryczne pokazują konsystentną poprawę zarówno w aspekcie wykonalności planów (czy są techniczne do zrealizowania) jak i ich poprawności (czy osiągają zamierzone cele). To jest ważne dlatego, że wiele krytycznych aplikacji AI - od robotyki po automatyzację biznesu - wymaga wiarygodnych planów bez błędów. Zaproponowana rama pracy otwiera drogę do bardziej zaufanych i bezpiecznych systemów AI-owych opartych na LLM-ach.