Naukowcy prezentują nową architekturę transformera o nazwie Fully Looped Transformer, która rozwiązuje problemy ze stabilizacją podczas treningu modeli z pętlami zwrotnymi. Podejście upraszcza dotychczasowe metody stabilizacji, eliminując dodatkowe mechanizmy potrzebne w konwencjonalnych architekturach. Badanie jest ważne dla rozwoju bardziej stabilnych i efektywnych modeli głębokich, szczególnie w kontekście sekwencyjnego przetwarzania danych i architektur recyrkulacyjnych.