ARBITER: Trajektorie rozumowania i niepowodzenia głosowania większościowego w sampling'u czasu testo

Naukowcy opracowali nową metodę ARBITER, która zmienia podejście do wybierania odpowiedzi w modelach AI podczas fazy testowania. Tradycyjne podejście polega na tym, że model kilkakrotnie rozwiązuje problem, a następnie wybiera odpowiedź, którą wybrało większość prób - to coś w rodzaju głosowania demokratycznego wśród wyników. Problem w tym, że model może wygenerować wiele błędnych odpowiedzi, które są jednak logicznie spójne i przekonujące. ARBITER rozwiązuje ten problem, analizując nie tylko wynik, ale całą trajektorię rozumowania - czyli wszystkie kroki, które model podejmuje na drodze do odpowiedzi.

Odkrycie to ma ogromne znaczenie dla złożonych zadań wymagających głębokich rozumowania, takich jak rozwiązywanie skomplikowanych problemów matematycznych czy logicznych. Badacze wykazali, że zwykłe liczenie głosów zawodzi wtedy, gdy model opracuje przemyślaną, ale ostatecznie błędną linię argumentacji. ARBITER zamiast tego wybiera odpowiedzi na podstawie tego, jak "wysokiej jakości" jest ścieżka rozumowania, którą model przeszedł. To oznacza, że liczy się nie tylko wynik, ale jakość logicznego procesu, który do niego doprowadził, i czy poszczególne kroki wnioskowania są rzeczywiście poprawne.

Praktyczne konsekwencje tej metody mogą być znaczące dla wszystkich aplikacji AI wymagających rozumowania wieloetapowego. Firmy rozwijające duże modele językowe będą mogły uzyskać lepsze wyniki bez konieczności powiększania samych modeli - wystarczy bardziej inteligentna analiza tego, co model już potrafi zrobić. To szczególnie istotne biorąc pod uwagę rosnące koszty trenowania większych systemów AI.