Zespół badawczy przeanalizował, co dzieje się w Large Reasoning Models (LRM) po wygenerowaniu poprawnej odpowiedzi. Zaproponowali nową metodę oceny na poziomie prefiksów, która identyfikuje minimalny budżet rozumowania potrzebny modelowi, by po raz pierwszy udzielić poprawnej odpowiedzi. Okazało się, że wiele przykładów uznawanych za wymagające intensywnego rozumowania faktycznie potrzebuje dużo mniej iteracji.
Najważniejsze odkrycie: zatrzymanie się przy pierwszej prawidłowej odpowiedzi daje lepsze rezultaty niż kontynuacja rozumowania — dokładność wzrasta nawet o 21%. Badacze rozróżniają dwa typy problemu: verbose overthinking (nadmiarowość, ale bezpieczna) oraz harmful overthinking (gdy dalsze rozumowanie destabilizuje już poprawną ścieżkę). Strategie efektywności, takie jak early stopping, zmniejszają nadmiarowość, ale nie zatrzymują szkodliwego overthinku.
To odkrycie zmienia perspektywę na limitacje współczesnych modeli AI. Problem nie dotyczy tylko zdolności do złożonego wnioskowania, ale również braku mechanizmów umożliwiających modelom poznanie, kiedy powinny się zatrzymać. Wyniki sugerują, że przyszłe architektury muszą включić zdolność do samooceny i wczesnego wyjścia, gdy zadanie jest już wystarczająco rozwiązane.