Naukowcy z arXiv zaprezentowali Pythagoras-Prover, otwartoźródłową rodzinę dowodników twierdzeń dla Lean, która udowadnia, że dla skutecznego dowodzenia formalnego nie trzeba ogromnych modeli. Nowy system dostępny w wariantach 4 i 32 miliardów parametrów, a także pierwszym prototypem opartym na modelach dyfuzyjnych, osiąga lepsze wyniki niż DeepSeek-Prover-V2 z 671 miliardami parametrów na testach MiniF2F.

Kluczem do tego sukcesu jest kilka innowacyjnych podejść. Po pierwsze, zespół stworzył zweryfikowany corpus problemów Lean, podzielony na poziomy trudności do nauki progresywnej – modele uczą się najpierw na krótkich, prostych dowodach, a stopniowo przechodzą do bardziej złożonych. Dynamiczny schemat filtrowania śladów dowodów utrzymuje tylko informacyjne sekwencje, mieści je w budżecie 8 tysięcy tokenów, co drastycznie zmniejsza koszt obliczeń. Dodatkowo wprowadzono Augmented Lean Formalisation (ALF) – technikę, która mnoży dostępne dane poprzez perturbacje znanych problemów, rozszerzając rzadkie zweryfikowane dane bez konieczności formalnej weryfikacji każdej mutacji.

To wynik ma znaczenie dla praktycznego rozwoju formalnego dowodzenia twierdzeń. Wykazuje, że efektywność obliczeniowa jest osiągalna dzięki inteligentnym strategiom treningowym, a nie tylko skalowaniu modeli. Dla zainteresowanych sztuczną inteligencją i matematyką formalną oznacza to, że takie systemy mogą stać się dostępne dla szerszej publiczności badaczy i praktyków, bez konieczności gigantycznych zasobów obliczeniowych.