Naukowcy z University of British Columbia zaprezentowali nowatorski system, któremu dali nazwę MoCA-Agent (Market-of-Claims Code Agent). Rozwiązanie adresuje fundamentalny problem w rozumowaniu finansowym: odpowiedzi muszą być nie tylko logiczne, ale przede wszystkim dokładne. Nawet drobna pomyłka — przeczytanie błędnej komórki tabeli, błędny operator matematyczny czy pomylenie jednostek — może spowodować, że model zwróci wynik, który brzmi prawie wiarygodnie, ale jest całkowicie fałszywy.

Część genialna to koncepcja "rynku twierdzeń". System nie czeka po prostu, aż różne agenty debatują nad odpowiedzią. Zamiast tego rozkłada problem na małe, precyzyjne twierdzenia (claims), a następnie uruchamia specjalistyczne agenty handlowe, które je oceniają jak inwestorzy na giełdzie — mogą "kupować" lub "sprzedawać" każde twierdzenie. Ostatecznie system uśrednia te głosy w postaci ważonych decyzji: zaakceptuj lub odrzuć. Na tej podstawie generuje wykonalny kod w Pythonie, który zawiera tylko zbilansowaną, dowiedzione przez rynek logikę.

Wyniki mówią same za siebie: system osiągnął 78,3 proc. na benchmarku FinQA (finansowe pytania), 76 proc. na FinanceMath, a nawet 86,9 proc. na pytaniach ESG. Co ważne, MoCA-Agent używa relatywnie małego modelu (Qwen 3.6-27B), co sugeruje, że sama architektura — a nie rozmiar — jest kluczem do precyzji. To podejście oparte na agregacji dowodów na poziomie jednotkowych twierdzeń zamiast całych odpowiedzi pokazuje, że bardziej skomplikowana, ale logicznie zagruntowana strategia potrafi lepiej radzić sobie w zadaniach wysokiego ryzyka.