Naukowcy wprowadzili ATHENA-R1, zaawansowanego agenta AI specjalizującego się w rozumowaniu terapeutycznym obejmującym wszystkie leki zatwierdzone przez FDA od 1939 roku. System został wytrenowany techniką reinforcement learning na uniwersum 212 biomedycznych narzędzi i osiąga imponujące wyniki - 94,7% dokładności w otwartych zadaniach dotyczących wyboru leków oraz 82,9% w złożonych przypadkach leczenia pacjentów, co stanowi wzrost odpowiednio o 17,8 i 10,7 punktu procentowego w stosunku do GPT-4.
Klucz do skuteczności ATHENA-R1 leży w jego iteracyjnym podejściu. Na każdym etapie agent identyfikuje brakujące informacje, wybiera odpowiednie narzędzia biomedyczne, uruchamia je i integruje zebrane dane. Proces trenowania był niezwykle innowacyjny - naukowcy zbudowali dwupoziomowy framework uczenia się bez użycia ręcznie adnotowanych śladów. Multi-agentowe systemy najpierw konstruowały narzędzia, zadania i trajektorie rozumowania do fine-tuningu nadzorowanego, a następnie reinforcement learning z naukowymi nagrodami doskonalił jakość wnioskowania, uwzględniając zbieranie dowodów, ugruntowane użycie narzędzi i logiczną niemożliwość redundancji.
Ewaluacja systemu obejmowała pięć benchmarków z 3168 zadaniami rozumowania dotyczącymi leków i 456 przypadkami leczenia pacjentów. W ślepych ocenach przeprowadzonych przez ekspertów z 28 organizacji zajmujących się rzadkimi chorobami ATHENA-R1 został preferowany nad modelami referencyjnymi na wszystkich kryteriach. Lekarze pozytywnie ocenili jego wydajność w złożonych przypadkach hospitalizowanych pacjentów z schorzeniami kardiologicznymi i infekcyjnymi, co sugeruje potencjał kliniczny tej technologii w rzeczywistych warunkach medycznych.