Naukowcy z arXiv zaprezentowali Traj-Evolve — system wykorzystujący wiele agentów AI do analizy długoterminowych danych medycznych pacjentów. Wyzwaniem jest przetwarzanie rzadkich, zaszumionych i długotrwałych sekwencji informacji z elektronicznych rejestrów medycznych. Istniejące rozwiązania oparte na dużych modelach językowych radzą sobie z długością kontekstu, ale analizują pacjentów w izolacji, ignorując to, jak rzeczywisci lekarze korzystają z doświadczenia zebranego z podobnych wcześniejszych przypadków.
Traj-Evolve rozwiązuje ten problem dzięki dwóm komplementarnym mechanizmom. Pierwszy to Experience Pool — rodzaj pamięci non-parametrycznej, która indeksuje i przechowuje wybrane ślady rozumowania, pozwalając na szybkie wyszukiwanie podobnych pacjentów jako dodatkowy kontekst. Drugi to wieloagentowe reinforcement learning, które poprzez fine-tuning optymalizowany nagrodą ulepszy współpracę między agentami i pamięcią. Systemu testowano na zadaniu przewidywania raka płuc na podstawie danych z pięciu lat, a on pokonał dziewięć mocnych bazelin, szczególnie na trudnej grupie pacjentów, którzy nigdy nie palili.
Analiza wykazała kilka kluczowych zjawisk: w miarę rozrastania się bazy przypadków system przechodzi od wyszukiwania różnorodnych przykładów do bardziej specyficznych; menedżer agenta szybko osiąga optymalną dokładność, ale agenci zajmujący się analizą czasową ciągle korzystają na dostępie do większej liczby zweryfikowanych pacjentów. To pokazuje, że AI może autentycznie uczyć się w procesie, zbliżając się do sposobu, w jaki lekarze gromadzą wiedzę kliniczną.