Naukowcy opracowali RareDxR1, model języka przeznaczony do autonomicznego diagnozy rzadkich chorób na podstawie tekstu klinicznych notatek, bez potrzeby strukturyzacji wcześniejszych phenotypów. Tradycyjne podejścia AI w diagnostyce polegają na pipeline'ach ekstrakcji fenotypów lub retrieval-augmented generation, co prowadzi do znacznej utraty informacji i błędów w decyzjach. RareDxR1 rozwiązuje ten problem poprzez bezpośrednie internalizowanie rozproszerzonej wiedzy o rzadkich chorobach w parametrach modelu, co pozwala na pełniejsze rozumienie skomplikowanych przypadków klinicznych.

Kluczową innowacją jest metoda Reflection-Enhanced Reasoning Sampling (RERS), która syntetyzuje trajektorie diagnostyczne na poziomie ekspertów, ucząc się z błędów bez wymaganego udziału człowieka do anotacji danych. System dodatkowo wykorzystuje podejście curriculum reinforcement learning do stopniowego opanowywania diagnozy rzadkich chorób. Takie podejście "end-to-end" zmienia paradygmat - zamiast fragmentaryzowania problemu, model uczy się holistycznego rozumowania medycznego.

Znaczenie tego rozwiązania jest duże: rzadkie choroby stanowią jeden z najtrudniejszych wyzwań diagnostycznych, szczególnie w kontekście braku wystarczającej ilości danych treningowych. RareDxR1 demonstruje, że LLM-y mogą osiągać ekspertyzę na poziomie lekarza poprzez inteligentne projektowanie procedur uczenia, zamiast pełnego polegania na człowieczych anotacjach. Może to przyspieszyć rozpoznawanie poważnych, trudnych do zdiagnozowania warunków klinicznych i poprawić dostęp do właściwej diagnostyki nawet w ośrodkach medycznych z ograniczonymi zasobami.