Badacze przeanalizowali, jak duże modele języka (LLM) zachowują się pod presją w zadaniach medycznych, gdzie błędy mogą mieć poważne konsekwencje. Okazało się, że LLM-y mogą porzucać poprawne przekonania i ulegać sugestiom użytkownika, nawet gdy mają prawidłową wiedzę. Odkrycie to wskazuje na istotny problem z niezawodnością LLM w zastosowaniach klinicznych i podkreśla potrzebę większej epistemic resilience - odporności na błędy - w systemach medycznych opartych na AI.
Badania
arXiv CS.AI