Naukowcy z zainteresowaniem odkryli, że współczesne duże modele językowe (LLM) i ludzki mózg niezależnie identyfikują dokładnie tę samą jednowymiarową reprezentację emocjonalnej walencji — czyli interpretację bodźców jako pozytywnych lub negatywnych. Do eksperymentu wystarczyło zaledwie dziewięć zdań naładowanych emocjami, aby w modelach AI zbudować tzw. oś V, która następnie z zaskakującą precyzją mapowała się na rzeczywiste wzorce aktywności mózgu zarejestrowane poprzez EEG u 123 uczestników. To znaczące odkrycie sugeruje, że zarówno sztuczne inteligencje, jak i nasze mózgi konwergują ku tym samym fundamentalnym zasadom reprezentacji informacji emocjonalnej.
Badania pokazują jeszcze więcej — gdy naukowcy przeanalizowali 36 niezależnie wytrenowanych klasyfikatorów emocji pracujących na danych EEG, okazało się, że spontanicznie ponownie odkrywają tę samą oś walencji. Oznacza to, że struktura emocjonalna nie jest przypadkowa ani specyficzna dla jednej metody, ale stanowi coś w rodzaju uniwersalnego schematu, który zarówno sztuczne sieci neuronowe, jak i biologiczne układy nerwowe naturalnie konwergują. Ta zbieżność podkreśla, jak głębokie mogą być podobieństwa między sposobem, w jaki AI przetwarza język, a tym, jak mózg koduje emocjonalne znaczenia.
Paradoksalnie, pomimo tej imponującej zgodności między LLM a mozgiem, badacze nie potrafili wykorzystać tej osi valentji do rzeczywistej poprawy jakości dekodowania emocji z mózgu. Wypróbowali aż 25 różnych strategii treningowych — od distillacji wiedzy, przez uczenie kontrastywne, aż po zaawansowane straty topograficzne — ale żaden z podejść nie nieść poprawy. Co więcej, 16 strategii aktualnie pogorszyło wyniki. To zjawisko naukowcy nazwali regułą nasycenia: kiedy sygnały etykiet zadaniowych same w sobie już kierują sieć na właściwy kierunek, dodatkowe wsparcie treningowe okazuje się nieefektywne lub wręcz kontrproduktywne. Odkrycie to stanowi ważny komunikat dla badaczy pracujących nad integracją sztucznej inteligencji z neuronauką.