CreativityNeuro: Sterowanie wagami modeli języka poprawia myślenie dywergencyjne

Badacze zaprezentowali CreativityNeuro - nową metodę zwiększającą zdolność dużych modeli językowych do myślenia dywergencyjnego poprzez sterowanie wagami modelu. Problem, który rozwiązuje, to tzw. artificial hivemind effect - tendencja LLM-ów do generowania bardzo podobnych odpowiedzi na pytania otwarte, zamiast proponować zróżnicowane, oryginalne rozwiązania.

Metoda jest szczególnie atrakcyjna, bo nie wymaga żadnych danych treningowych, retrainingu ani standardowego fine-tuningu opartego na gradientach. W praktyce, CreativityNeuro osiągnęła imponujące rezultaty: na Divergent Association Task (DAT) - teście kreatywności w przestrzeni słownikowej - poprawiła wyniki nawet o 14 punktów procentylowych. Jeszcze ważniejsze są wyniki z dużej ewaluacji ludzkiej obejmującej 720 ocen na bardziej złożonych zadaniach (Alternative Uses Test i Task Task), gdzie system wykazał znaczące ulepszenia w oryginalności, zaskoczeniu i ogólnej kreatywności.

Key insight polega na tym, że sterowanie wagami w space'u wag modelu (weight-space steering) okazało się bardziej efektywne niż tradycyjne sterowanie aktywacjami (activation steering). To drugie podejście działało dobrze na DAT, ale nie przeniosło się na bardziej złożone, otwarte zadania. Wyniki sugerują, że CreativityNeuro nie tylko poprawia kreatywne myślenie, ale również wyraźnie zmniejsza mode collapse - problem, gdzie modele skupiają się wokół najprawdopodobniejszych odpowiedzi, ignorując bardziej oryginalne alternatywy.