Badacze z arXiv twierdza, że konwencjonalne agenty AI nieadekwatnie modelują interakcję z użytkownikami poprzez założenie, że mają oni już dobrze sformułowane preferencje i wystarczy je wyjaśniać. W praktyce użytkownicy często nie posiadają wystarczającej wiedzy domenowej, aby odpowiedzieć na pytania o konkretne cechy produktów bez uprzedniego zdobycia informacji.

Zeby sformalizować te obserwacje, naukowcy opracowali framework CoPref bazujący na Search-Experience-Credence z ekonomii informacji. Model ten opisuje, jak użytkownicy konstruują preferencje poprzez działania agenta - przykłady, wyjaśnienia i rekomendacje. Równolegle stworzyli benchmark CoShop symulujący interaktywny system rekomendacyjny, gdzie agent prowadzi dialog z użytkownikiem i składa propozycje produktów.

Wyniki testów na pięciu frontierowych modelach okazały się rozczarowujące - żaden nie osiągnął wyższości niż 56% dokładności nawet po pięciu turach interakcji. Analiza wskazuje, że porażki nie wynikały z braku umiejętności wyszukiwania towarów, lecz z faktu, że agenty słabo poszerzały wiedzę użytkowników o własnych potrzebach. To sugeruje, że obecne systemy potrebują fundamentalnego przeprojektowania, aby lepiej wspierać proces konstruowania preferencji niż tylko ich elicytowania.