Startup walczy z monotonią dużych modeli językowych

Australijski startup Springboards opracował nowy model Flint, który ma rozwiązać kluczowy problem współczesnych dużych modeli językowych - ich niepokojącą przewidywalność i brak kreatywności. Wszystkie popularne LLM-y, od ChatGPT po Claude i Gemini, wykazują zadziwiającą tendencję do udzielania niemal identycznych odpowiedzi na те same pytania otwarte. Demonstrates to zjawisku polega na tym, że jeśli poprosisz chatbot o losową liczbę między 1 a 10, otrzymasz prawie zawsze 7 - demonstracja widać nawet na prostych pytaniach typu kolejne losowe liczby, gdzie modele konsekwentnie podają 3-4 lub 8-9.

Flint został specjalnie trenowany w inny sposób niż dotychczasowe modele. Zamiast zwalczać tendencję do hallucynacji - fałszywych lub wymyślonych odpowiedzi - Springboards postanowił je "zapraszać". Cofounder i CEO firmy Pip Bingemann wyjaśnia, że podczas gdy inne LLM-y walczą z tym problemem, ich model go przyjmuje i wykorzystuje do generowania większej różnorodności odpowiedzi. W demonstracji Bingemann pokazał, że na identyczne pytania zarówno ChatGPT jak i Claude odpowiadały numerem 7, a Flint w pierwszym podejściu również, ale po restarcie sesji model wygenerował zupełnie inną odpowiedź.

Różnica może się wydawać kosmetyczna, ale ma znaczenie dla całej klasy zadań. Dla prac technicznych jak kodowanie czy badania naukowe przewidywalność modeli nie stanowi problemu. Natomiast w burzy mózgów, planowaniu podróży czy twórczych zadaniach groupthink modeli istotnie ogranicza ich użyteczność. Flint ma zatem potencjał, aby zmienić sposób, w jaki można wykorzystywać LLM-y do pracy wymagającej wyobraźni i oryginalności.