Anthropic zaprezentowało właśnie Claude Fable 5, którego pozycjonuje jako najmocniejszy model AI dostępny masowo. Firma szczególnie chwali możliwości systemu w zakresie biologii, jednak w praktyce okazuje się, że model odmawia odpowiadania na podstawowe pytania biologiczne - tego typu zadania, które powinien bez problemu rozwiązać uczeń szkoły średniej. Zamiast tego system kieruje użytkowników do wcześniejszej wersji modelu.

Ta sytuacja ujawnia fascynujący paradoks w świecie dużych modeli językowych. Choć Fable 5 miał być przełomem, jego rzeczywiste możliwości okazują się ograniczone w stosunku do zapowiedzi marketingowych. Może to wynikać ze sposobu trenowania modelu, jego instrukcji bezpieczeństwa lub ograniczeń w zbiorze danych treningowych. Problem ten pokazuje, że sama liczba parametrów i siła obliczeniowa nie gwarantują rozwiązywania wszystkich typów zadań.

Ta anomalia jest ważna dla branży, bo sugeruje, że nawet najnowsze modele mogą mieć ukryte luki i nieprzewidywalne zachowania. Pokazuje też, że marketing producenta nie zawsze odbija rzeczywiste możliwości. Dla użytkowników i organizacji wdrażających te narzędzia stanowi to przypomnienie, by dokładnie testować modele przed poleganiem na nich w krytycznych aplikacjach.