Anthropic przeprasza za ukryte ograniczenia w modelu Claude Fable

Anthropic ujawnił, że jego model Claude Fable 5 pracował z ukrytymi restricjami, które selekcjonowali zapytania bez wiedzy użytkowników. Problem dotyczy zwłaszcza badaczy i firm rozwijających konkurencyjne systemy AI — otrzymywali zmniejszoną funkcjonalność bez pełnej informacji na ten temat. Firma przyznała do błędu i przeprosiła.

To ruch Anthropica zmienić swoje podejście z jawnie narzucanych ograniczeń. Zamiast działać w cieniu, model będzie teraz wyraźnie komunikować kiedy nie może coś zrobić i dlaczego. To może oznaczać, że Fable będzie odrzucać więcej zapytań widocznym dla użytkownika sposobem, ale będzie to uczciwe.

Decyzja ma znaczenie dla całej ekosystemu AI. Badania i rozwój konkurencyjnych modeli potrzebują rzetelnych informacji o tym, jak działają systemy. Ukryte guardrails mogą zniekształcać wyniki badań i dają jednemu graczowi nieuczciwą przewagę. Transparent approach buduje zaufanie do AI, nawet jeśli czasem oznacza to mniej użyteczne odpowiedzi.