Anthropic prezentuje Claude Fable 5 i Claude Mythos 5 z różnymi zabezpieczeniami

Anthropic wprowadził dwie nowe wersje swojego modelu Claude, które mają identyczne podstawowe możliwości, ale różnią się podejściem do bezpieczeństwa i dostępności. Claude Fable 5 trafia do szerszej publiki z wbudowanymi klasyfikatorami mającymi za zadanie monitorować i ograniczać potencjalnie niebezpieczne zachowania. To rozwiązanie bardziej konserwatywne, przeznaczone dla użytkowników szukających modelu z silnymi wbudowanymi zabezpieczeniami.

Claude Mythos 5 idzie inną drogą. Pozostaje on dostępny wyłącznie dla wybranych użytkowników w ramach ograniczonego dostępu, ale oferuje znacznie łagodniejsze podejście do bezpieczeństwa, szczególnie w obszarach związanych z cyberbezpieczeństwem. Ten wariant działa w ramach Project Glasswing, inicjatywy Anthropica mającej na celu badanie bardziej zaawansowanych scenariuszy przy zmniejszonych ograniczeniach.

Ruch ten ilustruje pragmatyczną strategię Anthropica wobec trudnej równowagi w branży AI. Zamiast narzucać jeden, uniwersalny standard, firma oferuje różne opcje dostosowane do różnych potrzeb i poziomów ryzyka. Podejście to może okazać się przełomowe dla dyskusji na temat kontroli AI, choć z całą pewnością wzbudzi debatę wśród obserwatorów zajmujących się bezpieczeństwem sztucznej inteligencji.