Nowy tracker modeli AI porównuje wskaźniki misalignment (niezgodności z zamierzonym zachowaniem) między Opus 4.8 a Claude Mythos Preview, wykazując podobne rezultaty. Badanie jest ważne dla oceny bezpieczeństwa i niezawodności nowoczesnych modeli AI, ponieważ misalignment to kluczowy wskaźnik ryzyka związanego z potencjalnymi błędami w systemach AI. Wyniki mogą wpłynąć na decyzje dotyczące adopcji tych modeli w produkcyjnych aplikacjach wymagających wysokiego poziomu niezawodności.
Przemysł
ZDNet AI