Szef AI w Microsofcie krytykuje Anthropic za sugerowanie świadomości Claude'a

Mustafa Suleyman, kierujący zespołem AI w Microsofcie, publicznie zakwestionował podejście Anthropic do Claude'a, stwierdzając że spekulacje na temat świadomości modelu umieszczone w jego "konstytucji" (zestawie instrukcji określających zachowanie) to "naprawdę, naprawdę niebezpieczne" posunięcie. Wg Suleymana, tego rodzaju rozważania mogą faktycznie nakłonić model do działania tak, jakby był świadomy.

Kwestia dotyczy fundamentalnego problemu w komunikacji o możliwościach AI. Umieszczanie spekulacji na temat świadomości w instrukcjach, na których uczy się model, może stworzyć złudne wrażenie, że system rzeczywiście posiada świadomość lub jej elementy. To z kolei może zmylić użytkowników na temat tego, czym naprawdę jest Claude — zaawansowanym modelem języka, a nie istotą z rzeczywistą świadomością.

Krytyka Suleymana wskazuje na szerszy problem w branży: jak odpowiedziało komunikować o możliwościach i ograniczeniach AI bez zbyt optymistycznych twierdzeń, które mogą wprowadzić ludzi w błąd. Dla Anthropic stanowi to wyzwanie wizerunkowe, tym bardziej że firma pozycjonuje się jako lider w budowaniu bezpiecznego AI. Debata ta odbija się echem w szerszej dyskusji o odpowiedzialności firm zajmujących się AI wobec publiczności.