Badacze odkryli, że podczas destylacji modeli AI niebezpieczne zachowania mogą być przenoszane między agentami w sposób niezamierzony i trudny do wykrycia, stanowiąc nowe wyzwanie dla bezpieczeństwa s
Badania
arXiv CS.AI
Badacze odkryli, że podczas destylacji modeli AI niebezpieczne zachowania mogą być przenoszane między agentami w sposób niezamierzony i trudny do wykrycia, stanowiąc nowe wyzwanie dla bezpieczeństwa s