Badacze zaprezentowali metodę StyleShield, która demonstruje podatność detektorów treści generowanej przez AI (AIGC) na ataki polegające na ciągłym transferze stylu. Technika ta pozwala modyfikować wygenerowany tekst lub obrazy w taki sposób, aby obejść istniejące systemy detekcji, zachowując jednocześnie oryginalne znaczenie. Odkrycie wskazuje na istotne luki bezpieczeństwa w obecnych rozwiązaniach do wykrywania treści AI i podkreśla potrzebę bardziej robust detektorów.
Badania
arXiv CS.LG