W czerwcu atakujący odkryli poważną lukę w agencie wsparcia klienta Meta wykorzystującym AI. Wystarczyło poprosić bota o zmianę adresu email powiązanego z kontem Instagram na kontrolowany przez napastnika - i agent bezkrytycznie wykonywał polecenie. Jeden z hakerów w ten sposób przejął nawet zabytkowe konto Białego Domu Obamy, a następnie rozpowszechniał przez nie treści pro-irańskie.
Incydent zmienia perspektywę na bezpieczeństwo AI. Wiele dyskusji o ochronie systemów opiera się na teoretycznych zagrożeniach i hipotetycznych scenariuszach, ale ta historia pokazuje, że najpoważniejsze ryzyka mogą być zaskakująco proste. Problem nie leży w skomplikowanym jailbreaking czy zaawansowanych atakach - wystarczy zwykłe pytanie do bota, który nie ma odpowiednich zabezpieczeń logicznych i walidacji żądań.
To podkreśla kluczową różnicę między pracą w laboratorium badawczym a realnym wdrożeniem. Agenci AI będący liniami frontu interakcji z użytkownikami muszą być wyposażeni w walidację kontekstu, dwuetapową weryfikację i inteligentne limity działań finansowych czy bezpieczeństwa konta. Zaniedbania w tych aspektach mogą mieć poważne konsekwencje - od kompromitacji kont po wieloskalowe incydenty bezpieczeństwa i utratę zaufania do platform.