Badacz zakamuflował prompt injection bezpośrednio w kodzie oprogramowania, aby pokazać, jak łatwo jest dokonać ataków na systemy AI poprzez pozornie niewinny kod. Atak demonstruje lukę w bezpieczeństwie chain-of-thought AI — modele mogą zostać oszukane przez ukryte instrukcje wkomponowane w dane wejściowe. Odkrycie jest ważne dla bezpieczeństwa aplikacji wykorzystujących modele językowe, zwłaszcza w automatycznym kodowaniu i systemach generowania kodu.
Badania
Ars Technica