Estonia przeprowadziła kompleksowy benchmark, który testował odporność popularnych modeli AI na rosyjskie kampanie propagandowe i tzw. strategiczne narracje. Badanie oceniało, jak dobrze różne LLM-y potrafią rozpoznawać i opierać się manipulacji informacyjnej.
Wyniki pokazują znaczące różnice między modelami pod względem podatności na dezinformację. Dla niektórych systemów rosyjskie narracyjy okazywały się szczególnie efektywne, podczas gdy inne wykazywały znacznie lepszą odporność. Badania estońskiego rządu mają na celu lepsze zrozumienie potencjalnych zagrożeń, jakie rosyjska dezinformacja stanowi dla krajów NATO, zwłaszcza biorąc pod uwagę zwiększoną rolę AI w dostarczaniu informacji społeczeństwu.
Ten benchmark jest ważnym sygnałem, że odporność na propagandę i manipulacje powinny być rozpatrywane jako istotne cechy bezpiecznych systemów AI. W miarę jak modele językowo-generatywne stają się coraz bardziej rozpowszechnione, kwestia ich podatności na dezinformacyjne ataki staje się problemem strategicznym dla bezpieczeństwa narodowego.