Naukowcy opracowali ARMOR 2025, nowy benchmark do testowania bezpieczeństwa dużych modeli językowych w scenariuszach militarnych i obronnych. Narzędzie to wykracza poza tradycyjne testy bezpieczeństwa koncentrujące się na kontekstach cywilnych, badając odpowiedź modeli na polecenia związane z wojskową taktyką, bronią i operacjami. Badanie jest ważne dla zapewnienia, że zaawansowane modele AI nie będą stanowić zagrożenia dla bezpieczeństwa krajowego i międzynarodowego.