Artykuł proponuje nowe metody oceny, czy systemy AI polegające na regułach są rzeczywiście defensowne i niezawodne, zamiast pozornie zgodne z zasadami. Badania ujawniają problemy z bezpieczeństwem AI
Badania
arXiv CS.AI
Artykuł proponuje nowe metody oceny, czy systemy AI polegające na regułach są rzeczywiście defensowne i niezawodne, zamiast pozornie zgodne z zasadami. Badania ujawniają problemy z bezpieczeństwem AI