Naukowcy zaproponowali nową rodzinę metryk ECUAS_n do systematycznej evaluacji systemów AI, które operują niepewnością w swoich prognozach. Metryki te umożliwiają obiektywne mierzenie, jak dobrze system radzi sobie zarówno w dokładności przewidywań, jak i w wiarygodności szacowania swojej pewności. To ważne dla bezpieczeństwa AI, ponieważ pozwala na lepszą ocenę, czy systemy uczą się być ostrożne w trudnych sytuacjach. Standaryzowana evaluacja może przyczynić się do bardziej niezawodnych i przej