Badacze zaproponowali metodę ICRL, która uczy modele AI internalizować samokrytykę poprzez reinforcement learning, zamiast polegać na zewnętrznych ocenach. Podejście to pozwala modelom samodzielnie oceniać i poprawiać swoje działania, co stanowi krok w stronę bardziej autonomicznych i samowiednych systemów. Może to znacząco wpłynąć na efektywność szkolenia AI oraz zdolność modeli do samokontroli i iteracyjnego doskonalenia się bez ciągłej ingerencji człowieka.