Naukowcy z arXiv zaproponowali nowy framework formalny zwany Bounded Morality, który przepracowywuje sposób myślenia o problemach moralnych w obliczeniach. Zamiast traktować moralność jako stosowanie sztywnych reguł opartych na tradycyjnych teoriach etycznych - deontologii, konsekwencjalizmu czy etyce cnót - framework rozważa ją jako problem obliczeniowy dla agentów o ograniczonych zasobach.
Podejście opiera się na koncepcji ograniczonej racjonalności Herberta Simona. Badacze formalizują problemy moralne wzdłuż dwóch niezależnych wymiarów: breadth - zakresu moralnego, czyli liczby bytów traktowanych jako moralne, oraz depth - głębi moralnej, czyli ilości wnioskowania potrzebnego do oceny ich interakcji. Ponieważ każdy system ma skończone zasoby obliczeniowe, istnieje nieodwracalny kompromis między tymi wymiarami - nie można równocześnie uwzględniać wszystkich potencjalnych podmiotów moralnych i przeprowadzać głębokich analiz.
Framework sugeruje, że teorie etyczne to nie konkurencyjne opisy moralnej prawdy, ale lokalne strategie optymalne dostosowane do różnych scenariuszy i dostępnych zasobów. Wewnątrz tej definiowalnej przestrzeni moralnych obliczeń naukowcy formalizują pojęcia moralnego żalu i postępu moralnego w warunkach ograniczeń. Dla AI to oznacza, że wyrównanie moralne sztucznych systemów nie powinno opierać się na bezpośrednim naśladowaniu ludzkiego osądu, ale na inteligentnym skalowaniu i alokacji zdolności do przeprowadzania rozumowania moralnego.