W coraz bardziej zaawansowanych systemach agentowych role się odwracają: sztuczna inteligencja działa niezależnie w imieniu użytkownika, a ludzie stają się wsparciem wokół niej. To zmienia perspektywę wsparcia decyzyjnego — klasycznie badaczy interesowało, jak człowiek korzysta z modeli ML. Teraz pytanie brzmi: jak zapewnić, żeby agent bezpiecznie wiedział, kiedy prosić człowieka o radę?
Zadanie jest mniej oczywiste niż mogłoby się wydawać. Agenty nie mogą prosić o pomoc przy każdej decyzji — to byłoby nieefektywne. Z drugiej strony, nie mogą też działać całkowicie samodzielnie i ryzykować poważne błędy. Naukowcy sformułowali to jako problem optymalizacji: znaleźć strategię, która minimalizuje zbędne prośby o wsparcie, jednocześnie maksymalizując trafność. Kluczowym miernikiem jest "counterfactual missed-support error" — prawdopodobieństwo, że agent podejmie samodzielną decyzję, która byłaby lepsza, gdyby poprosił o pomoc.
Proponowane rozwiązanie opiera się na prostej, ale eleganciej regule: próg decyzyjny na wartość wsparcia. Algorytm online adaptacyjnie dostosowuje ten próg, eksplorując losowo, by nauczyć się, kiedy rzeczywiście warto prosić o interwencję. Dodatkowa technika "kalibracji na bieżąco" zmniejsza niepotrzebne prośby już podczas działania systemu. Podejście działa bez założeń o rozkładach danych — praktyczne dla zmiennych, rzeczywistych scenariuszy.