Badacze opracowali metodę automatycznej analizy bias i sprawiedliwości przyczynowej w modelach machine learning przy wykorzystaniu dużych modeli językowych do generowania raportów. Podejście to umożliwia wykrywanie i dokumentowanie dyskryminacyjnych zależności przyczynowych w algorytmach bez konieczności manualnych interwencji. Praca jest istotna dla bezpieczeństwa AI, ponieważ ułatwia audyt algorytmów pod kątem bias i sprzyja przejrzystości systemów decyzyjnych w zastosowaniach wysokiego ryzyka
Badania
arXiv CS.LG