Pomiary uczciwości AI z poszanowaniem prywatności użytkowników

Zespół LinkedIn zaprezentował na arXiv metodę Privacy-Preserving Probabilistic Race/Ethnicity Estimation (PPRE), która pozwala mierzyć uczciwość algorytmów względem grup rasowych i etnicznych bez przechowywania wrażliwych danych osobowych. Podejście łączy kilka zaawansowanych technologii: bezpieczne obliczenia dwustronne, prywatność różnicową i szyfrowanie addytywne homomorficzne.

Problemu, który rozwiązuje PPRE, nikt nie powinien bagatelizować - aby mierzyć czy algorytm AI jest sprawiedliwy wobec różnych grup społecznych, trzeba wiedzieć do jakich grup należą użytkownicy. Tyle że dane o rasie i etniczności to informacje niezwykle wrażliwe, chronione prawami o ochronie danych, a ich zbieranie budzi legalny i kulturowy sprzeciw. LinkedIn połączył tutaj dwa źródła sygnałów demograficznych: estymator Bayesian Improved Surname Geocoding (na podstawie nazwiska) oraz niewielki zbiór samodzielnie raportowanych danych demograficznych od użytkowników. Wszystko to zostało przetworzone przez prywatność-zachowujące technologie, aby możliwe było mierzenie fairness bez faktycznego przechowywania nadwrażliwych informacji.

Autorzy artykułu demonstrują działanie systemu na zmianach po stronie kandydatów i widzów, a także proponują transferowalny framework dla innych instytucji chcących wdrożyć podobną infrastrukturę do pomiarów. To krok w kierunku praktycznego AI, które potrafi być sprawiedliwe bez kompromisu na prywatnością - czy rzeczywiście będzie to możliwe na skalę produkcyjną, zależy od tego czy inne firmy przejmą te praktyki.