Korygowanie błędu w szacowaniu wydajności przy niezbalansowanej klasyfikacji

Badacze zajęli się problemem systematycznego niedoszacowania wydajności modeli klasyfikacyjnych w przypadku niezbalansowanych zbiorów danych, gdzie istnieje mała liczba próbek mniejszościowej klasy. Zaproponowali metodę korekcji tego błędu, szczególnie ważną gdy mniejszościowa klasa zawiera wiele podkonceptów. Problem jest istotny, bo tradycyjne metryki mogą wprowadzać w błąd, prowadząc do niewłaściwych decyzji o wyborze modelu. Rozwiązanie zwiększa wiarygodność oceny wydajności systemów ML w realnych scenariuszach z niezbalansowanymi danymi.