Spektralny diagram fazowy do klasyfikacji few-shot: wymiarowość, nasycenie i diagnoza reprezentacji

Badacze opracowali matematyczną metodę pozwalającą algorytmom zdecydować, kiedy przestać dodawać dane treningowe w uczeniu few-shot bez testowania na nieoznaczonych próbkach. Nowy wskaźnik nasycenia S(K) obliczany jest z efektywnego rangu pooled within-class covariance matrix i można go wyznaczyć w czasie O(d3) bezpośrednio z feature'ów, bez konieczności dostępu do classifieru czy testowych etykiet.

Walidacja na szerokim zbiorze danych - 246 obserwacjach z siedemnastu binarnych zadań klasyfikacyjnych rozciągających się na sześć datasetów - pokazała solidne wyniki. W szesnastu z siedemnastu zadań zaobserwowano dodatnią korelację Spearmana między wskaźnikiem a marginalnym wzrostem dokładności (mediana ρ = 0.811). Pooled Spearman correlation wyniosła ρ = 0.548 z wysoką istotnością statystyczną (p = 1.1 × 10-20). Model trzech faz wyraźnie oddzielił się ze względu na średnie marginalne przyrosty dokładności: 3.48% w fazie eksploracji, 2.40% w przejściu oraz 0.82% w nasyceniu - wszystkie różnice wsparte przez testy statystyczne (p ≤ 0.008).

Jako praktyczne narzędzie decyzyjne wskaźnik osiągnął AUC = 0.752, co sugeruje użyteczność dla rzeczywistych scenariuszy adnotacyjnych gdzie zasoby są ograniczone. Interesującym odkryciem jest brak monotonnej relacji między asymptotycznym efektywnym rankiem a peak accuracy (Spearman rs = 0.380, p = 0.133), co wskazuje że maksymalna dokładność nie jest wystarczającym wskaźnikiem gotowości danych do uczenia.