Naukowcy z arXiv zaprezentowali Narrative-UFET, metodę rozszerzającą ultra-precyzyjną kategoryzację typów jednostek (UFET) poprzez dodanie kontekstu narracyjnego. Dotychczasowe podejścia do UFET zmagają się z typami zaliczanymi do long tail - najmniej reprezentowanymi kategoriami - ze względu na poleganie wyłącznie na kontekście na poziomie zdania. Problem w tym, że dowody pozwalające na prawidłową klasyfikację typu jednostki są rozproszone w tekście na wiele zdań, a istniejące zasoby dla UFET nie uwzględniały tej wielozdaniowej perspektywy.
Team opracował kontrolowaną rozszerzenie UFET, w którym każdej wzmiance jednostki towarzyszy automatycznie wygenerowana krótka, spójna narracja. Eksperymentowali z dwoma wariantami: Maintain, w którym typ jednostki pozostaje stały w całej narracji, oraz Change, w którym typ się zmienia. Wyniki pokazały, że kontekst narracyjny daje konsekwentne poprawy dla typów long tail w porównaniu do bazowych podejść zdaniowych, przy czym wariant Change zapewniał mocniejszy sygnał informacyjny. Porównanie względem naturalnie występujących kontekstów ujawniło, że syntetyczne narracje dają silniejsze wzrosty wydajności, sugerując że kontrolowana konstrukcja dyskursu potrafi odkrywać sygnały, które rzeczywisty tekst pozostawia w tle.
Badania wskazują na znaczące możliwości dalszych улучprowein w modelowaniu dyskursu i konstrukcji narracji. Wyniki otwierają nowe kierunki dla lepszego rozumienia, w jaki sposób szerszy kontekst pozwala modelom AI na dokładniejszą kategoryzację specjalistycznych typów jednostek, szczególnie tych rzadko występujących w danych treningowych.