Naukowcy opracowali provenance-aware system oparty na grafie wiedzy, który integruje dane o bezpieczeństwie leków psychiatrycznych z trzech różnych źródeł - danych FDA, platform społecznościowych i recenzji pacjentów. Framework łączy 466525 postów z Reddita, 60782 recenzji WebMD oraz 20 lat historii zgłoszeń z U.S. FDA Adverse Event Reporting System dla dziewięciu leków przeciwdepresyjnych.
Problem stanowi fakt, że pacjenci szukają informacji o lekach online, ale wiedza o skutkach ubocznych leków psychiatrycznych jest rozproszona między autorytatywnymi, ale abstrakcyjnymi zapisami regulacyjnymi a doświadczeniami pacjentów - dobrze udokumentowanymi, ale niezwalidowanymi. W psychiatrii jest to szczególnie ważne, bo źle skontekstualizowana informacja może wzmocnić strach i prowadzić do niestosowania się pacjentów do zalecanych terapii. Stworzony pipeline do rozpoznawania encji wykorzystujący duże modele języka osiągnął najwyższe wyniki F1 na poziomie 0.969 dla leków i 0.973 dla warunków medycznych, benchmarkowane względem adnotacji lekarzy.
Wykryto również ważny wgląd: dane z komunalnych platform były znacznie bardziej zgodne między sobą (podobieństwo Jaccarda do 0.905) niż z raportami regulacyjnymi, co wskazuje, że dane generowane przez pacjentów stanowią niezależny sygnał bezpieczeństwa. Dla sertralimy wiele nowych skutków ubocznych pojawiło się w źródłach społecznościowych nawet setki dni przed odpowiadającymi im datami FDA. Graf wiedzy zbudowany w Neo4j z użyciem słowników ATC-N, ICD-10 i MedDRA zachowuje pochodzenie każdej informacji, zachowując jej sprawdzalność i jasne rozdzielenie faktów regulacyjnych od doświadczeń pacjentów.