Badacze z arXiv pracowali nad problemem generowania realistycznych sztucznych danych dotyczących przemieszczania się ludzi. Zamiast zbierać drogi, czasem i lokacje z rzeczywistych użytkowników — co jest kosztowne i podnosi obawy o prywatność — team stworzył TrajGenAgent, agent oparty na dużych modelach językowych, który potrafi to robić bez modyfikacji samego modelu.

System działa w dwóch etapach. Pierwszy to generator LLM, który na podstawie historycznych danych tworzy łańcuch aktywności dostosowany do konkretnej osoby i dnia tygodnia. Drugi to workflow deterministyczny, który każdą aktywność przekształca w pełną trajektorię: wybiera poi (punkty zainteresowania), uwzględnia dystanse, prawa fizyki ruchu i estymuje czasy trwania poszczególnych aktywności.

Kluczowa innowacja to rezygnacja z fine-tuningu modelu. Tradycyjnie takie zadania wymagały albo prompt engineeringu — który działa słabo na szczegóły przestrzenno-czasowe — albo pełnego dostosowania modelu, co jest drogie i może obniżyć jego ogólne zdolności. TrajGenAgent obchodzi ten dylemat inteligentnym podziałem pracy między inteligencję LLM a zasady mechaniki i geografii. Zespół testował system nową metodą ewaluacji opartą na detekcji anomalii, sprawdzając zarówno wiarygodność behawioralną, jak i semantyczną generowanych trajektorii.