MacroLens to pierwszy publiczny benchmark, który jednocześnie łączy cztery krytyczne źródła informacji dla finansowego podejmowania decyzji: historyczne ceny akcji, fundamenty finansowe z raportów, makroekonomiczne warunki rynku i teksciowe doniesienia - od SEC filings po artykuły prasowe. Benchmark obejmuje 4416 amerykańskich małych i mikro-spółek z okresu 2021-2026, zawiera 46,8 miliona faktów rachunkowych, 53 serie makroekonomiczne, 295860 dokumentów SEC, 215882 artykułów prasowych i 1130 zidentyfikowanych automatycznie zdarzeń makroekonomicznych w 49 typach.

Wielką zaletą MacroLens jest starannie rozwiązanie czterech problemów technicznych, które tradycyjnie uniemożliwiały zbudowanie kompleksowego benchmarku. Dane tekstowe musiały zostać podzielone według dat publikacji, aby uniknąć look-ahead bias. Raporty kwartalne trafiają z opóźnieniem od 1 do 90 dni, co wymaga prawidłowego obsługi w ramach czasowej. Dokumenty SEC zawierają częściową redundancję z polami numerycznymi, a makroekonomiczne regimes przeciekają między standardowymi podziałami kalendarzowymi.

Benchmark zawiera siedem zadań: prognozowanie cen, wycena spółek, predykcja zwrotów warunkowana scenariuszami makroekonomiczne, wycena nieruchomości oraz generowanie sprawozdań finansowych z fundamentów i opisów. Naukowcy ocenili 19 metod ze sześciu rodzin - od heurystyk naiwnych przez foundation models do fine-tunowanych modeli LLM i zero-shot dużych modeli językowych. Wyniki pokazują, że uwzględnienie kontekstu makroekonomicznego istotnie poprawia dokładność predykcji finansowych.