Skalowanie search-based agentic AI zwykle polega na zwiększeniu głębokości (więcej turach rozumowania) lub szerokości (więcej równoległych przebiegów). Naukowcy z CMU skupili się na drugiej strategii, ale odkryli, że standard parallel sampling ma malejące zwroty ze względu na redundancję w pierwszym turze. Problem: gdy model niezależnie próbkuje k zapytań na początek, często generuje bardzo podobne pytania, które prowadzą do pobrania nakładających się fragmentów tekstu. To zmusza kolejne turne rozumowania na tych samych informacjach.
Rozwiązaniem jest DivInit, prosty mechanizm działający bez dodatkowego treningu. Zamiast k niezależnych próbek, metoda generuje n kandydatów w jednym wywołaniu modelu, a następnie wybiera k < n z nich na podstawie różnorodności, uruchamiając je jako równoległe trajektorie. W ten sposób każdy przebieg zaczyna od innego kąta, a kolejne turne uzyskują dostęp do bardziej zróżnicowanych dowodów.
Eksperymenty na pięciu modelach open-weight (o kodzie dostępnym publicznie) i ośmiu benchmarkach pokazują, że DivInit konsekwentnie przewyższa standard parallel sampling. Średni wzrost na zadaniach multi-hop question answering to 5-7 punktów przy porównywalnym koszcie obliczeniowym. To istotne dla budowania bardziej efektywnych agentic systemów, które nie muszą znacznie zwiększać mocy przetwarzania, aby uzyskać lepsze rezultaty.