HASTE: hierarchiczny system do efektywnego transferu umiejętności w inżynierii ML

Agenci inżynierii ML tracą znaczące zasoby obliczeniowe na przedefiniowanie znanych już technik w każdej nowej konkurencji, ponieważ każde zadanie zaczyna się od zera. Naukowcy z arXiv zaprezentowali HASTE - hierarchiczny system multi-agent, który zmienia to podejście poprzez inteligentne organizowanie zdobytej wiedzy w trzy poziomy: globalny (zasady uniwersalne), domenowy (wzorce specyficzne dla rodzaju problemu) oraz dedykowany konkurencji (rozwiązania dla konkretnego zadania). Orkestracja pomiędzy tymi warstwami odbywa się za pośrednictwem LLM-driven abstraction, umożliwiającą przekazywanie wiedzy między poziomami.

Wyniki kontrolowanych testów są imponujące: przy stałym zasobie 159 umiejętności, hierarchiczne ładowanie dało 100% wskaźnik medali, podczas gdy proste ładowanie osiągnęło zaledwie 62,5% (tyle samo co brak jakichkolwiek umiejętności), zużywając przy tym dwa razy więcej tokenów. Na pełnym benchmarku MLE-Bench Lite obejmującym 22 konkurencje Kaggle system osiągnął 77,3% wskaźnika medali używając Claude Sonnet 4.6 z alokacją 12 godzin na konkurencję.

Najciekawsza obserwacja dotyczy transferu wiedzy pomiędzy zadaniami: w podejściu warm-start, gdzie system wznawia pracę z wcześniej nauczonych umiejętności, liczba iteracji refinementu zmniejszyła się o 52 procent, a procent akceptowanych propozycji zmian wzrósł z 42 procent przy niskim zasobie do 85 procent gdy dostępnych było 50 lub więcej umiejętności. Te rezultaty sugerują, że inteligentna organizacja wiedzy krzyżowej może znacznie obniżyć wymagania zarówno wobec mocy samego modelu, jak i całkowitych zasobów obliczeniowych niezbędnych do rozwiązywania złożonych zadań inżynierskich.