Nowa metoda trenowania autonomicznych agentów badawczych o mniejszych rozmiarach, która osiąga wydajność porównywalną z większymi modelami, wykorzystując zaledwie 10 tysięcy publicznie dostępnych przy