Badacze odkryli, że samo aktualizowanie parametrów (harness updating) w samoewoluujących agentach LLM nie gwarantuje rzeczywistej poprawy wydajności. Artykuł rozróżnia między zmianami w systemie a faktycznymi zdolnościami ewolucyjnymi, pokazując, że agenty mogą się modyfikować bez rzeczywistego polepszania. Odkrycie to ma znaczenie dla zrozumienia, jak duże modele językowe rozwijają się i doskonalą, oraz dla konstruowania bardziej niezawodnych systemów AI zdolnych do autoulepszania.