Naukowcy przedstawili CreativityBench, nowy benchmark do oceny zdolności kreatywnego myślenia agentów AI poprzez zadania polegające na repurposingu narzędzi. System testuje, czy modele potrafią twórczo wykorzystywać dostępne zasoby w niekonwencjonalny sposób, co stanowi kluczowy aspekt inteligencji. Benchmark ma istotne znaczenie dla rozwoju bardziej elastycznych i innowacyjnych systemów AI zdolnych do rozwiązywania problemów poza standardowymi schematami.