Badacze przedstawili MemQ, nową metodę łączącą Q-learning z agentami posiadającymi samouczącą się pamięć opartą na skierowanych grafach acyklicznych (DAG) śledzących proweniencję danych. System pozwala agentom na dynamiczne uczenie się i optymalizację działań poprzez zapamiętywanie historii decyzji. Innowacja ta ma potencjał do znacznego poprawienia wydajności agentów AI w złożonych zadaniach wymagających długofalowego planowania i adaptacji do nowych sytuacji.