Badacze opracowali agenta wzmacniającego (RL), który uczy się pobierać istotne długoterminowe wspomnienia w celu poprawy dokładności odpowiadania na pytania przez duże modele językowe.