Zaprezentowano algorytm EAGLE 3.1, ulepszony system spekulacyjnego dekodowania dla dużych modeli języka, który rozwiązuje problem tzw. attention drift podczas wnioskowania. Rozwinięcie to usprawnia efektywność inferencji LLM poprzez lepszą kontrolę mechanizmów atencji, co prowadzi do szybszych obliczeń bez utraty jakości. Innowacja ta ma znaczący wpływ na praktyczne wdrożenie zaawansowanych modeli AI, szczególnie w zastosowaniach wymagających niskich opóźnień i wysokiej przepustowości.