Przegląd metod redukcji obciążenia pamięci w modelach językowych, obejmujący ekwilicję, kwantyzację i techniki low-rank.