Nowy model 370M parametrów łączy spektralną pamięć z mechanizmami attention do poprawy zdolności rozumowania. Podejście osiąga efektywne wyniki na małej skali, łącząc innowacyjne techniki przetwarzani