Naukowcy z Meta i Stanford zaproponowali Fast Byte Latent Transformer (FBLT), nową architekturę modelowania, która drastycznie zmniejsza wymagania dotyczące przepustowości pamięci podczas wnioskowania bez użycia tradycyjnej tokenizacji. Technologia osiąga redukcję ponad 50% poprzez przetwarzanie bezpośrednio na poziomie bajtów, co znacząco poprawia efektywność obliczeniową. Innowacja ta ma potencjał do drastycznego obniżenia kosztów wdrażania dużych modeli języka i przyspieszenia ich działania n