Firma Nous Research opublikowała nową technikę o nazwie Token Superposition Training, która znacznie przyspisza pre-training dużych modeli językowych (LLM). Metoda pozwala na przyspieszenie procesu treningu do 2,5 raza dla modeli o rozmiarach od 270 milionów do 10 miliardów parametrów. Innowacja ta ma potencjał obniżyć koszty i czas potrzebny do szkolenia modeli, co może przyspieszyć rozwój nowych aplikacji AI. Odkrycie jest istotne dla całej branży, ponieważ zmniejsza zasoby obliczeniowe wymaga