NVIDIA opublikowała nowy model Nemotron-Labs-Diffusion, który w jednym przebiegu forward przetworzył 6 razy więcej tokenów od konkurencyjnego Qwen3-8B. Model obsługuje trzy tryby pracy (tri-mode), co daje większą elastyczność w zastosowaniach. Innowacja ta potencjalnie przyspiesza przetwarzanie tekstu i zwiększa efektywność obliczeń, co może mieć znaczący wpływ na praktyczne użycie dużych modeli językowych w produkcji.
Badania
MarkTechPost