Google DeepMind udostępnił DiffusionGemmę – model AI 4x szybszy na lokalnych urządzeniach

Google DeepMind opublikował DiffusionGemmę – model, który przenosi technikę diffusion znanych z generowania obrazów do produkcji tekstu. Wynik? Tekst generowany jest 4 razy szybciej niż w tradycyjnych modelach, a całość może działać bezpośrednio na urządzeniu użytkownika.

Diffusion to podejście, które iteracyjnie udoskonala dane wejściowe, stopniowo zmniejszając szum. W generowaniu obrazów jest to technika sprawdzona, ale zastosowanie jej do tekstu jest relatywnie nowatorskie. Zamiast przewidywać kolejny token sekwencyjnie (tak jak robi to GPT), model może pracować równoległo, co drastycznie przyspiesza proces.

Znaczenie tego kroku wykracza poza szybkość. Model działający lokalnie oznacza mniej zależności od serwerów, niższe opóźnienia i większą prywatność użytkownika. Dla deweloperów to szansa na wdrażanie AI w aplikacjach mobilnych i edge computing bez przesyłania danych do chmury. To może być ścieżka do popularyzacji zaawansowanych modeli AI w codziennym użytkowaniu.