Google zaprezentował Gemini Omni, zaawansowany model zdolny przekształcać obrazy, audio i tekst w spójne materiały wideo. To znaczący krok w kierunku multimodalnych systemów AI, które mogą jednocześnie przetwarzać i generować różne typy danych. Technologia ta ma potencjał do революcionizowania produkcji treści, edukacji i komunikacji, choć Google zaznacza, że to dopiero początek możliwości modelu.
Przemysł
TechCrunch