Google zaprezentował Gemini 3.5 Live Translate, nowy model sztucznej inteligencji zdolny do translacji mowy w trybie streaming. System automatycznie konwertuje mówę w jednym języku na mowę w innym, pracując równocześnie — opóźnienie wynosi zaledwie kilka sekund w stosunku do mówiącego. To oznacza naturalną, płynną konwersację bez konieczności czekania na koniec zdania.
Model obsługuje ponad 70 języków, co czyni go narzędziem o niezwykle szerokim zasięgu. Dostęp do technologii będzie możliwy na kilka sposobów: deweloperzy będą mogli integrować funkcjonalność poprzez Gemini Live API, a użytkownicy spotykają ją w aplikacjach Google Meet i Google Translate. To pragmatyczne podejście — zamiast czekać na osobne narzędzie, Google wbija tę technologię wprost w produkty, z których ludzie już korzystają.
Ulepszona wersja Gemini 3.5 po raz kolejny pokazuje, jak szybko ewoluuje branża tłumaczenia AI. Model nie tylko rozpoznaje mowę, ale też ją generuje w wysokiej jakości, co wymaga pracy na kilku warstwach jednocześnie. Dla biznesu oznacza to szansę na łatwiejsze międzynarodowe spotkania i komunikację, a dla osób podróżujących — bardziej naturalne rozmowy bez sztywnych, spóźnionych odpowiedzi.