Gemini 3.5 Flash może widzieć i kontrolować Twój ekran

Google wbudowało funkcję kontroli komputera bezpośrednio w Gemini 3.5 Flash, zastępując tym samym oddzielny model dedykowany do tego zadania. Ta zdolność pozwala agentom AI widzieć zawartość ekranu, klikać myszką, pisać na klawiaturze i przewijać strony w przeglądarce, a także na urządzeniach mobilnych i desktopach. Gemini 3.5 Flash to najszybszy agentic AI model, jaki Google zaprezentował na konferencji I/O 2026.

Wbudowanie computer use bezpośrednio w Gemini 3.5 Flash to znaczący krok w upowszechnieniu zdolności agentów AI do automatyzacji zadań na poziomie interfejsu użytkownika. Poprzednio ta funkcjonalność była dostępna tylko jako odrębny, wyspecjalizowany model, co skomplikowało integrację dla przedsiębiorstw. Teraz staje się standardowym narzędziem dostępnym dla każdego kto używa tego modelu, co powinno przyspieszyć wdrażanie automatyzacji w korporacyjnych systemach.

Google intensywnie pracuje nad zdobyciem zaufania sektora enterprise do swoich rozwiązań AI. Integracja computer use w jeden model zamiast konieczność zarządzania wieloma narzędziami ma uprościć deployement i zmniejszyć obawy związane ze złożonością systemów. To typowe dla Google podejście - najpierw wykazać, że technologia działa, potem cierpliwie budować ekosystem rozwiązań, który będzie naturalny dla dużych organizacji.