Google DeepMind zaprezentowała innowacyjny wskaźnik myszy zasilany sztuczną inteligencją, który wykorzystuje model Gemini do analizy kontekstu wizualnego i semantycznego wokół kursora. Narzędzie łączy percepcję wizualną z rozumieniem tekstu, umożliwiając bardziej inteligentną interakcję użytkownika z interfejsem. To ważne dla développmentu Human-Computer Interaction, pokazując praktyczne zastosowanie zaawansowanych modeli multimodalnych w codziennych narzędziach desktopowych.
Badania
MarkTechPost