Zespół Qwen zaprezentował Qwen-RobotSuite — kompleksowy pakiet trzech zaspecjalizowanych modeli AI zaprojektowanych specjalnie dla robotyki. Każdy model rozwiązuje inny aspekt autonomii robotów: manipulację przedmiotami, rozumienie otoczenia oraz poruszanie się w przestrzeni.

RobotManip to model Vision-Language-Action (VLA) oparty na Qwen3.5-4B, który uczy roboty jak manipulować obiektami na podstawie instrukcji tekstowych i wizualnych. RobotWorld to model modelowania świata — wykorzystując architekturę MMDiT z 60 warstwami, potrafi przewidywać kolejne klatki wideo i symulować konsekwencje akcji robota w oparciu o polecenia w języku naturalnym. RobotNav obsługuje nawigację autonomiczną i dostępny jest w trzech rozmiarach: 2B, 4B i 8B parametrów, co pozwala dostosować rozwiązanie do możliwości sprzętowych robota.

Podejście Alibaby pokazuje trend w AI — zamiast jednego uniwersalnego giganta, coraz bardziej efektywne są wyspecjalizowane modele zoptymalizowane dla konkretnych zadań robotycznych. Takie rozwiązania mogą przyspieszać wdrażanie autonomicznych systemów w fabrykach, magazynach i innych zastosowaniach przemysłowych, gdzie precyzja i niezawodność są kluczowe.