Artykuł opisuje metodę budowania kompaktowego agenta AI łączącego widzenie, język i działanie, wykorzystującego latentne modelowanie świata i model predictive control do efektywnego sterowania robotam