StepFun zaprezentował Step 3.7 Flash, zaawansowany model vision-language z 198 miliardami parametrów wykorzystujący architekturę MoE (Mixture of Experts). Model jest zoptymalizowany do pracy z agentami kodującymi i workflow'ami wyszukiwania, łącząc możliwości przetwarzania obrazów z możliwościami kodowania. To znaczący krok w kierunku bardziej wydajnych i specjalizowanych modeli AI, które mogą automatyzować skomplikowane zadania wymagające zarówno analizy wizualnej, jak i umiejętności programist
Badania
MarkTechPost