Firma Zyphra wydała ZAYA1-8B, zaawansowany model Mixture of Experts (MoE) wytrenowany na procesorach AMD. Model o 8 miliardach parametrów wykazuje wydajność znacznie lepszą niż wskazywałyby na to jego rozmiary, szczególnie w zadaniach wymagających zdolności logicznego rozumowania. To ważne osiągnięcie pokazuje potencjał trenowania wydajnych modeli AI na alternatywnym sprzęcie, nie tylko procesorach NVIDIA, co może demokratyzować dostęp do tworzenia zaawansowanych systemów AI.
Badania
MarkTechPost