Mistral zaprezentował Voxtral, zaawansowany system text-to-speech łączący architekturę autoregresywną z flow-matching, który zmniejsza lukę w wyrażaniu emocji i naturalności wypowiedzi w klonowaniu głosu. System obsługuje wiele języków i wykorzystuje hybrydowe podejście do lepszego odwzorowania cech głosu oraz intonacji. Technologia ta ma potencjał do transformacji aplikacji wymagających naturalnego, wielojęzycznego syntezu mowy.