OpenAI udostępnił trzy nowe modele audio działające w czasie rzeczywistym: GPT-Realtime-2, GPT-Realtime-Translate i GPT-Realtime-Whisper w ramach Realtime API. Modele umożliwiają przetwarzanie mowy na tekst, tłumaczenie i generowanie odpowiedzi w czasie rzeczywistym. Ta aktualizacja znacząco rozszerza możliwości interakcji głosowej z systemami AI, otwierając nowe aplikacje w komunikacji międzynarodowej i asystentach głosowych.
Badania
MarkTechPost