Voxtral Realtime: Gerçek Zamanlı Konuşma Tanıma Modeli ile Yüksek Kalite ve Düşük Gecikme
Voxtral Realtime: Gerçek Zamanlı Konuşma Tanımada Yeni Standart
Voxtral Realtime, anlık konuşma tanımada offline sistemlerle eşdeğer kaliteyi 480ms gecikmeyle sunan yeni bir model olarak duyuruldu.
Önemli Noktalar
- Voxtral Realtime, 13 dili kapsayan geniş veri setiyle eğitildi.
- 480ms gecikmede Whisper ile aynı seviyede doğruluk sağlıyor.
- Model ağırlıkları Apache 2.0 lisansı altında yayınlandı.
Teknik Detaylar
Voxtral Realtime, yerel olarak gerçek zamanlı çalışan otomatik konuşma tanıma modeli olarak tanıtıldı. Model, offline transkripsiyon kalitesini sub-saniye (
Kaynak: arxiv.org