Mistral élargit son offensive dans l’audio. Le laboratoire français a lancé Voxtral TTS, un nouveau modèle open source de synthèse vocale destiné aux assistants vocaux, au support client et plus largement aux usages conversationnels en entreprise.
Avec ce lancement, Mistral ne se contente plus d’être présent sur la transcription : il commence à bâtir une chaîne vocale plus complète, en concurrence directe avec ElevenLabs, Deepgram et OpenAI.
Voxtral TTS repose sur Ministral 3B et a été conçu dans une logique d’efficacité : Mistral affirme vouloir proposer un modèle suffisamment léger pour tourner sur des montres connectées, des smartphones, des ordinateurs portables et d’autres appareils edge, tout en maintenant des performances de haut niveau.
https://www.blog-nouvelles-technologies.fr/363527/mistral-voxtral-tts-synthese-vocale-open-source/
---
https://mistral.ai/news/voxtral-tts
https://www.youtube.com/watch?v=_N-ZGjGSVls
Mouais, j'étais heureux d'entendre l'annonce...mais les rendus sont trop robotiques, cool c'est léger mais les voix sont rincées... Même les exemples de voix françaises sont teintées d'un accent anglais