DeepL innove avec la traduction vocale en temps réel
DeepL, le service de traduction par IA reconnu, a dévoilé une avancée majeure avec l’introduction de capacités de traduction vocale en temps réel. Cette nouvelle suite d’outils, baptisée « DeepL Voice-to-Voice », vise à abolir les barrières linguistiques dans divers scénarios de communication, des réunions professionnelles aux conversations quotidiennes.
Fonctionnement et défis
La technologie fonctionne en trois étapes : la reconnaissance vocale convertit les mots parlés en texte, ce dernier est traduit par les algorithmes sophistiqués de DeepL, et enfin, le texte traduit est reconverti en parole. Le défi principal réside dans la réduction de la latence pour assurer une communication quasi instantanée. Le PDG de DeepL, Jarek Kutylowski, a souligné l’importance d’équilibrer vitesse et précision pour l’utilité de la technologie, avec l’objectif ultime de développer un modèle « de bout en bout » qui s’affranchit de l’étape intermédiaire du texte pour des résultats encore plus rapides.
Applications et déploiement
DeepL déploie ses fonctionnalités de traduction vocale à travers des applications spécifiques. « Voice for Meetings » s’intégrera aux plateformes populaires telles que Zoom et Microsoft Teams, permettant aux participants de communiquer dans leur langue maternelle lors de conférences virtuelles, avec un accès anticipé prévu en juin. « Voice for Conversations », disponible dès maintenant sur mobile et navigateurs web, est conçu pour les interactions en tête-à-tête. De plus, « Group Conversations », destiné aux ateliers et sessions de formation, sera disponible le 30 avril. Pour les entreprises souhaitant intégrer cette technologie à leurs propres produits, DeepL propose également une API.
Support linguistique et positionnement
Le service prend en charge plus de 40 langues, dont les 24 langues officielles de l’UE, ainsi que le vietnamien, le thaï, l’arabe, l’hébreu, le bengali et le tagalog. Bien qu’une étude commanditée par DeepL suggère que 96% des linguistes préfèrent leur traduction vocale par rapport à celles de Google, Microsoft et Zoom, il est à noter que cette recherche a été financée par DeepL.
Ce lancement positionne DeepL comme un concurrent sérieux dans le domaine en évolution rapide de la traduction vocale en temps réel. Alors qu’Apple et Google ont introduit des fonctionnalités similaires, souvent intégrées à leur matériel, l’accent mis par DeepL sur l’intégration professionnelle et son support pour les conversations multipartites dans des contextes d’affaires différencient son offre, visant à surmonter les limitations des solutions grand public.









