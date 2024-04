Voice Engine est le nouvel outil d’Open AI , qui va plus loin dans l’utilisation de l’intelligence artificielle. Il serait capable de cloner des voix en quelques secondes informe Open AI, le concepteur de ChatGPT.

Ce logiciel pourrait reproduire n’importe quelle voix et n’importe quel accent en seulement 15 secondes d’écoute de la voix originale. Une avancée fascinante et préoccupante.

Tout juste quelques semaines après le lancement de Sora qui permet de créer des vidéos ultraréalistes générées à partir de textes, Open AI expose fait découvrir cette fois ci des voix clonées sonnant très réalistes à l’oreille.

Le projet Voice Engine a été lancé en 2022, s’appuyant sur l’interface de programmation text-to-speech basée sur Whisper, un modèle IA de pointe conçu pour la transcription et la traduction de la parole en texte. Cette API est déjà utilisée pour la synthèse vocale par ChatGPT.

Open AI donne une démonstration du Voice Engine sur son site web:

We’re sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ

— OpenAI (@OpenAI) March 29, 2024