Logiciels

Projet VoCo, Adobe surprend avec le Photoshop pour la voix

Adobe a profité de sa conférence MAX pour présenter certains de ses travaux. Le projet VoCo a impressionné l’auditoire. A l’image du célèbre logiciel Photoshop, VoCo a l’ambition de devenir la référence en matière de synthèse vocale. L’une de ses fonctionnalités permet d’imiter la voix de l’utilisateur pour prononcer des mots.

Projet Voco d’Adobe : la synthèse vocale, avec n’importe quelle voix
Projet Voco d’Adobe : la synthèse vocale, avec n’importe quelle voix

VoCo, l’empreinte vocale d’un utilisateur imitée à la perfection ?

Le Projet VoCo est en cours de développement. Il est le fruit d’une collaboration entre les équipes de recherche d’Adobe et l’université de Princeton. D’apparence, il se montre assez similaire à d’autres applications spécialisées dans le domaine mais il s’agit que d’une apparence.

Projet Voco d’Adobe : la synthèse vocale, avec n’importe quelle voix

L’une de ses fonctionnalités a particulièrement étonnée. Adobe la résume ainsi

« Nous avons développé une technologie permettant de taper simplement les mots que vous voulez changer dans la synthèse vocale […] L’algorithme fait le reste et génère des mots qui semblent provenir de la personne d’origine ».

En clair, le logiciel est capable de modifier une phrase pour y ajouter ou y retirer des mots tout en conservant la voix d’origine. La diction, la tonalité, les effets seraient quasiment parfaits bien que le phare modifiée n’a jamais été prononcée par l’utilisateur.

Le programme a ainsi la capacité de modifier un contenu audio en générant par exemple de nouveaux mots qui semblent venir du locuteur. Le plus impressionnant étant le fait que l’empreinte vocale d’origine est conservée.

VoCo, un projet en développement

Pour le moment VoCo  est un projet en cours de développement. Ses prouesses demandent de la puissance en calcul et du temps. Pour parvenir à maitriser l’empreinte vocale d’un utilisateur une analyse d’un enregistrement de sa voix d’une vingtaine de minutes est nécessaire.

Il y a aussi beaucoup de question autour de son arrivée sur le marché. Sa faculté de transformer des propos n’est pas anodine. Que va-t-il se passer autour de la crédibilité des déclarations et des enregistrements dits officiels. Comment le prouver ? Comment s’assurer de véracité et de l’authenticité ?

Jérôme Gianoli

Aime l'innovation, le hardware, la High Tech et le développement durable. Soucieux du respect de la vie privée.

5 commentaires

  1. C’est clair! La quasi totalité des articles des sites de news tech et geek sont bardés de fautes qui font saigner les yeux! Il n’y a amais de relecture?

  2. Le problème c’est que cette application laisse la porte ouverte à bien des dérives!Je rêve ou il n’y a que moi qui m’en aperçoit?

  3. Logiciel trés dangereux, ont peux vous faire dire ce que vous n’avez pas dit, quand il y aura des probleme avec les écoutes qui va jugez si c’est bien votre voix ou celle de la machine.
    On va nous dire que c’est que pour l’amusement, mais tout le monde connait les dérives que cela peux prendre.

  4. Deux choses à ceux qui craignent des dérives :

    1) Si vous regardez la version intégrale (https://youtu.be/I3l4XLZ59iwhttps://youtu.be/I3l4XLZ59iw?t=5m52s), Zeyu Jin (celui qui présente le projet VoCo) précise que l’équipe de développement a déjà recherché une contre-mesure similaire aux watermarks, permettant ainsi de distinguer les originaux des parodies ;

    2) VoCo est inspiré de PhotoShop, qui permet à tout utilisateur de réaliser le même genre de prouesses sur des photos depuis plusieurs années déjà, il est donc un peu tard pour s’inquiéter.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page