Adobe a profité de sa conférence MAX pour présenter certains de ses travaux. Le projet VoCo a impressionné l’auditoire. A l’image du célèbre logiciel Photoshop, VoCo a l’ambition de devenir la référence en matière de synthèse vocale. L’une de ses fonctionnalités permet d’imiter la voix de l’utilisateur pour prononcer des mots.
VoCo, l’empreinte vocale d’un utilisateur imitée à la perfection ?
Le Projet VoCo est en cours de développement. Il est le fruit d’une collaboration entre les équipes de recherche d’Adobe et l’université de Princeton. D’apparence, il se montre assez similaire à d’autres applications spécialisées dans le domaine mais il s’agit que d’une apparence.
L’une de ses fonctionnalités a particulièrement étonnée. Adobe la résume ainsi
« Nous avons développé une technologie permettant de taper simplement les mots que vous voulez changer dans la synthèse vocale […] L’algorithme fait le reste et génère des mots qui semblent provenir de la personne d’origine ».
En clair, le logiciel est capable de modifier une phrase pour y ajouter ou y retirer des mots tout en conservant la voix d’origine. La diction, la tonalité, les effets seraient quasiment parfaits bien que le phare modifiée n’a jamais été prononcée par l’utilisateur.
Le programme a ainsi la capacité de modifier un contenu audio en générant par exemple de nouveaux mots qui semblent venir du locuteur. Le plus impressionnant étant le fait que l’empreinte vocale d’origine est conservée.
VoCo, un projet en développement
Pour le moment VoCo est un projet en cours de développement. Ses prouesses demandent de la puissance en calcul et du temps. Pour parvenir à maitriser l’empreinte vocale d’un utilisateur une analyse d’un enregistrement de sa voix d’une vingtaine de minutes est nécessaire.
Il y a aussi beaucoup de question autour de son arrivée sur le marché. Sa faculté de transformer des propos n’est pas anodine. Que va-t-il se passer autour de la crédibilité des déclarations et des enregistrements dits officiels. Comment le prouver ? Comment s’assurer de véracité et de l’authenticité ?
C’est clair! La quasi totalité des articles des sites de news tech et geek sont bardés de fautes qui font saigner les yeux! Il n’y a amais de relecture?
Est-ce qu’il n’y aurait pas une erreur de frappe dans le titre ?
Le problème c’est que cette application laisse la porte ouverte à bien des dérives!Je rêve ou il n’y a que moi qui m’en aperçoit?
Logiciel trés dangereux, ont peux vous faire dire ce que vous n’avez pas dit, quand il y aura des probleme avec les écoutes qui va jugez si c’est bien votre voix ou celle de la machine.
On va nous dire que c’est que pour l’amusement, mais tout le monde connait les dérives que cela peux prendre.
Deux choses à ceux qui craignent des dérives :
1) Si vous regardez la version intégrale (https://youtu.be/I3l4XLZ59iwhttps://youtu.be/I3l4XLZ59iw?t=5m52s), Zeyu Jin (celui qui présente le projet VoCo) précise que l’équipe de développement a déjà recherché une contre-mesure similaire aux watermarks, permettant ainsi de distinguer les originaux des parodies ;
2) VoCo est inspiré de PhotoShop, qui permet à tout utilisateur de réaliser le même genre de prouesses sur des photos depuis plusieurs années déjà, il est donc un peu tard pour s’inquiéter.