Adobe a profité de sa conférence MAX pour présenter certains de ses travaux. Le projet VoCo a impressionné l’auditoire. A l’image du célèbre logiciel Photoshop, VoCo a l’ambition de devenir la référence en matière de synthèse vocale. L’une de ses fonctionnalités permet d’imiter la voix de l’utilisateur pour prononcer des mots.
Le Projet VoCo est en cours de développement. Il est le fruit d’une collaboration entre les équipes de recherche d’Adobe et l’université de Princeton. D’apparence, il se montre assez similaire à d’autres applications spécialisées dans le domaine mais il s’agit que d’une apparence.
L’une de ses fonctionnalités a particulièrement étonnée. Adobe la résume ainsi
« Nous avons développé une technologie permettant de taper simplement les mots que vous voulez changer dans la synthèse vocale […] L’algorithme fait le reste et génère des mots qui semblent provenir de la personne d’origine ».
En clair, le logiciel est capable de modifier une phrase pour y ajouter ou y retirer des mots tout en conservant la voix d’origine. La diction, la tonalité, les effets seraient quasiment parfaits bien que le phare modifiée n’a jamais été prononcée par l’utilisateur.
Le programme a ainsi la capacité de modifier un contenu audio en générant par exemple de nouveaux mots qui semblent venir du locuteur. Le plus impressionnant étant le fait que l’empreinte vocale d’origine est conservée.
Pour le moment VoCo est un projet en cours de développement. Ses prouesses demandent de la puissance en calcul et du temps. Pour parvenir à maitriser l’empreinte vocale d’un utilisateur une analyse d’un enregistrement de sa voix d’une vingtaine de minutes est nécessaire.
Il y a aussi beaucoup de question autour de son arrivée sur le marché. Sa faculté de transformer des propos n’est pas anodine. Que va-t-il se passer autour de la crédibilité des déclarations et des enregistrements dits officiels. Comment le prouver ? Comment s’assurer de véracité et de l’authenticité ?
Nvidia se prépare à lancer la GeForce RTX 5080. Les rumeurs confirment en partie de… Lire d'avantage
Microsoft prépare des améliorations pour Windows 11. Elles affinent l'expérience utilisateur et introduire des fonctionnalités… Lire d'avantage
La mise à jour Windows 11 KB5048667 serait à l'origine de problèmes d'installation et d'une… Lire d'avantage
Le HDMI Forum prévoit de dévoiler officiellement la spécification de l'HDMI 2.2 lors d’une conférence… Lire d'avantage
Les cartes mères LGA 1851 équipées du chipset Intel B860 commencent à apparaître. La ROG… Lire d'avantage
L’utilitaire GPU-Z évolue en version 2.61. Le focus concerne la prise en charge de nouveaux… Lire d'avantage
Voir commentaires
C'est clair! La quasi totalité des articles des sites de news tech et geek sont bardés de fautes qui font saigner les yeux! Il n'y a amais de relecture?
Est-ce qu'il n'y aurait pas une erreur de frappe dans le titre ?
Le problème c'est que cette application laisse la porte ouverte à bien des dérives!Je rêve ou il n'y a que moi qui m'en aperçoit?
Logiciel trés dangereux, ont peux vous faire dire ce que vous n'avez pas dit, quand il y aura des probleme avec les écoutes qui va jugez si c'est bien votre voix ou celle de la machine.
On va nous dire que c'est que pour l'amusement, mais tout le monde connait les dérives que cela peux prendre.
Deux choses à ceux qui craignent des dérives :
1) Si vous regardez la version intégrale (https://youtu.be/I3l4XLZ59iwhttps://youtu.be/I3l4XLZ59iw?t=5m52s), Zeyu Jin (celui qui présente le projet VoCo) précise que l'équipe de développement a déjà recherché une contre-mesure similaire aux watermarks, permettant ainsi de distinguer les originaux des parodies ;
2) VoCo est inspiré de PhotoShop, qui permet à tout utilisateur de réaliser le même genre de prouesses sur des photos depuis plusieurs années déjà, il est donc un peu tard pour s'inquiéter.