Par Étienne Godin
Les comédiens doubleurs, ces voix illustres aux visages anonymes, ne cachent pas leur inquiétude devant la possibilité de plus en plus concrète que l’intelligence artificielle en vienne un jour à les remplacer. Certains envisagent une catastrophe imminente, d’autres sont plus circonspects. Trois artisans québécois parmi les plus réputés du milieu dressent un portrait de la situation.
«C’est une abomination! Ça va mettre tellement de gens sur la paille!», s’indigne la comédienne et directrice artistique Johanne Léveillé, dont la voix est associée depuis trois décennies au personnage de Bart Simpson dans la populaire série d’animation Les Simpson. Après 42 ans de carrière, elle redoute comme plusieurs de ses collègues d’être prématurément forcée à la retraite par l’IA. Depuis quelques mois, de nouvelles technologies qui permettront, dans un avenir pas si lointain, d’automatiser le doublage de productions cinématographiques font grand bruit dans le milieu.
«Il va y avoir un changement brutal et déshumanisant», prévient Tristan Harvey, un comédien bien connu pour avoir prêté sa voix à des centaines de doublages, et qui incarne notamment l’acteur américain Seth Rogen. Selon l’Union des artistes (UDA), le secteur du doublage fait travailler au Québec environ 750 acteurs spécialisés. Et c’est sans compter les directeurs artistiques, les adaptateurs de dialogues, les preneurs de son, les mixeurs, les chargés de projets et les nombreux employés de bureau.
Des inquiétudes et des réserves
Sur le site web de l’entreprise hollywoodienne Flawless AI, conceptrice de la technologie TrueSync, une vidéo promotionnelle fait miroiter une alternative au doublage traditionnel qui relevait il n’y a pas si longtemps de la science-fiction. On y aperçoit des extraits de films mettant en vedette Tom Cruise, Jack Nicholson, Tom Hanks et Robert De Niro, dans lesquels les acteurs s’expriment en une multitude de langues avec leur véritable voix. Les mouvements de bouche, retouchés par ordinateur, correspondent parfaitement à la langue dans laquelle les dialogues sont transposés. Mais Flawless AI n’est pas la seule entreprise qui s’intéresse à ce nouvel eldorado technologique, et les concurrents se multiplient.
«Je n’étais pas particulièrement inquiet jusqu’à ce que j’aille sur le site d’ElevenLabs», confie Tristan Harvey. Cette entreprise américaine, fondée en 2022 par un ex-ingénieur en apprentissage machine de Google, a mis au point les filtres vocaux qui permettent au commun des mortels d’imiter à la perfection des célébrités telles que Joe Rogan et Kim Kardashian. «On a atteint un naturel qui est un peu déconcertant. Je dirais même que c’est affolant. Et ils n’en sont encore qu’à la version bêta.»
Le désarroi de Tristan Harvey est palpable lorsqu’il explique qu’ElevenLabs offre déjà aux internautes la possibilité de faire lire n’importe quel texte anglais par l’une de ses neuf voix «artificielles», qui portent chacune un prénom différent. Ces voix n’ont rien de robotique; elles peuvent adopter un style narratif chargé d’émotions ou un ton plus neutre qui convient à la lecture d’articles de nouvelles, selon les besoins du client. «Ils ont utilisé un amalgame d’échantillons vocaux de tous les types pour créer des voix synthétiques uniques qui ne correspondent à celle d’aucun être humain particulier. C’est là que se trouve le danger. Il n’y aura plus de valeur associée à la couleur de nos voix puisqu’ils vont être capables d’en créer d’autres. Qui va survivre là-dedans? Les grandes vedettes qui ont une notoriété absolue, mais pas les doubleurs comme moi qui s’effacent derrière un personnage. On va être facilement remplaçables.»
La commercialisation à grande échelle de cette technologie en apparence révolutionnaire est-elle aussi imminente qu’on pourrait le croire? Pas selon Benoit Rousseau, qui gagne sa vie comme comédien doubleur, adaptateur de dialogues et directeur artistique depuis près de 40 ans. «D’abord, c’est un marché extrêmement niché. Ça va servir, c’est sûr, mais il y a des nuances à apporter. Ça prend un texte qui se tient. On s’imagine que l’intelligence artificielle est capable d’écrire des textes en français, mais il faut avoir une connaissance de deux cultures, des correspondances et des écarts entre les deux.»
Benoit Rousseau, qui est la voix québécoise attitrée de Nicolas Cage, Dwayne «The Rock» Johnson, Kevin Bacon et Benicio del Toro, trace un parallèle entre la langue et la musique. «Chaque langue comporte une infinité de nuances. Il faut respecter la mélodie et savoir où placer les accents toniques quand on adapte des dialogues de l’anglais au français. L’exemple qui me vient toujours en tête, c’est la fameuse réplique ‘You talkin’ to me?’ de Robert De Niro [dans le film Taxi Driver de Martin Scorsese]. Tout dépendant du mot sur lequel on appuie, la phrase veut dire quelque chose de complètement différent.» Il doute que l’intelligence artificielle soit capable de transposer de telles subtilités dans une autre langue.
Tristan Harvey abonde dans le même sens. «Il y a beaucoup d’obstacles avant que la voix de Tom Cruise puisse doubler toutes les langues du monde. Ce n’est pas aussi facile qu’on veut le faire croire.» Johanne Léveillé estime pour sa part que l’aspect intuitif de son métier peut difficilement être compris par l’IA. «Il faut rendre les émotions, les intentions, ça prend un instinct. Au-delà des contraintes techniques de notre métier, les gens oublient souvent qu’on est des artistes.»
Des considérations économiques
Benoit Rousseau émet des réserves quant à la viabilité économique des logiciels de doublage automatisé. «Ce n’est pas parce qu’on se sert d’un outil technologique ultra puissant que ça va coûter beaucoup moins cher. C’est une chose de faire un démo de 20 secondes, mais c’en est une autre de doubler un film de deux heures.» Il est tout aussi sceptique en ce qui a trait aux compétences linguistiques des gens qui seront responsables d’encadrer ces doublages automatisés. «Est-ce qu’ils seront prêts à écouter quelqu’un qui va leur dire : ‘Je m’excuse, mais ce que vous avez écrit en français n’a pas de bon sens’? Y aura-t-il quelqu’un pour le signaler ou pour l’apprendre à la machine? Ce n’est pas seulement une question de transmettre de l’information à l’IA. Si tu lui fournis des doublages de référence, d’où viennent-ils? Comment ont-ils été faits? Ça va peut-être juste cristalliser les erreurs qui existent déjà en ce moment.»
Pour sa part, Tristan Harvey s’interroge sur les coûts liés à l’utilisation par l’IA de la voix d’acteurs hollywoodiens. «Je doute que Tom Cruise va dire : ‘Prenez ma voix, transposez-la dans toutes les langues, et je ne veux pas être rémunéré davantage.’ Est-ce que ça représenterait une économie substantielle par rapport aux équipes de doublage qu’on a? Ou est-ce qu’il va demander 20 millions de plus par film? Il y a toutes sortes de questions à ce niveau qui ne sont pas réglées.»
Au bout du fil, Johanne Léveillé pousse néanmoins un long soupir. «Dans le contexte actuel, je ne suis pas mécontente d’être en fin de carrière. Si c’était à refaire et que je sortais tout juste du Conservatoire [d’art dramatique], je choisirais probablement une autre avenue.»