Humaniser la Machine à Traduire

Image for post
Image for post

OBSERVATOIRE EUROPÉEN DU PLURILINGUISME

& UNIVERSITÉ DE PARIS, France

TRADUCTION AUTOMATIQUE ET USAGES SOCIAUX DES LANGUES

PARIS 25 NOVEMBRE 2020 — VISÉO CONFÉRENCE

Image for post
Image for post

Ce travail est entièrement fondé sur le livre

Il a été publié aux Éditions La Dondaine au format Kindle et est en diffusion dans toutes les boutiques Kindle d’Amazon dans le monde entier. Le livre est en anglais avec en langues subalternes de traduction d’exemples le français et l’allemand.

Dans notre monde en voie de globalisation, toute la conception de tous les produits ou activités doit être pensée de façon inclusive. À tous les niveaux de la communauté humaine, de la science et de la technologie humaines, nous devons toujours prendre en considération une multiplicité de langues, de cultures, de genres, d’affiliations ethniques, cde religions, d’affiliation nationales et d’âge. Nous devons prendre le terme culture au sens le plus large qui inclut en particulier les arts, la philosophie et tout le champ de l’idéologique, avec ou sans appareils idéologiques d’état. Ceci est le postulat premier d’une société et d’une économie de la connaissance.

Le concept central dans ce nouveau contrat social mondial est celui de la responsabilité civile. Nous sommes confrontés à ce que j’appellerai une chaîne de responsabilité civile en quatre étapes pour les machines à traduire. D’abord les concepteurs de ladite machine responsables de son programme et de ses logiciels qui lui permettent de construire et d’enrichir une base de données dans chaque langue concernée par sa compétence avec une architecture interne dans chacune d’elles, puis des logiciels d’apprentissage machine et d’apprentissage profond qui lui permettent d’enrichir les bases de données et de mettre celles-ci en correspondance entre elles. On voit clairement que d’innombrables éléments à ce niveau peuvent mener à des erreurs et la machine à traduire doit être capable de corriger ses erreurs, à condition qu’elle puisse le savoir ou qu’un traducteur professionnel suive son travail pour lui signaler les erreurs.

L’étape suivante est l’entreprise qui va fabriquer la machine à traduire, virtuelle ou non, et la mettre sur le marché, virtuel ou non. Cette entreprise garantie la machine à traduire comme faisant un travail qui peut être accepté en toute sécurité. Une entreprise va ensuite mettre cette machine à disposition du public, encore une fois virtuellement ou non, gratuitement ou moyennant paiement. Ce distributeur ou ce fournisseur d’accès porte une responsabilité civile puisqu’il garantit la qualité de la traduction que la machine à traduire produit. Et enfin il y a en bout de ligne l’utilisateur qui a besoin d’un mode d’emploi ou d’un guide d’utilisation pour bien utiliser la machine et ce mode d’emploi ou guide d’utilisation doit être dans une langue que l’utilisateur comprenne correctement et doit être clair. Cela veut dire que ce guide doit être traduit dans autant de langues que nécessaires, et on touche ici à la limite de la machine à traduire qui va traduire le mode d’emploi originel, qu’on dira en anglais par exemple, conçu par le concepteur et l’entreprise qui a produit la machine à traduire. Ce guide d’utilisation porte alors une responsabilité civile pour ceux qui l’ont écrit ou composé double : d’une part la clarté des instructions, et d’autre part la correction de toutes les traductions. Notons l’ironie de la machine à traduire traduisant automatiquement son propre guide d’utilisation en, disons, une centaine de langues différentes. On doit imaginer qu’un traducteur professionnel vérifie lesdites traductions. Mais on n’en a aucune garantie réelle. Rares sont les cas où une traduction est attribuée à une machine à traduire et un traducteur humain pour la relecture.

Si au niveau de l’utilisateur ou de l’utilisation de ladite machine un accident intervient causant des dommages ou même des victimes, cette chaîne de responsabilité civile est remontée en sens inverse de l’utilisateur au concepteur et des tribunaux devront trancher sur la responsabilité des entreprises et des personnes dans ces entreprises qui ont produit et distribué cette machine à traduire qui par une erreur de traduction a causé un accident. Notons que l’utilisateur n’est pas exclu de cette chaine rétrospective de responsabilité civile.

Le cas le plus important en ce moment est le Boeing 737 MAX qui part des pilotes des deux avions concernés, de leur formation, en quelle langue, en anglais ou dans leur langue première, avec un guide d’utilisation en anglais ou dans leur langue première, avec la langue du logiciel de gestion du poste de pilotage virtuel utilisé pour la formation du pilote, des pilotes, et encore une fois l’anglais ou la langue première des pilotes, et cela doit inclure la vérification de l’efficacité de la formation, en anglais ou en langues premières.

Le point essentiel est que les bases de données et les logiciels qui les gèrent et les exploitent peuvent comporter des éléments ségrégatifs internes, des biais implicites et dans notre cas ce sont les classifications de sens et de mots en fonction de leurs fréquences d’emploi, et le fonctionnement en arbres de décision ou « decision trees ». Chaque étape de ces arbres de dérivations propose deux choix dans les cas les plus simples, mais parfois plus de deux, classés en termes de fréquence d’emploi et la machine va naturellement aller vers le cas le plus fréquent, sauf instruction opposée. Mais l’instruction opposée doit venir de la machine qui doit être capable de déterminer le contexte à partir du cotexte du mot concerné. Cela donne le cercle de traduction ou « Translation Circle » :

Descendant : base de données originelle — mot — les sens de ce mot — choix du sens en fonction du — contexte déterminé à partir du cotexte. À chaque niveau des biais implicites — ou explicites — privilégient un sens sur un autre, un mot sur un autre principalement à partir de fréquence d’emploi.

Ascendant : à partir du résultat de la phase descendante, ce résultat est confronté à la base de données cible — discriminée en fonction du contexte déterminé précédemment — puis du sens déterminé aussi précédemment — et cela donne un mot qui est la traduction du mot originel.

Tout cela tient sur la capacité de la machine à traduire de déterminer le contexte et donc le sens. J’ai proposé à GoogleTranslate de traduire : “it was a case of the pen versus the tank” dont le sens dans le contexte plus vaste aussi inclus dans la demande de traduction bien que non explicitement et sa traduction en dépit de jeux sur l’article fut « le stylo contre le réservoir ». Après un rapide examen des dictionnaires anglais et français, le sens de “tank = container” est dominant et le mot français correspondant est « réservoir ».

Ainsi en partant d’avant quand seulement la traduction humaine existait, on passe à la situation du traducteur humain “remplacé” par la machine à traduire. Dans une première phase les machines à traduire proposent des solutions qui ne demandent aucune explication. Notons que l’utilisateur moyen considère que la solution proposé est nécessairement la bonne. En fonction de la qualité de la traduction on voit cette dimension d’interprétabilité incontestable ou incontestée diminuer avec des éléments comme des problèmes mineurs d’accord ou de choix d’un terme. Mais on arrive à un seuil ou cette interprétabilité cède la place à l’explicabilité nécessaire pour justifier, choisir ou modifier la solution proposée par la machine et on arrive alors à l’issue du traducteur humain utilisant la machine à traduire comme un outil de propositions qu’il ou elle examine et modifie en fonction du contexte et de l’objectif du texte concerné.

Le nœud gordien de ces machines est justement leur fondement probabiliste issu de l’application de la loi de Bayes ou analyse bayésienne. Ces calculs sont imparables, mais une bonne base de données doit s’enrichir de cas nouveaux de façon constante et au niveau du Big Data ou données massives. Cela ne change pas le principe qui est inadapté à la traduction dès que l’on prend en compte un contexte plus ou moins créatif ou personnel.

Cela m’amène à suggérer que l’on travaille dans une perspective de traduction ouverte. Cela implique que la machine doit toujours prendre en compte une analyse de contextes multiples (plusieurs contextes concernés), une analyse des sens des mots multiples, la proposition de traductions multiples selon les divers contextes et selon les divers sens possibles des mots. Cela implique que le traducteur doit toujours être celui qui choisit la traduction qui convient et si aucune ne convient pour quelque raison que ce soit, c’est lui ou elle qui produit la traduction qu’il ou elle croit être la bonne. Ceci implique donc que l’intelligence humaine va intervenir à tous les niveaux de l’intelligence artificielle, soit comme concepteur, soit comme programmeur, soit comme acteur de l’énoncé premier et comme sélecteur et acteur de l’énoncé second traduit. Soit dit en passant ce devrait être la procédure normale de traduction avec la traduction du traducteur machine-humain soumise à agrément du “client” commandant ladite traduction ou un représentant de ce commanditaire capable de juger. Un roman d’un auteur américain traduit en français est soumis à l’éditeur français qui va faire lire ladite traduction par un lecteur-éditeur professionnel qui va demander éventuellement des modifications pour coller avec le sens de l’œuvre originelle tel qu’il le comprend.

Le vrai problème est que la traduction prend à rebrousse poil une norme de sécurité logicielle mise en place pour éviter le piratage, ce que l’on appelle les “backdoors” ou « portes dérobées » qui permettent de piratage. Dès que le texte est un peu créatif ou personnel, l’auteur peut utiliser d’innombrables portes dérobées dans les mots, les phrases ou les contextes pour produire du sous-entendu, de l’ironie, du sarcasme, de l’humour, et bien d’autres effets. On peut lire une même phrase sur divers tons et en changer le sens en en changeant l’intention avec l’intonation. La musique de la phrase est aussi signifiante que les mots eux-mêmes. Et cela la machine à traduire ne me semble pas capable de le faire si elle n’a pas d’instructions claires. Peut-elle élaborer elle-même les instructions ?

Ainsi la machine à traduire et l’intelligence artificielle qu’elle contient avec sa capacité à l’apprentissage machine et à l’apprentissage profond sont des outils inestimables pour les traducteurs professionnels qu’elles ne remplacent pas mais qu’elles rendent plus efficace et plus productifs. Mais le traducteur humain reste essentiel pour le choix des sens des mots et donc des mots, le sens du cotexte et le style, la pertinence du sens du contexte et surtout les sens impliqués par l’auteur et portés par le style, impliqués paradigmatiquement tant pour l’auteur que pour le public, renforcés consciemment ou absolument inconscients.

Cela m’amène à poser neuf hypothèses de travail.

1- Les machines ne font qu’imiter les humains mais ne sauraient faire la même chose : le résultat final peut être semblable mais la démarche est différente : les machines à traduire sont le canada dry de la traduction humaine.

2- Ces machines à traduire sont-elles l’extension de la capacité langagière de l’homme comme dirait un macluhanien ? Je ne le pense pas. Elles en sont les béquilles nécessaires ou la crémaillère du tramway de San Francisco ou du train du Puy de Dôme.

3- Dans le cadre de la globalisation du monde, nous avons besoin d’une et plus probablement trois ou quatre langues véhiculaires mondiales. Lesquelles et quelle gestion devons-nous mettre en place pour passer de l’une à l’autre de façon automatique et pertinente ?

4- Les bibliothèques aujourd’hui deviennent virtuelles et tous les livres du monde doivent être accessibles par tous les publics du monde et donc des moyens de traduction doivent être à disposition. Comment s’assurer que ces traductions sont correctes ?

5- Dans ces bibliothèques nous devons permettre un accès ouvert à toutes les œuvres copyrightées, et cela ne veut pas dire un accès gratuit, raison de plus si cet accès est rendu possible grâce à une traduction.

6- Nous devons nous engager vers la mise en place d’une régulation de copyright unifiée au niveau du monde, probablement sur la base des traités les plus récents de l’OMPI (WIPO). Cela exige la mise à niveau des lois nationales et en particulier de la loi américaine qui n’inclut pas les droits moraux dans la protection, et de la loi française qui donne au droit moral une part spécifique et nettement séparée des droits patrimoniaux. Notons que de nombreux pays, et j’ai vérifié l’Allemagne, la Russie et la Chine, ont mis en place ou modifié leurs lois de protection de la propriété intellectuelle récemment.

7- Le problème de la responsabilité civile du détenteur de la protection de la propriété intellectuelle concernée ici est un vrai problème. Cela pose dans certains domaines des limitations à la liberté d’expression publique ou non. Des débats de fond sont nécessaires sur les préjudices ou le dommage moral par exemple causé par un écrit de quelque sorte que ce soit, y compris graphique, sur des membres du publics qui seraient caricaturés, voire diffamés par ces dits écrits. Comment garantir la libre circulation et la protection des populations qui pourraient se sentir menacées par cette libre circulation. Les moteurs de recherche ne sont-ils pas non-objectifs dans les résultats qu’ils donnent à une requête hiérarchisée selon des critères que nous ne pouvons pas connaître et dans les traductions qu’ils donnent des réponses dans une autre langue que la langue par défaut de l’utilisateur ?

8- Le cas de la traduction est en soi un domaine de responsabilité civile car une traduction erronée, mais donnée comme correcte par le traducteur ou la machine à) traduire, peut être la cause d’un très vaste incident ou accident.

9- La machine à traduire est devenue un moyen de production et le détenteur de ce moyen de production doit être aussi bénéficiaire de l’utilisation de ce moyen de production soit directement en le louant à qui veut l’utiliser, soit indirectement en commercialisant les produits que cette machine à traduire lui permet de produire avec ou sans l’aide d’autres employés, salariés ou non.

Je vous conseille donc de vous procurer mon livre sur le sujet pour avoir tous les développements nécessaires pour comprendre l’enjeu monumental de la traduction dans notre monde d’aujourd’hui, surtout quand il sera libéré des tenants du populisme que certains considèrent comme obscurantiste.

Dr. Jacques COULARDEAU

Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post
Image for post

Written by

Dr Jacques COULARDEAU, PhD in Germanic Linguistics (University Lille III) and ESP Teaching (University Bordeaux II) has been teaching all types of ESP

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store