samedi 24 mai 2014

Une expérience avec GoogleTranslate

Parmi les questions que me posent parfois des enfants, plus rarement des adultes (mais ça arrive), il y a celle-ci : "Mais à quoi servent encore les traducteurs, maintenant qu'il y a Google trad ?"

Quand on me demande ça, je ne mords pas. J'explique simplement que l'intelligence artificielle ne peut pas encore remplacer l'intelligence humaine, et qu'un ordinateur a du mal à replacer un mot dans son contexte, donc à choisir parmi ses différentes significations. Par ailleurs, la grammaire étant une chose infiniment complexe, la différence entre une phrase correcte et une phrase qui ne l'est pas reste trop difficile à percevoir pour un logiciel, aussi bien conçu soit-il (les utilisateurs du correcteur grammatical de Word, d'Antidote ou de Prolexis le savent bien). Pour appuyer mes dires, je conseille souvent aux gens de tenter l'expérience : taper n'importe quel texte dans Google trad, le traduire dans deux ou trois langues différentes, et ensuite de nouveau en français, pour voir ce que ça donne.

J'ai essayé moi-même. Je ne suis passée que par des langues que je comprends au moins un petit peu, pour détecter ce qui avait pu induire la machine en erreur. Le résultat est certainement moins drôle que si on passait par des langues à la structure complètement différente (chinois, arabe...), mais c'est déjà instructif.
Vous voulez voir ?

Supposons donc que je cherche un emploi et que j'écrive au ministre de la culture (il faut savoir aller droit au but) :

Bonjour, je m'appelle Fofo et je cherche un travail dans l'univers du livre, car j'adore lire : toute petite, déjà, je considérais les livres comme mes meilleurs amis. Si vous avez un poste de libraire, ou peut-être d'éditrice, ou à la rigueur de bibliothécaire à me proposer, je serais ravie de venir vous rencontrer pour vous dicter mes exigences. Bien à vous, Fofo

(Quoi, elle n'est pas bien, ma lettre de motivation ?)

Soyons simple, et commençons par traduire ça en anglais. Voilà ce que ça donne :

Hello, my name is and I Fofo looking for a job in the world of books, because I love to read: tiny, already, I thought the books as my best friends. If you have a post of librarian, or perhaps an editor, or possibly librarian to offer me, I would love to meet with you to dictate my requirements. Sincerely, Fofo

Cette première étape nous prouve à quel point les concepteurs ont fait d'immenses progrès au cours des dernières années. Franchement, je suis ébahie par la qualité du texte, et par la capacité qu'a la machine à repérer les groupes de mots. "Bien à vous" n'a pas été traduit par "Good to you", mais par une autre formule de politesse. "Tiny" ("minuscule") est certes une traduction maladroite de "toute petite" dans ce contexte, mais l'ordinateur a compris qu'il fallait prendre les deux mots ensemble ; de même pour "à la rigueur".
Du coup, je ne m'explique pas les deux fautes grossières que sont le faux-ami de "libraire" ("librarian" signifie "bibliothécaire" : d'ailleurs, ce mot est utilisé juste après, à bon escient, cette fois) et cet étrange "and I" qui s'intercale entre "my name is" et mon nom, au lieu de se trouver après ("and I am looking for..."). Ces deux fautes auraient pu être évitées, il me semble.

Continuons avec l'italien :
Ciao, il mio nome è e Fofò in cerca di un lavoro nel mondo dei libri, perché amo leggere: piccolo, già, ho pensato che i libri come i miei migliori amici. Se hai un posto di bibliotecario, o forse un editor, bibliotecario o forse per offrire me, mi piacerebbe incontrarmi con voi a dettare le mie esigenze. Cordiali saluti, Fofo

 Déjà apparaissent deux problèmes insolubles pour la machine. Comment Google pourrait-il savoir si le "you" anglais devrait être un tutoiement ou un vouvoiement, et si le "tiny" devrait être au féminin ou au masculin ? Hélas, les choix faits sont mauvais. Par ailleurs, "perhaps" et "possibly" ont été traduit par le même mot. Et "offer me" a été pris comme si "me" était le compliment d'objet direct et non indirect (pour ceux qui n'ont que des souvenirs très vagues de leurs cours de grammaire : comme si c'était moi qui était offerte, et non pas un travail qu'on offrait à moi).

On passe à l'allemand :
Hallo, mein Name ist und Fofo Suche nach einem Job in der Welt der Bücher, denn ich liebe es zu lesen: klein, ja, dachte ich, die Bücher wie meine besten Freunde. Wenn Sie ein Bibliothekar, oder vielleicht ein Editor, Bibliothekar oder vielleicht, um mich anzubieten, würde Ich mag mit dir treffen, um meine Bedürfnisse zu diktieren. Mit freundlichen Grüßen, Fofo

Une erreur rigolote : en italien, "già" veut dire "déjà", mais aussi "en effet", donc GoogleTrad a cru que c'était juste un moyen d'insister et a introduit ce "ja" (oui) inopiné. Je remarque aussi que pour une raison totalement mystérieuse, le "voi" italien, qui n'est pas un "vous" de politesse mais toujours une deuxième personne du pluriel, est devenu un "tu" ("mit dir treffen").

Un dernier petit coup en espagnol :
Hola, mi nombre es y Fofo en busca de un trabajo en el mundo de los libros, porque me gusta leer: pequeña, sí, pensé que los libros como mis mejores amigos. Si usted es un bibliotecario, o tal vez un editor, bibliotecario, o tal vez que me ofrecen, me gustaría reunirme con usted para dictar mis necesidades. Atentamente, Fofo

GoogleTrad a fait des efforts, mais ne pouvant repérer le verbe reliant le sujet et le complément au début de la deuxième phrase, il a supposé qu'il y avait un verbe "être" sous-entendu, et voilà que je demande à mon interlocuteur s'il est bibliothécaire au lieu de lui demander s'il a un poste de libraire à me proposer.
Remarquez bien que la formule de politesse finale reste d'une langue à l'autre une formule de politesse. Décidément, les concepteurs ont fait du bon boulot. Ce qui me sidère aussi, c'est que les deux "vous" du texte d'origine sont magiquement redevenus des "vous" de politesse, au singulier (usted) après avoir été du tutoiement ou du pluriel au gré des traductions. Ça tombe plutôt bien, mais ce n'est pas logique du tout.

Retour vers le français :
Bonjour, mon nom est et Fofo à la recherche d'un emploi dans le monde des livres, parce que j'aime à lire: petit, oui, je pensais que les livres que mes meilleurs amis. Si vous êtes un bibliothécaire, ou peut-être un éditeur, bibliothécaire, ou peut-être qu'ils me proposent, je voudrais vous présenter mes besoins l'exigent. Sincèrement, Fofo 

Pour rappel, mon texte d'origine :

Bonjour, je m'appelle Fofo et je cherche un travail dans l'univers du livre, car j'adore lire : toute petite, déjà, je considérais les livres comme mes meilleurs amis. Si vous avez un poste de libraire, ou peut-être d'éditrice, ou à la rigueur de bibliothécaire à me proposer, je serais ravie de venir vous rencontrer pour vous dicter mes exigences. Bien à vous, Fofo

Et voilà pourquoi il y a encore des traducteurs.


PS : Remarquez bien que si vous aviez demandé successivement à des traducteurs anglais, italien, allemand, espagnol et français de traduire tour à tour ce texte sans pouvoir prendre connaissance des précédents, vous auriez peut-être trouvé d'aussi grandes différences formelles entre le texte d'origine et celui d'arrivée qu'en passant par GoogleTranslate. Néanmoins :
-  le texte final aurait été rédigé dans un français correct ;
- il aurait voulu dire la même chose, ou quasiment, que le texte d'origine.
Avouez que ce ne sont pas vraiment des points de détail...
 

3 commentaires:

  1. " If you have a post of librarian, or perhaps an editor, or possibly librarian to offer me,"
    ... et le hasard t'a offert un libraire pour mari. (et toc)
    Google translator joue au dé, et à travers tous ces aléas* entre COD et COI, voilà qu'un petit coup de rature magique redonne du sens à l'ensemble.
    (* Si tu saisis en quoi aléas est ici une redondance, je t'offre ce que tu offres aux gens qui savent nommer les zeugmas.)

    Pour en revenir aux logiciels, je pense qu'ils fonctionnent par fréquences.
    (un peu comme il est utilise d'apprendre les 2000 mots les plus utiliser d'une langue avant de se farcir du vocabulaire aléatoire ;
    que les homonymies sont bien plus simple quand on sait quelle version est utilisée 90% du temps ;
    ou inversement le nombre de mots qui ne sont jamais utilisé que dans un sens précis ;
    que 95% du subjonctif imparfait se résume 8 formulations ;
    ... bref que le cerveau de l'apprenant relie aussi le savoir du plus simple au plus compliqué, et de ce qui sert le plus ce qui sert le moins souven.
    Un peu comme google trie les résultats par "~relevances".

    Pour résumer ma pensée, google traduction prend les dictionnaires "à l'envers". Au lieu de réfléchir à l'ensemble des sens que prend un groupe de mot, on lui a appris à foncer quand il était sûr que ça voulait dire 80% toujours la même chose. La richesse de la langue, il ne l'intègre pas au canevas.
    Sur le site où je "cueille" des ebooks, c'est un vrai champs naissant que ces études sur ces bases de données. Ca doit être le douzième livre que je vois passer sur le sujet et que je ne prends pas, (j'évite déjà les livres qui font volontairement compliquer, genre thèse de doctorant qui encule les m*uches) et parce que je ne me figure pas faire un jour ce genre de programmation (quoique...).

    RépondreSupprimer
  2. Qui ignore ce que signifie "alea jacta est" ? Pas les lecteurs d'Asterix, en tous cas ! ;-)

    RépondreSupprimer
  3. Tu as donc gagné un paquet de malabar. (c'est bien ça?)
    Hasard tient aussi possiblement son étymologie du mot "dé" en persan et en turc (zar).

    RépondreSupprimer