ID
15106
Introduction
Un dialogue imaginaire… synthèse de dialogues réels, pour faire le point sur ce domaine qui a suscité beaucoup d'espoirs, mais aussi beaucoup de déconvenues depuis les années 1950.

Idée reçue : La traduction automatique, on n'y arrivera jamais ?

Contenu

Comment ça, on n'y arrivera jamais ? Mais ça marche déjà ! Des millions d'internautes demandent chaque jour la traduction de millions de pages à des « serveurs de traduction automatique » gratuits, comme ceux de Systran, Reverso, Google, ou au Japon Fujitsu, Toshiba, Nec, Oki…

Oui, bien sûr… mais ce n’est pas ce que je veux dire ! En fait, ça traduit n’importe comment !

Eh bien, oui… mais que peut-on espérer ? Si on doit traduire de l'anglais vers le français « they saw many arms », comment savoir si c’est « ils scient de nombreux bras » ou « ils ont vu de nombreuses armes » ou « elles ont vu de nombreux bras », « elles [scient / ont vu] de nombreuses armoiries », etc. ? Bien des traducteurs humains, professionnels, font ainsi des contresens graves. En général, les textes qu’ils produisent respectent la grammaire, mais, au fond, cela contribue à « cacher » les contresens et faux sens ou omissions.


D’autre part, il s'agit de serveurs Web gratuits, dont le but est d’aider à comprendre « le mieux possible » des textes très divers dans des langues inconnues. Ils ne prétendent pas fournir des traductions parfaites, ni remplacer des traducteurs humains. Ce que ces serveurs fournissent peut cependant être considéré comme des « premiers jets », des « prétraductions », utilisables par des réviseurs plus experts pour produire des traductions finales de qualité professionnelle.

Mais il existe aussi des systèmes spécialisés, inconnus du grand public, qui traduisent extrêmement bien, et même mieux, et pas seulement beaucoup plus vite, que des traducteurs humains.

Vraiment ? Alors il s’agit de progrès récents, je n’en ai pas entendu parler !

En fait, ça date déjà de 30 ans. À Environnement Canada, le système TAUM-météo, qui devint METEO en 1985, fut lancé de façon opérationnelle le 24 mai 1977. Il a toujours été dédié au « sous-langage » des bulletins météo. Vers 1990, METEO traduisait 30 millions de mots par an, l’équivalent de 120 000 pages « standard ». La révision d'un bulletin traduit automatiquement prend moins d'une minute, environ 7 fois moins de temps qu'auparavant, lorsqu'il était traduit par un traducteur « junior ». C’est d'ailleurs l’un de ces traducteurs « juniors » qui était allé supplier le groupe TAUM (Traduction Automatique à l’Université de Montréal) de les délivrer de cette tâche ingrate. Cet exemple illustre aussi le fait que la traduction professionnelle est non seulement difficile, mais souvent pénible psychologiquement. Bref, ce système est équivalent à 17 traducteurs à plein temps depuis au moins 25 ans.

D'autres exemples peuvent être cités, dans le domaine des cours de la bourse, ou pour la traduction de documentations techniques.

Donc, les traducteurs humains peuvent effectivement être remplacés ! Ils ont raison d'avoir peur...

C’est vrai que beaucoup sont très réticents. Mais ils n’ont pas de quoi avoir peur, car en général ils ne sont pas en concurrence.

D’abord, aucun traducteur humain ne serait en mesure de produire en une seconde la traduction d’une page Web, même pas une traduction mot à mot…

Ensuite, bien des traducteurs professionnels utilisent en fait les systèmes de traduction automatique du commerce « configurables » (par choix des priorités de dictionnaires, insertion d’un « dictionnaire utilisateur »...) pour produire des prétraductions qu'ils peuvent ensuite post-éditer.

L’exemple de TAUM-météo montre d’ailleurs que, parfois, ce sont des traducteurs qui poussent à la construction d’un système de traduction automatique. Bien sûr, il faut ensuite les laisser utiliser ou non le système selon qu’ils décident qu’ils vont ou non gagner du temps avec lui.

Selon le niveau de qualité du premier jet, une simple révision suffit parfois, mais le plus souvent une post-édition est nécessaire. Il faut alors commencer par lire et comprendre la phrase à traduire avant de regarder la prétraduction proposée, afin de trouver comment la modifier pour obtenir le sens désiré.

Mais alors, s’il faut connaître la langue source, ça ne peut servir qu’aux bilingues !

Eh bien… oui et non ! Il y a plusieurs sortes de « traduction automatique », ou plus généralement de « traduction automatisée » ou « traduction assistée par ordinateur » (TAO), avec des buts bien différents. Classons-les par ordre de difficulté croissante pour les développeurs de systèmes :

  • aider un vrai bilingue à produire des traductions de haute qualité en lui fournissant des « prétraductions » les plus utiles possibles, ainsi que des aides sous forme de dictionnaires ;
  • aider quelqu’un à accéder à une information dans une langue qu’il ne connaît pas ;
  • aider deux personnes n’ayant pas de langue commune à communiquer (par oral, ou par écrit, en tchat) ;
  • aider une personne monolingue, ne connaissant pas ou très peu une langue étrangère, mais très bien le domaine en cause, à produire des traductions de qualité dans sa langue ;
  • aider quelqu’un à produire des traductions de haute qualité dans une langue qu’il ne connait pas, en le « consultant » (dans sa langue) en cas de doute.
  • aider une machine (eh oui!) à « comprendre » un texte : une façon de « porter » au français un système gérant des petites annonces SMS en arabe (CAT, à Amman, déployé sur Fastlink) est de « prétraduire » les SMS en arabe. 95% du contenu est récupéré.
Et qu’en est-il de l’aspect technique ? Comment fait-on pour construire de tels systèmes ?

Vous voulez donc savoir « comment ça marche » ? Allons-y. D’abord, il faut voir que, pour traduire par un programme une « unité de traduction », de quelque taille qu’elle soit (phrase, paragraphe, section, chapitre, document), on le fait en général en plusieurs étapes successives, chacune transformant une « représentation intermédiaire » en une autre.

La suite des représentations intermédiaires par lesquelles on passe, et leur détail, constitue l’architecture linguistique d’un système de traduction automatique.

Contenu

Comment ça, on n'y arrivera jamais ? Mais ça marche déjà ! Des millions d'internautes demandent chaque jour la traduction de millions de pages à des « serveurs de traduction automatique » gratuits, comme ceux de Systran, Reverso, Google, ou au Japon Fujitsu, Toshiba, Nec, Oki…

Oui, bien sûr… mais ce n’est pas ce que je veux dire ! En fait, ça traduit n’importe comment !

Eh bien, oui… mais que peut-on espérer ? Si on doit traduire de l'anglais vers le français « they saw many arms », comment savoir si c’est « ils scient de nombreux bras » ou « ils ont vu de nombreuses armes » ou « elles ont vu de nombreux bras », « elles [scient / ont vu] de nombreuses armoiries », etc. ? Bien des traducteurs humains, professionnels, font ainsi des contresens graves. En général, les textes qu’ils produisent respectent la grammaire, mais, au fond, cela contribue à « cacher » les contresens et faux sens ou omissions.


D’autre part, il s'agit de serveurs Web gratuits, dont le but est d’aider à comprendre « le mieux possible » des textes très divers dans des langues inconnues. Ils ne prétendent pas fournir des traductions parfaites, ni remplacer des traducteurs humains. Ce que ces serveurs fournissent peut cependant être considéré comme des « premiers jets », des « prétraductions », utilisables par des réviseurs plus experts pour produire des traductions finales de qualité professionnelle.

Mais il existe aussi des systèmes spécialisés, inconnus du grand public, qui traduisent extrêmement bien, et même mieux, et pas seulement beaucoup plus vite, que des traducteurs humains.

Vraiment ? Alors il s’agit de progrès récents, je n’en ai pas entendu parler !

En fait, ça date déjà de 30 ans. À Environnement Canada, le système TAUM-météo, qui devint METEO en 1985, fut lancé de façon opérationnelle le 24 mai 1977. Il a toujours été dédié au « sous-langage » des bulletins météo. Vers 1990, METEO traduisait 30 millions de mots par an, l’équivalent de 120 000 pages « standard ». La révision d'un bulletin traduit automatiquement prend moins d'une minute, environ 7 fois moins de temps qu'auparavant, lorsqu'il était traduit par un traducteur « junior ». C’est d'ailleurs l’un de ces traducteurs « juniors » qui était allé supplier le groupe TAUM (Traduction Automatique à l’Université de Montréal) de les délivrer de cette tâche ingrate. Cet exemple illustre aussi le fait que la traduction professionnelle est non seulement difficile, mais souvent pénible psychologiquement. Bref, ce système est équivalent à 17 traducteurs à plein temps depuis au moins 25 ans.

D'autres exemples peuvent être cités, dans le domaine des cours de la bourse, ou pour la traduction de documentations techniques.

Donc, les traducteurs humains peuvent effectivement être remplacés ! Ils ont raison d'avoir peur...

C’est vrai que beaucoup sont très réticents. Mais ils n’ont pas de quoi avoir peur, car en général ils ne sont pas en concurrence.

D’abord, aucun traducteur humain ne serait en mesure de produire en une seconde la traduction d’une page Web, même pas une traduction mot à mot…

Ensuite, bien des traducteurs professionnels utilisent en fait les systèmes de traduction automatique du commerce « configurables » (par choix des priorités de dictionnaires, insertion d’un « dictionnaire utilisateur »...) pour produire des prétraductions qu'ils peuvent ensuite post-éditer.

L’exemple de TAUM-météo montre d’ailleurs que, parfois, ce sont des traducteurs qui poussent à la construction d’un système de traduction automatique. Bien sûr, il faut ensuite les laisser utiliser ou non le système selon qu’ils décident qu’ils vont ou non gagner du temps avec lui.

Selon le niveau de qualité du premier jet, une simple révision suffit parfois, mais le plus souvent une post-édition est nécessaire. Il faut alors commencer par lire et comprendre la phrase à traduire avant de regarder la prétraduction proposée, afin de trouver comment la modifier pour obtenir le sens désiré.

Mais alors, s’il faut connaître la langue source, ça ne peut servir qu’aux bilingues !

Eh bien… oui et non ! Il y a plusieurs sortes de « traduction automatique », ou plus généralement de « traduction automatisée » ou « traduction assistée par ordinateur » (TAO), avec des buts bien différents. Classons-les par ordre de difficulté croissante pour les développeurs de systèmes :

  • aider un vrai bilingue à produire des traductions de haute qualité en lui fournissant des « prétraductions » les plus utiles possibles, ainsi que des aides sous forme de dictionnaires ;
  • aider quelqu’un à accéder à une information dans une langue qu’il ne connaît pas ;
  • aider deux personnes n’ayant pas de langue commune à communiquer (par oral, ou par écrit, en tchat) ;
  • aider une personne monolingue, ne connaissant pas ou très peu une langue étrangère, mais très bien le domaine en cause, à produire des traductions de qualité dans sa langue ;
  • aider quelqu’un à produire des traductions de haute qualité dans une langue qu’il ne connait pas, en le « consultant » (dans sa langue) en cas de doute.
  • aider une machine (eh oui!) à « comprendre » un texte : une façon de « porter » au français un système gérant des petites annonces SMS en arabe (CAT, à Amman, déployé sur Fastlink) est de « prétraduire » les SMS en arabe. 95% du contenu est récupéré.
Et qu’en est-il de l’aspect technique ? Comment fait-on pour construire de tels systèmes ?

Vous voulez donc savoir « comment ça marche » ? Allons-y. D’abord, il faut voir que, pour traduire par un programme une « unité de traduction », de quelque taille qu’elle soit (phrase, paragraphe, section, chapitre, document), on le fait en général en plusieurs étapes successives, chacune transformant une « représentation intermédiaire » en une autre.

La suite des représentations intermédiaires par lesquelles on passe, et leur détail, constitue l’architecture linguistique d’un système de traduction automatique.

Thèmes scientifiques
ID
15106
Introduction
Un dialogue imaginaire… synthèse de dialogues réels, pour faire le point sur ce domaine qui a suscité beaucoup d'espoirs, mais aussi beaucoup de déconvenues depuis les années 1950.
Contenu

Comment ça, on n'y arrivera jamais ? Mais ça marche déjà ! Des millions d'internautes demandent chaque jour la traduction de millions de pages à des « serveurs de traduction automatique » gratuits, comme ceux de Systran, Reverso, Google, ou au Japon Fujitsu, Toshiba, Nec, Oki…

Oui, bien sûr… mais ce n’est pas ce que je veux dire ! En fait, ça traduit n’importe comment !

Eh bien, oui… mais que peut-on espérer ? Si on doit traduire de l'anglais vers le français « they saw many arms », comment savoir si c’est « ils scient de nombreux bras » ou « ils ont vu de nombreuses armes » ou « elles ont vu de nombreux bras », « elles [scient / ont vu] de nombreuses armoiries », etc. ? Bien des traducteurs humains, professionnels, font ainsi des contresens graves. En général, les textes qu’ils produisent respectent la grammaire, mais, au fond, cela contribue à « cacher » les contresens et faux sens ou omissions.


D’autre part, il s'agit de serveurs Web gratuits, dont le but est d’aider à comprendre « le mieux possible » des textes très divers dans des langues inconnues. Ils ne prétendent pas fournir des traductions parfaites, ni remplacer des traducteurs humains. Ce que ces serveurs fournissent peut cependant être considéré comme des « premiers jets », des « prétraductions », utilisables par des réviseurs plus experts pour produire des traductions finales de qualité professionnelle.

Mais il existe aussi des systèmes spécialisés, inconnus du grand public, qui traduisent extrêmement bien, et même mieux, et pas seulement beaucoup plus vite, que des traducteurs humains.

Vraiment ? Alors il s’agit de progrès récents, je n’en ai pas entendu parler !

En fait, ça date déjà de 30 ans. À Environnement Canada, le système TAUM-météo, qui devint METEO en 1985, fut lancé de façon opérationnelle le 24 mai 1977. Il a toujours été dédié au « sous-langage » des bulletins météo. Vers 1990, METEO traduisait 30 millions de mots par an, l’équivalent de 120 000 pages « standard ». La révision d'un bulletin traduit automatiquement prend moins d'une minute, environ 7 fois moins de temps qu'auparavant, lorsqu'il était traduit par un traducteur « junior ». C’est d'ailleurs l’un de ces traducteurs « juniors » qui était allé supplier le groupe TAUM (Traduction Automatique à l’Université de Montréal) de les délivrer de cette tâche ingrate. Cet exemple illustre aussi le fait que la traduction professionnelle est non seulement difficile, mais souvent pénible psychologiquement. Bref, ce système est équivalent à 17 traducteurs à plein temps depuis au moins 25 ans.

D'autres exemples peuvent être cités, dans le domaine des cours de la bourse, ou pour la traduction de documentations techniques.

Donc, les traducteurs humains peuvent effectivement être remplacés ! Ils ont raison d'avoir peur...

C’est vrai que beaucoup sont très réticents. Mais ils n’ont pas de quoi avoir peur, car en général ils ne sont pas en concurrence.

D’abord, aucun traducteur humain ne serait en mesure de produire en une seconde la traduction d’une page Web, même pas une traduction mot à mot…

Ensuite, bien des traducteurs professionnels utilisent en fait les systèmes de traduction automatique du commerce « configurables » (par choix des priorités de dictionnaires, insertion d’un « dictionnaire utilisateur »...) pour produire des prétraductions qu'ils peuvent ensuite post-éditer.

L’exemple de TAUM-météo montre d’ailleurs que, parfois, ce sont des traducteurs qui poussent à la construction d’un système de traduction automatique. Bien sûr, il faut ensuite les laisser utiliser ou non le système selon qu’ils décident qu’ils vont ou non gagner du temps avec lui.

Selon le niveau de qualité du premier jet, une simple révision suffit parfois, mais le plus souvent une post-édition est nécessaire. Il faut alors commencer par lire et comprendre la phrase à traduire avant de regarder la prétraduction proposée, afin de trouver comment la modifier pour obtenir le sens désiré.

Mais alors, s’il faut connaître la langue source, ça ne peut servir qu’aux bilingues !

Eh bien… oui et non ! Il y a plusieurs sortes de « traduction automatique », ou plus généralement de « traduction automatisée » ou « traduction assistée par ordinateur » (TAO), avec des buts bien différents. Classons-les par ordre de difficulté croissante pour les développeurs de systèmes :

  • aider un vrai bilingue à produire des traductions de haute qualité en lui fournissant des « prétraductions » les plus utiles possibles, ainsi que des aides sous forme de dictionnaires ;
  • aider quelqu’un à accéder à une information dans une langue qu’il ne connaît pas ;
  • aider deux personnes n’ayant pas de langue commune à communiquer (par oral, ou par écrit, en tchat) ;
  • aider une personne monolingue, ne connaissant pas ou très peu une langue étrangère, mais très bien le domaine en cause, à produire des traductions de qualité dans sa langue ;
  • aider quelqu’un à produire des traductions de haute qualité dans une langue qu’il ne connait pas, en le « consultant » (dans sa langue) en cas de doute.
  • aider une machine (eh oui!) à « comprendre » un texte : une façon de « porter » au français un système gérant des petites annonces SMS en arabe (CAT, à Amman, déployé sur Fastlink) est de « prétraduire » les SMS en arabe. 95% du contenu est récupéré.
Et qu’en est-il de l’aspect technique ? Comment fait-on pour construire de tels systèmes ?

Vous voulez donc savoir « comment ça marche » ? Allons-y. D’abord, il faut voir que, pour traduire par un programme une « unité de traduction », de quelque taille qu’elle soit (phrase, paragraphe, section, chapitre, document), on le fait en général en plusieurs étapes successives, chacune transformant une « représentation intermédiaire » en une autre.

La suite des représentations intermédiaires par lesquelles on passe, et leur détail, constitue l’architecture linguistique d’un système de traduction automatique.

Thèmes scientifiques