Traduction automatique : les années où tout a - Futura

Transcription

Traduction automatique : les années où tout a - Futura
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
08/09/2008-Par
Jean-LucGoudet
Traductionautomatique:lesannéesoùtoutachangé
Une nouvelle page de l'histoire de la traduction par ordinateur est en train de s'écrire. En quelques
années seulement, la puissance de l'informatique, une nouvelle approche théorique et une énorme
demandevenuedetouslesutilisateursd'Internetonttoutchangé.
Page1/5-Traductionautomatique:lesannéesoùtoutachangé
Depuispeud'années,lestraductionsréaliséespardeslogicielsontconnuunprogrèsfoudroyant.Uncap,
qui semblait encore difficilement franchissable il y a une dizaine d'années, vient d'être allègrement
dépassé.Grâceàlapuissancebrutedesordinateurs,grâceauWeb,grâceàGoogle,maisaussigrâceau
patienttravaildeslinguistesentoutgenrequisesontattaquésàcettemontagneilyaundemi-siècle...
Pour moins de cent euros, on trouve aujourd'hui des logiciels de traduction capable d'opérer sur des dizaines de
pairesdelangues.Pourquelquescentainesd'euros,lesentreprisespeuventacquérirunlogicielhautdegamme,qui
travaillera sur plusieurs serveurs et puisera dans les bases données pour perfectionner sa traduction par autoapprentissage.
Lerésultatestloind'êtreparfaitmaisilestsuffisantpourcomprendrelesensd'untexte.Al'intérieurd'undomaine
techniquebiencerné,untellogicielpeutproduiredesdocumentsdebonnequalitéqu'ilsuffirademettreenforme.
Commentenest-onarrivélàenaussipeud'années?Larecherchesurla traduction automatique a démarré il y a
longtemps, juste après la seconde guerre mondiale et a connu des débuts difficiles, balbutiant durant plusieurs
décennies.
Cliquezpouragrandir-Unephrasesoigneusementdécomposéeparlelogicieldetraduction.Pourchaque
élément,plusieurstraductionspossiblesserontrecherchées.©Systran
La progression a repris dans les années 1980 avec la montée en puissance des ordinateurs. L'internationalisation
du Web est alors venue renforcer la demande, longtemps restée tirée par les militaires et les services de
renseignements.
Dans les années 2000, l'informatique a permis d'exploiter jusque dans ses retranchements une nouvelle approche,
portéeparGoogle,quil'aétendueauWebentier,etparSystran,acteurhistoriquedelatraductionautomatique,
néaméricainetaujourd'huifrançais.
C'est l'histoire de ces cinquante années d'efforts et de son aboutissement actuel que nous allons vous raconter.
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page1/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
Let'sgo!Aufgehts!Anda!Avanti!Vamos!Gidelim!Allons-y!
Page2/5-DelaguerrefroideàInternet
L'idéed'utiliserdesordinateurspourtraduiredestextesremonteàlafindelasecondeguerremondiale
maislesdébutsfurentlents,avantuncoupd'arrêtdanslesannées1960.L'enviegrandissantedeliredes
documents provenant de l'Union soviétique a relancé les recherches. Il y a quelques années, le Web a
créé un nouveau besoin. Les énormes investissements de Google et une nouvelle méthode, dite
statistique,onttirélemarchédelatraductionautomatique...
Après la seconde guerre mondiale, l'idée se fait jour d'unemachine à traduire. Les premiers ordinateurs, comme
l'Eniac,esquissentcettepossibilitémaisaussilesentimentqu'effacerlabarrièredeslanguespourraitcontribuerà
lapaixuniverselle.L'undespremiersàformaliserl'idéesembleêtreAndrewBooth,unchercheurbritannique,quiy
consacradutempsàpartirde1946.Danslesannées1950,latraductionautomatiquerestedansledomainedela
recherche théorique mais tout change dans les années 1960 avec la guerre froide. Aux Etats-Unis, le besoin
apparaîtdetraduiremassivementdestextesenrusse.EnUnionsoviétique,ons'intéressealorsàlatraductionde
l'anglais.Parallèlement,lesordinateursontgagnéenpuissance.Ilsembleenvisageabledelesutiliserpouraumoins
aiderlestraducteurs.
Années1980.LasociétédeJeanGachotvientderacheterl'entrepriseSystran.©Systran
Pourtant, des théoriciens affirment que la traduction automatique restera pour longtemps un rêve, tant les
ambiguïtéssontnombreusesdanstoutesleslangues.Dèscetteépoqueapparaîtunenécessité:latraductiondoit
prendreencomptelesensdelaphrasepouréviterlesécueils.Enfrançais,terredésignelesol,laplanète,lacôte
vuedelamerouencoreunepropriétéagricole.Siunastronauteanglophoneaperçoitsaplanèteparlehublotde
sonvaisseauspatial,ils'écrira«Earth!».Maiss'ils'agitd'unmarinàlafind'unetraversée,ilannoncera«landho
! ». Quant à la terre battue par les intempéries, elle sera différente de la terre battue des courts de tennis de
Roland Garros. Aux Etats-Unis, un aréopage de scientifiques (Alpac,Automatic Language Processing Advisory
Committe)chercheàévaluerlafaisabilitéd'unetraductionautomatique.En1966,l'équiperemetsonrapport,très
pessimiste.
Mais les besoins du renseignement sont trop forts. Aux Etats-Unis, le gouvernement crée en 1968 la société
Systran (System Translation, un sigle qui rime avec Fortran,Formula Translator, le langage de programmation
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page2/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
inventé dans les années 1950). Il apparaît alors que l'on peut simplifier le problème si on accepte une traduction
approximative. Depuis cette époque, on distingue ainsi deux domaines : la recherche d'informations et la
production de documents. S'il s'agit de générer un texte parfait, alors la difficulté est effectivement gigantesque.
Maispourcomprendrelesensd'undocument,onpeutsecontenterd'uneversionimparfaitevoiresyntaxiquement
fausse.
Années1980.LelogicielSystranvientd'êtreadaptépourMS-Dosettournesurl'IBMPC,icidanssaversionà
deuxlecteursdedisquettes,doncsansdisquedur.©Systran
BabelenEurope
La technique utilisée est aujourd'hui qualifiée d'approche linguistique. Elle utilise des règles, qui sont celles de la
grammaireetcellesdelasyntaxe.Parexempleil,enfrançais,peutêtreunpronompersonnelmasculinouneutre.Il
estbeau,ilfaitbeauetmêmeilfaitlebeausetraduirontdifféremment.Uneanalysegrammaticaledecettephrase
peut différencier les sens deil et defait. Avec une informatique qui gagne sans cesse en puissance et des
méthodes qui se raffinent, cette approche connaît de bons succès et, surtout, de nouvelles demandes
s'annoncent.
La construction européenne est de celles-là. Le service de traduction, au fil des élargissements successifs de la
communauté, est devenu pléthorique. Il faut désormais plus 1.700 professionnels pour l'assurer, qui s'aident de
logiciels de traduction. Le travail est une collaboration entre la machine, qui prépare le travail et fournit un texte
approximatif,etl'homme,quirédigeledocumentfinal.
Uneautredemande,croissanteelleaussi,estapparuedanslesannées1990,avecInternet,leWebdevenantune
gigantesque bibliothèque multilingue. En 1997, le moteur de recherche Alta Vista adopte le logiciel de Systran,
l'entrepriseaméricainedesdébutsdelatraduction,devenuefrançaiseentre-temps.
Le service Babel Fish, gratuit, devient le premier outil de traduction, utilisé par des millions de personnes dans le
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page3/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
monde.Mêmesisesformulationsfinaleslaissentàdésirer,avecunesyntaxedouteuse,voirerisible,etdeserreurs
assez grossières, Babel Fish permet de lire des contenus de langues étrangères. Google à son tour fait appel à
Systran et utilisera son logiciel jusqu'en 2007. Actuellement,BabelFish est accessible chez Yahoo! « On atteint
aujourd'huiles60millionsdepagestraduitesparjour»rapporteDimitrisSabatakakis,président-directeurgénéral
deSystran.
AvantleWeb,leservicedetraductionenligneexistaitdéjàsurleMinitel.©Systran
LeWebimposeunenouvellevaguedetraducteurs
Entre1998et2007,dynamisé,lemarchédelatraductions'ouvreauxentreprises.Systranéditepasmoinsdesix
versionsdesonlogiciel.Lesperformancessontsuffisantespourobtenirdebonsrésultatsdanslestraductionsde
documentstechniques.Auprixd'uneinterventionhumainepourlamiseenforme,lerésultatfinalestpubliable.Les
entreprises utilisent ces logiciels pour leurs catalogues, les modes d'emploi ou le support technique. Beaucoup
viennent du Web. « Quand Cisco n'avait que des pages en anglais pour son support technique, 80 % des
anglophones les utilisaient mais seulement 3 % des Asiatiques, se souvient Dimitris Sabatakakis. Les autres
téléphonaientauxservicesd'assistance.Toutachangéavecuntraducteurautomatiquequiapermisdetraduire
touteslespagesdansplusieurslangues.»
DevantcetteaccélérationproduiteparInternetetsonutilisationplanétaire,laguerrefroidesembleloin.Ellel'est
pourtant moins qu'on ne l'imagine. Aujourd'hui, Systran, même devenue française, travaille toujours pour
l'administration américaine. Mais les demandes vont désormais, entre autres, vers l'arabe et le farsi, la langue
parléeenIran.CourrierélectroniqueetnewsgroupspeuventainsiêtresurveillésautomatiquementparlaCIA...
C'est du Web encore qu'est venue la dernière révolution de la traduction par ordinateur : la statistique. Initiée
dans les années 1990, notamment par IBM, elle consiste à utiliser les traductions déjà réalisées et enregistrées
dansdesbasesdonnées.Depuispeud'années,lapuissanceinformatiqueaatteintleseuilpermettantd'utiliserce
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page4/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
procédé,quiadonnéuncoupd'accélérateursansprécédentàlatraductionautomatique.En2007,Google,comme
nousallonslevoir,ainvestidessommesénormespourutiliserleWebentiercommebasededonnées.Sesmilliers
de serveurs puisent dans toutes les pages Web du monde et repèrent celles qui comportent des traductions. Il
suffitalorsderéutilisercetravailinitial...
Alors que Google utilise pour l'instant une approche purement statistique, d'autres s'en servent pour compléter
l'analyse linguistique. Ce panachage améliore considérablement les performances. Voilà qui explique la fulgurance
des progrès récents. Pour autant, la perfection reste encore très loin. Efficace dans le domaine technique, la
traduction automatique baisse les bras dans le domaine littéraire, dépassée par les subtilités, les jeux de mots et
lesexpressionsimagées.Etcecap-là,laméthodestatistiquenelefranchirapas.Ilfaudratrouverautrechose...
Page3/5-Lastatistique,l'armedetraductionmassive
Siunmotouuneexpressionontdéjàététraduits,inutiled'effectuerunefoisdeplusletravail.Ilsuffitde
recopier.Apartirdeceprincipetrivial,unenouvelleméthodeestnée,baptiséestatistique.Elles'appuie
surlapuissancebrutedesordinateursetsurlatailledesbasesdedonnéesarchivéesparlesentreprises.
GoogleapousséceprincipedanssesretranchementsenutilisantleWebentier.Maiscelanesuffitpas...
La méthode linguistique, qui analyse la structure des phrases trouve ses limites dans la complexité des langues.
Dans les années 1990, la puissance des ordinateurs permet d'imaginer une solution différente : puiser dans les
immenses corpus des bases de données informatisées pour réutiliser des fragments de phrases déjà traduites.
Initiée notamment par IBM, l'approche prend de l'ampleur dans les années 2000 avec Google qui récupère toutes
lestraductionsd'Internet,marquantuntournantdansl'histoiredelatraductionautomatique.
L'idée peut paraître simple. Beaucoup l'utilisent d'ailleurs sans en avoir conscience. Devant une expression
inconnue, il est tentant de la soumettre à un moteur de recherche pour en chercher la traduction dans des sites
bilingues ou simplement sur une page où un auteur l'aura traduite. Par exemple, en tapantgravitational
microlensing dans le moteur de recherche Google et en restreignant les résultats aux sites francophones, on finit
assezvitepardécouvrirquel'expressionfrançaisecorrespondanteestmicrolentillegravitationnelle.
Mais le premier résultat trouvé n'est pas nécessairement correct, ni le meilleur quand plusieurs traductions sont
acceptées.Letraducteurapusetromper(cequiestleprincipalrisquesurleWeb).Lecontextepeutdifférer.Par
exemple, le motblanchir ne se traduit pas de la même manière en anglais s'il s'agit de linge ou d'argent. La
méthode doit donc être statistique et comptabiliser les traductions les plus fréquentes. Elle doit aussi porter sur
des groupes de mots. Ainsiblanchimentd'argent donnera de meilleurs résultats queblanchiment tout court. Pour
donnerdebonsrésultats,laméthodestatistiquedoitaussiprendreencomptelecontexte,c'est-à-direlerestede
laphrase,cequipermetdechoisirentreplusieurstraductionspossibles.
Desmilliersdeserveurspouruneforcebrute
Pour réaliser un travail rapide, ces mots et ces groupes doivent être indexés, c'est-à-dire enregistrés dans une
base de données, ce qui conduit à une occupation mémoire considérable. Le corpus peut être constitué à partir
d'unensemblededocuments,présentssurundisquedurouungroupedeserveurs.
GoogleaengagédesmoyensgigantesquespourutiliserleWebentiercommebasededonnées.Legéantd'Internet
estcommetoujourstrèsdiscretsursontravail.Onsaitcependantqueleprocédéutiliséestpurementstatistique,
sansaucuneanalysesémantiquedelaphrase.Pourproposer,commeillefaitaujourd'hui,un servicedetraduction
de23couplesdelangues(soit23x22,c'est-à-dire506combinaisons),Googledoitavoirengrangédesdizainesde
millions de groupes de mots, ce qui implique probablement des milliers de serveurs uniquement destinés à cette
tâche.
Le résultat est excellent et convient très bien pour la recherche d'information, de la langue étrangère vers le
français.Danscecas,ils'agitseulementdecomprendrelesensd'untexteetunrésultatimparfaitpeutsuffire.Le
procédé statistique offre un autre avantage : il évolue avec les habitudes, à mesure que les bases de données
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page5/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
sontmodifiées.Unanglicisme,parexemple,pourrafinirparprendreracineets'installercommeunmotfrançais.On
acceptedésormaispermafrostpourpergélisoletonnetraduitpascheeseburger...
LeservicegratuitproposéparGoogleutiliseexclusivementl'approchestatistique,puisantdanstoutesles
traductionsdéjàprésentessurleWeb.Sesperformancessontexcellentesmaismontrentaussileslimitesdu
procédé,commettantsouventdeserreurssurlesphrasessimples,courtesoud'unetournurepeuusitée.
(Captured'écran)
Leprocédéstatistique:mauvaisenlittératureetparfoisgaffeur
Malgré ces bons résultats, les statistiques ne peuvent pas tout. Des expressions peu usitées resteront
complètement inconnues et sources d'erreurs énormes. Avec «aller de Charybde en Scylla», Google en anglais
propose un très mauvais «Charybdis go to Scylla» etYahoo! «to go from Charybde in Scylla », une traduction
littéralecorrectemaisquin'aaucunsenspourunanglophone.Labonnetraductionserait«Togooutofthefrying
pan and into the fire». Mais le but de la traduction automatique n'est pas de s'attaquer à des textes littéraires.
L'approche statistique ne le permet pas plus que la méthode linguistique. En revanche, le domaine technique
convientbienauxtraducteursautomatiques,avecsonvocabulaireprécisetsasyntaxemoinsvariée.
Unautreécueilguettelaméthodestatistique:lesphrasescourtes.Pours'enconvaincre,ilsuffitdedemanderau
traducteur de Google de traduire «je viens». Le logiciel propose un incroyable «I just». Avec «j'arriverai», la
traduction est... «j'arriverai» ! Jean Senellart, directeur Recherche et développement chez Systran, explique
facilement ces bourdes étonnantes. «La méthode statistique recherche une traduction en tenant compte du
contexte. Avec une phrase courte, il n'y a pas de contexte et les plus grosses erreurs sont possibles. Dans ces
deuxexemples,unautrephénomèneestmisenévidence.Cesphrasescommencentparjeetc'estunetournure
plutôtraredanslestextesissusduWeb.»
Aveugle,latraductionstatistiquepeutdoncdonnersouventl'illusiondetrouverparfaitementsoncheminetparfois
desecognerdanslesmurs.Pourfairemieux,ilfautdonctrouverautrechose...
Page4/5-Lamoraleactuelle:deuxtechniquescomplémentairesvalentmieuxqu'une
!
Aprèsavoirfaitfaireunbondenavantàlatraductionautomatique,laméthodestatistiquebuteelleaussi
sur une limite : elle ne permet pas de traduire des expressions jamais ou rarement rencontrées. Pour
l'améliorer,laseulesolutionconnueaujourd'huiestdelacompléterd'uneclassiqueanalyselinguistique,
avecsesrèglespropresàchaquelangue.Unpanachagequifaitsespreuves.
La méthode statistique ignore toute règle et ne peut donc effectuer aucune généralisation. Si une traduction est
trouvéepourunmotausingulierseulement,lelogicielnesaurapaslemettreaupluriel.Cehandicapestcontourné
par l'énorme masse de données que peut traiter un ordinateur ayant accès aux serveurs d'une entreprise ou au
Web. Mais contourné seulement. Ce qui n'a pas déjà été traduit ne pourra pas l'être. De plus, on l'a vu avec
l'exempledesphrasescourtes,laméthodestatistiqueimpliquedeprendreencomptelecontextepourchoisirparmi
plusieurstraductionspossibles.Horscontexte,laméthodestatistique,sansrègle,nepeutplusavancer...
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page6/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
Il est clair qu'une limite est atteinte. La meilleure démonstration de l'existence d'un obstacle est le service de
Google. L'entreprise américaine a engagé des moyens importants et dispose aujourd'hui d'une méthode rôdée. La
preuveestlarapiditéaveclaquellesontapparuesdenouvelleslanguesaprèslespremierstoursderouesentreles
langueslesplusrépandues.LaméthodedeGoogleestmanifestementbienaupointmaiselleneprogressepasen
qualité. «Si la puissance informatique était suffisante pour aller plus loin, estime Jean Senellart, directeur de la
R&DdeSystran,parexempleenaugmentantlenombredeserveurs,Googleauraitdéjàmisenœuvrelesmoyens
nécessaires.Maisilnel'apasfait.»
Devantlaphraseilfaitchaud,uneanalyselinguistiquedétailleralaconstructionetdétecteraunpronom
(PRO),unverbe(GV,groupeverbal)etunadverbe(ADV).Ellechercheraensuitelarèglecorrespondantàce
cas.Ici,troispourraitconvenir.Silaphraseétaitilfaitlebeau,larègleseraitV(faire;objet GN(beau)),oùV
désigneunerègleconcernantunverbeetGNungroupenominal.Silaphraseétaitilsefaitbeau,labonne
régleseraitV(faire;réfléchi;MODIFIEUR=beau),m odifieurdésignantunmotmodifiantlesensduverbe,ici
l'adverbe.Aveclaphraseproposée,labonnerèglesera
V(faire;sujet "il";MODIFIEUR=chaud,froid,gris,m auv ais,beau).Enanglais,cetteconstructionsetraduitpar
theweatherisMODIFIER(lederniertermedésignantlemodifieur,traduitenanglais).©Systran
Lesbienfaitsdesrègles
Il semble clair pour tout le monde aujourd'hui que le futur proche de la traduction automatique passe par une
approche mixte, mêlant la classique linguistique, avec ses règles, et la statistique, pour effectuer dans une
seconde phase une validation par le corpus. Dans un premier temps, l'application des règles permet pour chaque
mot ou groupe de mots de déterminer différentes traductions possibles. Les règles permettent de généraliser,
c'est-à-dire de traduire une phrase jamais rencontrée en construisant une forme jamais produite. Dans la plupart
des cas, plusieurs solutions sont trouvées. L'approche statistique vient alors en appui pour vérifier comment les
précédents traducteurs ont choisi parmi elles. En somme, l'analyse linguistique limite le nombre d'erreurs dans les
casoùlastatistiquen'estpasefficacetandisquecelle-ciréduitletravaildelapremière.
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page7/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
Unexempleréeldepanachagedesméthodeslinguistiqueetstatistique,pourlatraductiond'uncataloguede
produits.Letextesource(colonnedegauche)esttraduitparlaversion6dulogicieldeSystran,avecune
méthodelinguistique,etparlaversion7,quiajouteuneauthentificationparlecorpusdedonnées(méthode
statistique).Lesexpressionssoulignéesenrougesontcellesquidiffèrententrelesdeuxtraductions.Dansla
colonnededroitefigurelabonnetraduction.©Systran
Laméthodemixteaunautreavantagedirect,ettrèsmatériel,parrapportàunesolutionpurementstatistique.La
taille de la base de données nécessaire est considérablement réduite. Une dizaine de milliers de règles suffisent
alors à l'intérieur d'un domaine spécifique (par exemple au sein d'une entreprise). Mais surtout, le cumul des deux
techniquesamélioreincontestablementlaqualitédelatraduction.
Pour la traduction destinée à la recherche d'informations, qui ne délivre qu'une syntaxe approximative, ce
panachagedelalinguistiqueetdelastatistiquedonneaujourd'huilesmeilleursrésultats.
Maisuneinterventionhumaineresteindispensablepourallerjusqu'àlaréalisationd'undocumentdéfinitif.Dansles
versions de ce logiciel (réalisé par Systran) destinées aux entreprises, le système passe par une phase
d'apprentissage,quiconsisteàindexerlesdocumentsdéjàtraduits.L'entreprisedevraendéfinirlaliste,auseinde
laquellelelogicielbâtirasonindex,parauto-apprentissage.
Un traducteur de chair et d'os interviendra éventuellement pour finaliser la version définitive. C'est ainsi que
pourront être corrigées des erreurs mais cette interaction peut aussi servir à prendre en compte des habitudes
maison(termespréférés,sigles...).
Avec ce triple panachage mêlant règles linguistiques, vérification statistique et peaufinage humain, la traduction
automatique,quin'estdoncalorsqu'unetraductionassistée,peutdésormaisdonnerd'excellentsrésultats.
Page5/5-Latraductionaupiedd'unenouvellemontagne
Comment aller plus loin ? Il est désormais clair qu'augmenter encore la puissance de feu informatique
n'améliorera guère l'efficacité de la traduction. Pour progresser, il faudra des algorithmes plus subtils,
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page8/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Futura-Sciences
prenant en compte le sens des phrases. Revenir aux sources en quelque sorte puisque le même
problèmeestapparuàl'aubedelatraductionautomatique.
En empilant les deux techniques actuelles, le résultat reste largement insuffisant pour obtenir un document
irréprochable, qu'il s'agisse d'un site web ou d'un catalogue de produits. Pour décrire la situation, les spécialistes
présententsouventl'analogied'unedistanceàparcourir.S'ils'agitd'allerdeParisàNice,latraductionautomatique
ira jusqu'à Lyon ou à Marseille, selon son efficacité, mais il faudra toujours terminer le voyage avec un cerveau
humain.
Même si la traduction automatique effectue aujourd'hui la majeure partie du parcours, le dernier tronçon est de
trèsloinleplusardu.Ilnepourraêtrefranchiqu'àl'aidedetechniquesnouvelles.Lapuissancebruteamontréses
capacités puis sa limite. Pour affiner les traductions, il faudra que les logiciels prennent en compte le sens. Pour
traduirelaphrase«garçon,undemi!»,ilfautsavoirreconnaîtrelecontexte,celuid'unepersonnedansuncafé,
pourtrouverlesbonséquivalentsdegarçonetdemi.
Unécranutilisépouréditerlestraductionsconnuesetenrichirmanuellementlabasededonnées.©Systran
Laquêtedusens
Cette difficulté de l'approche sémantique avait été perçue dès l'origine de la traduction automatique. Elle avait
même découragé la communauté scientifique, comme en témoigne le rapport Alpac (Automatic Language
ProcessingAdvisoryCommittee),rédigépardeschercheursaméricainsetdiffuséen1966,quitraduisaitungrand
scepticismesurlafaisabilitédelatraductionautomatique.
Trenteansplustard,laméthodestatistiqueaprovisoirementeffacécetteimpressionmaisaprèslebondenavant
qu'elle a permis, les spécialistes de la traduction automatique se trouvent à nouveau face à cet écueil, qui
ressembleàunemontagne.Laballeestdésormaisdanslecampdesthéoriciens.Onpeutprédiresansgrandrisque
de se tromper que les extraordinaires progrès réalisés ces dernières années ne se poursuivront plus au même
rythmedanslesprochainesannées...
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Page9/10
Dossier>Traductionautomatique:lesannéesoùtoutachangé
Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/
Futura-Sciences
Page10/10