Traduction automatique : les années où tout a - Futura
Transcription
Traduction automatique : les années où tout a - Futura
Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences 08/09/2008-Par Jean-LucGoudet Traductionautomatique:lesannéesoùtoutachangé Une nouvelle page de l'histoire de la traduction par ordinateur est en train de s'écrire. En quelques années seulement, la puissance de l'informatique, une nouvelle approche théorique et une énorme demandevenuedetouslesutilisateursd'Internetonttoutchangé. Page1/5-Traductionautomatique:lesannéesoùtoutachangé Depuispeud'années,lestraductionsréaliséespardeslogicielsontconnuunprogrèsfoudroyant.Uncap, qui semblait encore difficilement franchissable il y a une dizaine d'années, vient d'être allègrement dépassé.Grâceàlapuissancebrutedesordinateurs,grâceauWeb,grâceàGoogle,maisaussigrâceau patienttravaildeslinguistesentoutgenrequisesontattaquésàcettemontagneilyaundemi-siècle... Pour moins de cent euros, on trouve aujourd'hui des logiciels de traduction capable d'opérer sur des dizaines de pairesdelangues.Pourquelquescentainesd'euros,lesentreprisespeuventacquérirunlogicielhautdegamme,qui travaillera sur plusieurs serveurs et puisera dans les bases données pour perfectionner sa traduction par autoapprentissage. Lerésultatestloind'êtreparfaitmaisilestsuffisantpourcomprendrelesensd'untexte.Al'intérieurd'undomaine techniquebiencerné,untellogicielpeutproduiredesdocumentsdebonnequalitéqu'ilsuffirademettreenforme. Commentenest-onarrivélàenaussipeud'années?Larecherchesurla traduction automatique a démarré il y a longtemps, juste après la seconde guerre mondiale et a connu des débuts difficiles, balbutiant durant plusieurs décennies. Cliquezpouragrandir-Unephrasesoigneusementdécomposéeparlelogicieldetraduction.Pourchaque élément,plusieurstraductionspossiblesserontrecherchées.©Systran La progression a repris dans les années 1980 avec la montée en puissance des ordinateurs. L'internationalisation du Web est alors venue renforcer la demande, longtemps restée tirée par les militaires et les services de renseignements. Dans les années 2000, l'informatique a permis d'exploiter jusque dans ses retranchements une nouvelle approche, portéeparGoogle,quil'aétendueauWebentier,etparSystran,acteurhistoriquedelatraductionautomatique, néaméricainetaujourd'huifrançais. C'est l'histoire de ces cinquante années d'efforts et de son aboutissement actuel que nous allons vous raconter. Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page1/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences Let'sgo!Aufgehts!Anda!Avanti!Vamos!Gidelim!Allons-y! Page2/5-DelaguerrefroideàInternet L'idéed'utiliserdesordinateurspourtraduiredestextesremonteàlafindelasecondeguerremondiale maislesdébutsfurentlents,avantuncoupd'arrêtdanslesannées1960.L'enviegrandissantedeliredes documents provenant de l'Union soviétique a relancé les recherches. Il y a quelques années, le Web a créé un nouveau besoin. Les énormes investissements de Google et une nouvelle méthode, dite statistique,onttirélemarchédelatraductionautomatique... Après la seconde guerre mondiale, l'idée se fait jour d'unemachine à traduire. Les premiers ordinateurs, comme l'Eniac,esquissentcettepossibilitémaisaussilesentimentqu'effacerlabarrièredeslanguespourraitcontribuerà lapaixuniverselle.L'undespremiersàformaliserl'idéesembleêtreAndrewBooth,unchercheurbritannique,quiy consacradutempsàpartirde1946.Danslesannées1950,latraductionautomatiquerestedansledomainedela recherche théorique mais tout change dans les années 1960 avec la guerre froide. Aux Etats-Unis, le besoin apparaîtdetraduiremassivementdestextesenrusse.EnUnionsoviétique,ons'intéressealorsàlatraductionde l'anglais.Parallèlement,lesordinateursontgagnéenpuissance.Ilsembleenvisageabledelesutiliserpouraumoins aiderlestraducteurs. Années1980.LasociétédeJeanGachotvientderacheterl'entrepriseSystran.©Systran Pourtant, des théoriciens affirment que la traduction automatique restera pour longtemps un rêve, tant les ambiguïtéssontnombreusesdanstoutesleslangues.Dèscetteépoqueapparaîtunenécessité:latraductiondoit prendreencomptelesensdelaphrasepouréviterlesécueils.Enfrançais,terredésignelesol,laplanète,lacôte vuedelamerouencoreunepropriétéagricole.Siunastronauteanglophoneaperçoitsaplanèteparlehublotde sonvaisseauspatial,ils'écrira«Earth!».Maiss'ils'agitd'unmarinàlafind'unetraversée,ilannoncera«landho ! ». Quant à la terre battue par les intempéries, elle sera différente de la terre battue des courts de tennis de Roland Garros. Aux Etats-Unis, un aréopage de scientifiques (Alpac,Automatic Language Processing Advisory Committe)chercheàévaluerlafaisabilitéd'unetraductionautomatique.En1966,l'équiperemetsonrapport,très pessimiste. Mais les besoins du renseignement sont trop forts. Aux Etats-Unis, le gouvernement crée en 1968 la société Systran (System Translation, un sigle qui rime avec Fortran,Formula Translator, le langage de programmation Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page2/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences inventé dans les années 1950). Il apparaît alors que l'on peut simplifier le problème si on accepte une traduction approximative. Depuis cette époque, on distingue ainsi deux domaines : la recherche d'informations et la production de documents. S'il s'agit de générer un texte parfait, alors la difficulté est effectivement gigantesque. Maispourcomprendrelesensd'undocument,onpeutsecontenterd'uneversionimparfaitevoiresyntaxiquement fausse. Années1980.LelogicielSystranvientd'êtreadaptépourMS-Dosettournesurl'IBMPC,icidanssaversionà deuxlecteursdedisquettes,doncsansdisquedur.©Systran BabelenEurope La technique utilisée est aujourd'hui qualifiée d'approche linguistique. Elle utilise des règles, qui sont celles de la grammaireetcellesdelasyntaxe.Parexempleil,enfrançais,peutêtreunpronompersonnelmasculinouneutre.Il estbeau,ilfaitbeauetmêmeilfaitlebeausetraduirontdifféremment.Uneanalysegrammaticaledecettephrase peut différencier les sens deil et defait. Avec une informatique qui gagne sans cesse en puissance et des méthodes qui se raffinent, cette approche connaît de bons succès et, surtout, de nouvelles demandes s'annoncent. La construction européenne est de celles-là. Le service de traduction, au fil des élargissements successifs de la communauté, est devenu pléthorique. Il faut désormais plus 1.700 professionnels pour l'assurer, qui s'aident de logiciels de traduction. Le travail est une collaboration entre la machine, qui prépare le travail et fournit un texte approximatif,etl'homme,quirédigeledocumentfinal. Uneautredemande,croissanteelleaussi,estapparuedanslesannées1990,avecInternet,leWebdevenantune gigantesque bibliothèque multilingue. En 1997, le moteur de recherche Alta Vista adopte le logiciel de Systran, l'entrepriseaméricainedesdébutsdelatraduction,devenuefrançaiseentre-temps. Le service Babel Fish, gratuit, devient le premier outil de traduction, utilisé par des millions de personnes dans le Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page3/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences monde.Mêmesisesformulationsfinaleslaissentàdésirer,avecunesyntaxedouteuse,voirerisible,etdeserreurs assez grossières, Babel Fish permet de lire des contenus de langues étrangères. Google à son tour fait appel à Systran et utilisera son logiciel jusqu'en 2007. Actuellement,BabelFish est accessible chez Yahoo! « On atteint aujourd'huiles60millionsdepagestraduitesparjour»rapporteDimitrisSabatakakis,président-directeurgénéral deSystran. AvantleWeb,leservicedetraductionenligneexistaitdéjàsurleMinitel.©Systran LeWebimposeunenouvellevaguedetraducteurs Entre1998et2007,dynamisé,lemarchédelatraductions'ouvreauxentreprises.Systranéditepasmoinsdesix versionsdesonlogiciel.Lesperformancessontsuffisantespourobtenirdebonsrésultatsdanslestraductionsde documentstechniques.Auprixd'uneinterventionhumainepourlamiseenforme,lerésultatfinalestpubliable.Les entreprises utilisent ces logiciels pour leurs catalogues, les modes d'emploi ou le support technique. Beaucoup viennent du Web. « Quand Cisco n'avait que des pages en anglais pour son support technique, 80 % des anglophones les utilisaient mais seulement 3 % des Asiatiques, se souvient Dimitris Sabatakakis. Les autres téléphonaientauxservicesd'assistance.Toutachangéavecuntraducteurautomatiquequiapermisdetraduire touteslespagesdansplusieurslangues.» DevantcetteaccélérationproduiteparInternetetsonutilisationplanétaire,laguerrefroidesembleloin.Ellel'est pourtant moins qu'on ne l'imagine. Aujourd'hui, Systran, même devenue française, travaille toujours pour l'administration américaine. Mais les demandes vont désormais, entre autres, vers l'arabe et le farsi, la langue parléeenIran.CourrierélectroniqueetnewsgroupspeuventainsiêtresurveillésautomatiquementparlaCIA... C'est du Web encore qu'est venue la dernière révolution de la traduction par ordinateur : la statistique. Initiée dans les années 1990, notamment par IBM, elle consiste à utiliser les traductions déjà réalisées et enregistrées dansdesbasesdonnées.Depuispeud'années,lapuissanceinformatiqueaatteintleseuilpermettantd'utiliserce Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page4/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences procédé,quiadonnéuncoupd'accélérateursansprécédentàlatraductionautomatique.En2007,Google,comme nousallonslevoir,ainvestidessommesénormespourutiliserleWebentiercommebasededonnées.Sesmilliers de serveurs puisent dans toutes les pages Web du monde et repèrent celles qui comportent des traductions. Il suffitalorsderéutilisercetravailinitial... Alors que Google utilise pour l'instant une approche purement statistique, d'autres s'en servent pour compléter l'analyse linguistique. Ce panachage améliore considérablement les performances. Voilà qui explique la fulgurance des progrès récents. Pour autant, la perfection reste encore très loin. Efficace dans le domaine technique, la traduction automatique baisse les bras dans le domaine littéraire, dépassée par les subtilités, les jeux de mots et lesexpressionsimagées.Etcecap-là,laméthodestatistiquenelefranchirapas.Ilfaudratrouverautrechose... Page3/5-Lastatistique,l'armedetraductionmassive Siunmotouuneexpressionontdéjàététraduits,inutiled'effectuerunefoisdeplusletravail.Ilsuffitde recopier.Apartirdeceprincipetrivial,unenouvelleméthodeestnée,baptiséestatistique.Elles'appuie surlapuissancebrutedesordinateursetsurlatailledesbasesdedonnéesarchivéesparlesentreprises. GoogleapousséceprincipedanssesretranchementsenutilisantleWebentier.Maiscelanesuffitpas... La méthode linguistique, qui analyse la structure des phrases trouve ses limites dans la complexité des langues. Dans les années 1990, la puissance des ordinateurs permet d'imaginer une solution différente : puiser dans les immenses corpus des bases de données informatisées pour réutiliser des fragments de phrases déjà traduites. Initiée notamment par IBM, l'approche prend de l'ampleur dans les années 2000 avec Google qui récupère toutes lestraductionsd'Internet,marquantuntournantdansl'histoiredelatraductionautomatique. L'idée peut paraître simple. Beaucoup l'utilisent d'ailleurs sans en avoir conscience. Devant une expression inconnue, il est tentant de la soumettre à un moteur de recherche pour en chercher la traduction dans des sites bilingues ou simplement sur une page où un auteur l'aura traduite. Par exemple, en tapantgravitational microlensing dans le moteur de recherche Google et en restreignant les résultats aux sites francophones, on finit assezvitepardécouvrirquel'expressionfrançaisecorrespondanteestmicrolentillegravitationnelle. Mais le premier résultat trouvé n'est pas nécessairement correct, ni le meilleur quand plusieurs traductions sont acceptées.Letraducteurapusetromper(cequiestleprincipalrisquesurleWeb).Lecontextepeutdifférer.Par exemple, le motblanchir ne se traduit pas de la même manière en anglais s'il s'agit de linge ou d'argent. La méthode doit donc être statistique et comptabiliser les traductions les plus fréquentes. Elle doit aussi porter sur des groupes de mots. Ainsiblanchimentd'argent donnera de meilleurs résultats queblanchiment tout court. Pour donnerdebonsrésultats,laméthodestatistiquedoitaussiprendreencomptelecontexte,c'est-à-direlerestede laphrase,cequipermetdechoisirentreplusieurstraductionspossibles. Desmilliersdeserveurspouruneforcebrute Pour réaliser un travail rapide, ces mots et ces groupes doivent être indexés, c'est-à-dire enregistrés dans une base de données, ce qui conduit à une occupation mémoire considérable. Le corpus peut être constitué à partir d'unensemblededocuments,présentssurundisquedurouungroupedeserveurs. GoogleaengagédesmoyensgigantesquespourutiliserleWebentiercommebasededonnées.Legéantd'Internet estcommetoujourstrèsdiscretsursontravail.Onsaitcependantqueleprocédéutiliséestpurementstatistique, sansaucuneanalysesémantiquedelaphrase.Pourproposer,commeillefaitaujourd'hui,un servicedetraduction de23couplesdelangues(soit23x22,c'est-à-dire506combinaisons),Googledoitavoirengrangédesdizainesde millions de groupes de mots, ce qui implique probablement des milliers de serveurs uniquement destinés à cette tâche. Le résultat est excellent et convient très bien pour la recherche d'information, de la langue étrangère vers le français.Danscecas,ils'agitseulementdecomprendrelesensd'untexteetunrésultatimparfaitpeutsuffire.Le procédé statistique offre un autre avantage : il évolue avec les habitudes, à mesure que les bases de données Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page5/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences sontmodifiées.Unanglicisme,parexemple,pourrafinirparprendreracineets'installercommeunmotfrançais.On acceptedésormaispermafrostpourpergélisoletonnetraduitpascheeseburger... LeservicegratuitproposéparGoogleutiliseexclusivementl'approchestatistique,puisantdanstoutesles traductionsdéjàprésentessurleWeb.Sesperformancessontexcellentesmaismontrentaussileslimitesdu procédé,commettantsouventdeserreurssurlesphrasessimples,courtesoud'unetournurepeuusitée. (Captured'écran) Leprocédéstatistique:mauvaisenlittératureetparfoisgaffeur Malgré ces bons résultats, les statistiques ne peuvent pas tout. Des expressions peu usitées resteront complètement inconnues et sources d'erreurs énormes. Avec «aller de Charybde en Scylla», Google en anglais propose un très mauvais «Charybdis go to Scylla» etYahoo! «to go from Charybde in Scylla », une traduction littéralecorrectemaisquin'aaucunsenspourunanglophone.Labonnetraductionserait«Togooutofthefrying pan and into the fire». Mais le but de la traduction automatique n'est pas de s'attaquer à des textes littéraires. L'approche statistique ne le permet pas plus que la méthode linguistique. En revanche, le domaine technique convientbienauxtraducteursautomatiques,avecsonvocabulaireprécisetsasyntaxemoinsvariée. Unautreécueilguettelaméthodestatistique:lesphrasescourtes.Pours'enconvaincre,ilsuffitdedemanderau traducteur de Google de traduire «je viens». Le logiciel propose un incroyable «I just». Avec «j'arriverai», la traduction est... «j'arriverai» ! Jean Senellart, directeur Recherche et développement chez Systran, explique facilement ces bourdes étonnantes. «La méthode statistique recherche une traduction en tenant compte du contexte. Avec une phrase courte, il n'y a pas de contexte et les plus grosses erreurs sont possibles. Dans ces deuxexemples,unautrephénomèneestmisenévidence.Cesphrasescommencentparjeetc'estunetournure plutôtraredanslestextesissusduWeb.» Aveugle,latraductionstatistiquepeutdoncdonnersouventl'illusiondetrouverparfaitementsoncheminetparfois desecognerdanslesmurs.Pourfairemieux,ilfautdonctrouverautrechose... Page4/5-Lamoraleactuelle:deuxtechniquescomplémentairesvalentmieuxqu'une ! Aprèsavoirfaitfaireunbondenavantàlatraductionautomatique,laméthodestatistiquebuteelleaussi sur une limite : elle ne permet pas de traduire des expressions jamais ou rarement rencontrées. Pour l'améliorer,laseulesolutionconnueaujourd'huiestdelacompléterd'uneclassiqueanalyselinguistique, avecsesrèglespropresàchaquelangue.Unpanachagequifaitsespreuves. La méthode statistique ignore toute règle et ne peut donc effectuer aucune généralisation. Si une traduction est trouvéepourunmotausingulierseulement,lelogicielnesaurapaslemettreaupluriel.Cehandicapestcontourné par l'énorme masse de données que peut traiter un ordinateur ayant accès aux serveurs d'une entreprise ou au Web. Mais contourné seulement. Ce qui n'a pas déjà été traduit ne pourra pas l'être. De plus, on l'a vu avec l'exempledesphrasescourtes,laméthodestatistiqueimpliquedeprendreencomptelecontextepourchoisirparmi plusieurstraductionspossibles.Horscontexte,laméthodestatistique,sansrègle,nepeutplusavancer... Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page6/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences Il est clair qu'une limite est atteinte. La meilleure démonstration de l'existence d'un obstacle est le service de Google. L'entreprise américaine a engagé des moyens importants et dispose aujourd'hui d'une méthode rôdée. La preuveestlarapiditéaveclaquellesontapparuesdenouvelleslanguesaprèslespremierstoursderouesentreles langueslesplusrépandues.LaméthodedeGoogleestmanifestementbienaupointmaiselleneprogressepasen qualité. «Si la puissance informatique était suffisante pour aller plus loin, estime Jean Senellart, directeur de la R&DdeSystran,parexempleenaugmentantlenombredeserveurs,Googleauraitdéjàmisenœuvrelesmoyens nécessaires.Maisilnel'apasfait.» Devantlaphraseilfaitchaud,uneanalyselinguistiquedétailleralaconstructionetdétecteraunpronom (PRO),unverbe(GV,groupeverbal)etunadverbe(ADV).Ellechercheraensuitelarèglecorrespondantàce cas.Ici,troispourraitconvenir.Silaphraseétaitilfaitlebeau,larègleseraitV(faire;objet GN(beau)),oùV désigneunerègleconcernantunverbeetGNungroupenominal.Silaphraseétaitilsefaitbeau,labonne régleseraitV(faire;réfléchi;MODIFIEUR=beau),m odifieurdésignantunmotmodifiantlesensduverbe,ici l'adverbe.Aveclaphraseproposée,labonnerèglesera V(faire;sujet "il";MODIFIEUR=chaud,froid,gris,m auv ais,beau).Enanglais,cetteconstructionsetraduitpar theweatherisMODIFIER(lederniertermedésignantlemodifieur,traduitenanglais).©Systran Lesbienfaitsdesrègles Il semble clair pour tout le monde aujourd'hui que le futur proche de la traduction automatique passe par une approche mixte, mêlant la classique linguistique, avec ses règles, et la statistique, pour effectuer dans une seconde phase une validation par le corpus. Dans un premier temps, l'application des règles permet pour chaque mot ou groupe de mots de déterminer différentes traductions possibles. Les règles permettent de généraliser, c'est-à-dire de traduire une phrase jamais rencontrée en construisant une forme jamais produite. Dans la plupart des cas, plusieurs solutions sont trouvées. L'approche statistique vient alors en appui pour vérifier comment les précédents traducteurs ont choisi parmi elles. En somme, l'analyse linguistique limite le nombre d'erreurs dans les casoùlastatistiquen'estpasefficacetandisquecelle-ciréduitletravaildelapremière. Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page7/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences Unexempleréeldepanachagedesméthodeslinguistiqueetstatistique,pourlatraductiond'uncataloguede produits.Letextesource(colonnedegauche)esttraduitparlaversion6dulogicieldeSystran,avecune méthodelinguistique,etparlaversion7,quiajouteuneauthentificationparlecorpusdedonnées(méthode statistique).Lesexpressionssoulignéesenrougesontcellesquidiffèrententrelesdeuxtraductions.Dansla colonnededroitefigurelabonnetraduction.©Systran Laméthodemixteaunautreavantagedirect,ettrèsmatériel,parrapportàunesolutionpurementstatistique.La taille de la base de données nécessaire est considérablement réduite. Une dizaine de milliers de règles suffisent alors à l'intérieur d'un domaine spécifique (par exemple au sein d'une entreprise). Mais surtout, le cumul des deux techniquesamélioreincontestablementlaqualitédelatraduction. Pour la traduction destinée à la recherche d'informations, qui ne délivre qu'une syntaxe approximative, ce panachagedelalinguistiqueetdelastatistiquedonneaujourd'huilesmeilleursrésultats. Maisuneinterventionhumaineresteindispensablepourallerjusqu'àlaréalisationd'undocumentdéfinitif.Dansles versions de ce logiciel (réalisé par Systran) destinées aux entreprises, le système passe par une phase d'apprentissage,quiconsisteàindexerlesdocumentsdéjàtraduits.L'entreprisedevraendéfinirlaliste,auseinde laquellelelogicielbâtirasonindex,parauto-apprentissage. Un traducteur de chair et d'os interviendra éventuellement pour finaliser la version définitive. C'est ainsi que pourront être corrigées des erreurs mais cette interaction peut aussi servir à prendre en compte des habitudes maison(termespréférés,sigles...). Avec ce triple panachage mêlant règles linguistiques, vérification statistique et peaufinage humain, la traduction automatique,quin'estdoncalorsqu'unetraductionassistée,peutdésormaisdonnerd'excellentsrésultats. Page5/5-Latraductionaupiedd'unenouvellemontagne Comment aller plus loin ? Il est désormais clair qu'augmenter encore la puissance de feu informatique n'améliorera guère l'efficacité de la traduction. Pour progresser, il faudra des algorithmes plus subtils, Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page8/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Futura-Sciences prenant en compte le sens des phrases. Revenir aux sources en quelque sorte puisque le même problèmeestapparuàl'aubedelatraductionautomatique. En empilant les deux techniques actuelles, le résultat reste largement insuffisant pour obtenir un document irréprochable, qu'il s'agisse d'un site web ou d'un catalogue de produits. Pour décrire la situation, les spécialistes présententsouventl'analogied'unedistanceàparcourir.S'ils'agitd'allerdeParisàNice,latraductionautomatique ira jusqu'à Lyon ou à Marseille, selon son efficacité, mais il faudra toujours terminer le voyage avec un cerveau humain. Même si la traduction automatique effectue aujourd'hui la majeure partie du parcours, le dernier tronçon est de trèsloinleplusardu.Ilnepourraêtrefranchiqu'àl'aidedetechniquesnouvelles.Lapuissancebruteamontréses capacités puis sa limite. Pour affiner les traductions, il faudra que les logiciels prennent en compte le sens. Pour traduirelaphrase«garçon,undemi!»,ilfautsavoirreconnaîtrelecontexte,celuid'unepersonnedansuncafé, pourtrouverlesbonséquivalentsdegarçonetdemi. Unécranutilisépouréditerlestraductionsconnuesetenrichirmanuellementlabasededonnées.©Systran Laquêtedusens Cette difficulté de l'approche sémantique avait été perçue dès l'origine de la traduction automatique. Elle avait même découragé la communauté scientifique, comme en témoigne le rapport Alpac (Automatic Language ProcessingAdvisoryCommittee),rédigépardeschercheursaméricainsetdiffuséen1966,quitraduisaitungrand scepticismesurlafaisabilitédelatraductionautomatique. Trenteansplustard,laméthodestatistiqueaprovisoirementeffacécetteimpressionmaisaprèslebondenavant qu'elle a permis, les spécialistes de la traduction automatique se trouvent à nouveau face à cet écueil, qui ressembleàunemontagne.Laballeestdésormaisdanslecampdesthéoriciens.Onpeutprédiresansgrandrisque de se tromper que les extraordinaires progrès réalisés ces dernières années ne se poursuivront plus au même rythmedanslesprochainesannées... Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Page9/10 Dossier>Traductionautomatique:lesannéesoùtoutachangé Source:http://www.futura-sciences.com/magazines/high-tech/infos/dossiers/d/informatiquetraduction-automatique-annees-tout-change-831/ Futura-Sciences Page10/10