OmegaT - Didier Briel Consulting

Transcription

OmegaT - Didier Briel Consulting
OmegaT
TAO-CAT 2015, Angers
Didier Briel
juin 2015
OmegaT
Démonstration standard
Démonstration standard
Cahier des charges
•
•
•
•
•
•
•
3
Création d'une mémoire Mem_01 par alignement des fichiers
"avian1b_en.docx" et "avian1b_fr.docx" (EN->FR)
Création d'une mémoire Mem_02 par import du fichier nommé
"avian1_en-fr.tmx" au format TMX 1.4
Création d'un glossaire Term_01 par import du glossaire
avian_glossary_EN_FR.xlsx (ou avian_glossary_EN_FR.tsv séparation par tabulations). L'import de la colonne 3, "Definition",
est optionnel
Pré-traduction du fichier "avian_EN_2d.docx", à l'aide de Mem_01,
Mem_02 et Term_01
Production de statistiques de pré-traduction
Traduction complète interactive (avec un peu de traduction
humaine, il devrait être possible sur 10 min d'édition de traduire
tout le fichier : nous demanderons aux traducteurs de la salle de
nous aider pour le contenu)
Finalisation et récupération du fichier finalisé au format .docx
OmegaT, TAO-CAT 2015, Angers
juin 2015
Démonstration standard
Étapes
•
•
•
•
•
•
•
•
4
Alignement de documents .docx
Création d’un projet
Importation d’une mémoire de traduction
Importation d’un glossaire
Pré-traduction d’un document .docx
Statistiques
Traduction complète interactive
Finalisation et récupération du fichier
finalisé au format .docx
OmegaT, TAO-CAT 2015, Angers
juin 2015
Démonstration standard
Alignement
• OmegaT ne dispose pas d’un aligneur
générique
– La fonction d’alignement d’OmegaT ne
fonctionne que pour des fichiers avec identifiants
• Fichiers de localisation Java
• Fichiers de localisation PO
• OmegaT n’est pas un programme tout-enun, n’importe quel programme libre peut
faire partie de l’ensemble
• LF Aligner est un aligneur automatique libre
performant
– La licence est identique à celle d’OmegaT
• GPL v3
5
OmegaT, TAO-CAT 2015, Angers
juin 2015
OmegaT
Présentation d’OmegaT
Sommaire
•
•
•
•
•
•
•
7
Licence
Fonctions principales
Formats pris en charge
Échange avec les autres logiciels de TAO
Projets en équipe
Configuration matérielle et logicielle requise
Support technique
OmegaT, TAO-CAT 2015, Angers
juin 2015
Licence
• OmegaT est un logiciel libre sous licence
GPL v3
• Téléchargement et distribution libres et
gratuits
• Aucun coût de gestion de licence
• Accès au code source garanti
8
OmegaT, TAO-CAT 2015, Angers
juin 2015
Fonctions principales
•
•
•
•
•
•
•
•
•
•
Correspondances partielles (fuzzy matching)
Propagation automatique des traductions
Nombre illimité de mémoires de traduction
Nombre illimité de glossaires
Recherche de termes dans le projet, dans les mémoires de
référence, dans les glossaires et dans des documents de référence
Projets comportant un nombre quelconque de dossiers et de
fichiers, dans tous les formats acceptés
Projets en équipe avec un nombre illimité de traducteurs
Gestion des écritures de droite à gauche et mixtes
Protection et validation des balises (vérification du formatage)
Reconnaissance morphologique
–
–
–
–
9
Lemmatisation (correspondances partielles, glossaires)
Mots non significatifs (correspondances partielles)
Calcul des mots (particulièrement pour les langues asiatiques)
Plus de 100 langues disponibles (34 Lucene, plus de 100 Hunspell)
OmegaT, TAO-CAT 2015, Angers
juin 2015
Fonctions principales
•
•
Vérification orthographique (Hunspell)
Vérification linguistique (LanguageTool)
– Règles de base applicables dans la plupart des langues
– Règles spécifiques dans 29 langues
•
•
Dictionnaires (mono et multilingue) au format StarDict et Lingvo DSL
Saisie automatique
– Entrées de glossaire
– Abréviations
•
•
Traduction automatique (Google Translate v2, Microsoft Translator,
Apertium, Yandex)
Exécution de scripts
– Équivalent des macros Word ou Excel
•
API publique pour modules d’extension
–
–
–
–
–
10
Formats de fichier supplémentaires (Okapi)
Traduction automatique locale (Apertium)
Ouverture de dossiers et documents (FolderMenu de Yu Tang)
Système de recherche sur Internet (ExternalFinder de hiohiohio)
…
OmegaT, TAO-CAT 2015, Angers
juin 2015
Formats natifs pris en charge
Formats de documentation
•
•
•
•
•
•
•
•
•
•
•
•
•
•
11
Texte brut (tout encodage géré par Java), y compris Unicode
(X)HTML (y compris arborescence complète de sites Web)
StarOffice, OpenOffice.org, LibreOffice et OpenDocument
Open XML (Microsoft 2007 et supérieur)
Help & Manual
HTML Help Compiler (aide en ligne)
LaTeX
DokuWiki
CopyFlow Gold pour QuarkXPress
DocBook
Iceni Infix (PDF)
Entrée PDF
XLIFF source = cible
TXML Wordfast source = cible
OmegaT, TAO-CAT 2015, Angers
juin 2015
Formats natifs pris en charge
Formats de localisation
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
12
Ressources Android
.properties Java
Fichiers Clé-valeur
DTD Mozilla
Ressources Windows (RC)
Localisation WiX
ResX
Export Flash XML
Camtasia pour Windows
Localisation Magento
Visio (.vdx)
Sous-titres SubRip (SRT)
Images SVG
PO (Portable Object File) (lecture des traductions existantes)
Typo3 LocManager
Fichier langue ILIAS
OmegaT, TAO-CAT 2015, Angers
juin 2015
Formats pris en charge
Formats Okapi
• Okapi est un ensemble de composants et
d’applications de traduction et de localisation
• Le Plugin OmegaT permet de prendre en charge des
formats supplémentaires dans OmegaT
–
–
–
–
–
–
–
–
–
13
InDesign IDML
JSON
Fichiers Qt TS
Trados TagEditor TTX (lecture des traductions existantes)
Projets Transifex
Wordfast Pro TXML (lecture des traductions existantes)
XLIFF (lecture des traduction existantes)
XML générique avec marquage du texte à traduire (ITS)
Doxygen
OmegaT, TAO-CAT 2015, Angers
juin 2015
Échange avec les autres logiciels de TAO
Mémoires de traduction TMX
• TMX version 1.4b niveaux 1 et 2
– Import
– Export
• Informations textuelles préservées, ainsi que les
repères de formatage
• Nombre de mémoires de traduction illimité
14
OmegaT, TAO-CAT 2015, Angers
juin 2015
Échange avec les autres logiciels de TAO
Documents bilingues
• PO
– Lecture des traductions existantes
• XLIFF (natif)
– Bilingue en génération uniquement
– Les traductions existantes peuvent être lues avec Okapi Rainbow
• XLIFF (plugin Okapi)
– Lecture des traduction existantes
• TTX (plugin Okapi)
– Lecture des traductions existantes
• TXML (natif)
– Bilingue en génération uniquement
– Les traductions existantes peuvent être lues avec Okapi Rainbow
• TXML (plugin Okapi)
– Lecture des traductions existantes
15
OmegaT, TAO-CAT 2015, Angers
juin 2015
Échange avec les autres logiciels de TAO
Glossaires
•
Fichiers textes
–
–
–
–
–
Encodage système, UTF-8 et UTF-16 (Unicode)
Colonnes séparées par des tabulations (TSV) ou des virgules (CSV)
Colonnes Source, Cible et Commentaire
Import
Export (un glossaire en écriture par projet)
• Format TSV UTF-8 uniquement
•
TBX (TermBase eXchange)
– Import
•
Connexion au site terminologique TaaS (Terminology as a Service)
– 24 langues officielles européennes plus russe
– https://demo.taas-project.eu/
– Collaboration avec utilisateurs memoQ
•
16
Nombre de glossaires illimité
OmegaT, TAO-CAT 2015, Angers
juin 2015
Projets en équipe
• OmegaT permet d’utiliser des « projets en équipe »
• Il s’agit d’une alternative aux versions « serveur »
des autres logiciels de TAO
• Les données sont installées sur un serveur
Subversion ou Git
– Réseau local
– Internet
• Un nombre quelconque de traducteurs peut
travailler simultanément sur les mêmes documents
• Il est possible de travailler en ligne et hors ligne
– OmegaT se resynchronise lorsque la connexion redevient
disponible
17
OmegaT, TAO-CAT 2015, Angers
juin 2015
Configuration matérielle requise
• Toute plate-forme compatible avec la configuration
logicielle requise
• Les besoins matériels dépendent du volume des
documents à traduire, et de la taille des mémoires
de traduction
– Avec 2 gigas, il est possible de traduire un projet de
300,000 mots
– Avec 6 gigas, il est possible d’utiliser les mémoires de
traduction des Acquis Communautaires de la DGT
• La puissance du processeur est généralement peu
importante
• Le passage d’un segment à un autre est presque
toujours instantané
18
OmegaT, TAO-CAT 2015, Angers
juin 2015
Configuration logicielle requise
• Java (1.6 ou supérieur)
• Système d’exploitation
– Toute plate-forme compatible avec Java 1.6
ou supérieur
•
•
•
•
•
19
Linux
Mac OS X
Microsoft Windows 98 et supérieur
BSD
Solaris
OmegaT, TAO-CAT 2015, Angers
juin 2015
Support technique
• Le support est assuré :
– Par les développeurs
• https://sourceforge.net/projects/omegat/
• Soumissions d’incidents
• Demandes d’améliorations
– Par les autres utilisateurs
• Assistance
• Trucs et astuces
• Discussions sur les fonctionnalités actuelles et
futures
20
OmegaT, TAO-CAT 2015, Angers
juin 2015
Support technique
Groupe utilisateurs
• Liste de diffusion utilisateurs
– https://groups.yahoo.com/neo/groups/omegat/inf
o
– 2280 membres
– 24 h/24 (présence dans la plupart des fuseaux
horaires)
– Langue principale anglais, mais assistance
possible dans de nombreuses langues (français,
allemand, russe, japonais, etc.)
– Écrire dans sa langue maternelle est encouragé
21
OmegaT, TAO-CAT 2015, Angers
juin 2015