la structure temporelle du French Time Bank telle qu
Transcription
la structure temporelle du French Time Bank telle qu
Université Paris Diderot – 15/16 TP: Cohérence du French Time Bank Objectif du TP Extraire (une partie de) la structure temporelle du French Time Bank telle qu’elle est induite par les annotations, pour pouvoir vérifier la cohérence de cette structure. <?xml version=’1.0’ encoding=’UTF-8’?> <!-Source: Est Républicain/CNRTL Copyright 2010 André Bittar This file is part of the French TimeBank. The French TimeBank is distributed under the terms of the Lesser General Public License for Linguistic Resources. See file LICENSE (distributed with this file) or read the license at http://infolingu.univ-mlv.fr/DonneesLinguistiques/Lexiques-Grammaires/lgpllr.html //--> <TimeML> <TEXT> <TIMEX3 functionInDocument="CREATION_TIME" tid="t1" type="DATE" value="1999-05-17" />Premier <EVENT class="OCCURRENCE" eid="e9" eiid="ei9" pos="NOUN" pred="DOUBLÉ">doublé</EVENT> de la «Scuderia» en Principauté. <SIGNAL sid="s1">Après</SIGNAL> un très bon <EVENT class="OCCURRENCE" eid="e2" eiid="ei2" pos="NOUN" pred="DÉPART">départ</EVENT>, Michael Schumacher a <EVENT class="STATE" eid="e10" eiid="ei10" pos="VERB" pred="FAIRE" tense="PAST" vform="PASTPART">fait</EVENT> cavalier seul. Il <EVENT class="STATE" eid="e13" eiid="ei13" pos="VERB" pred="DEVANCER" tense="PRESENT">devance</EVENT> son coéquipier Eddie Irvine de <TIMEX3 tid="t3" type="DURATION" value="PT30.4S">30,4 secondes</TIMEX3>, <EVENT class="OCCURRENCE" eid="e5" eiid="ei5" pos="VERB" pred="SIGNER" tense="PRESENT">signe</EVENT> sa 35e <EVENT class="OCCURRENCE" eid="e6" eiid="ei6" pos="NOUN" pred="VICTOIRE">victoire</EVENT>, la quatrième à Monaco, la 16e avec Ferrari. Un record absolu. Dans ce grand <EVENT class="OCCURRENCE" eid="e8" eiid="ei8" pos="NOUN" pred="PRIX">prix</EVENT> au millimètre, seules neuf voitures ont <EVENT class="OCCURRENCE" eid="e7" eiid="ei7" pos="VERB" pred="PASSER" tense="PAST" vform="PASTPART">passé</EVENT> la ligne d’arrivée. </TEXT> <TLINK eventInstanceID="ei9" lid="l1" origin="USER" relType="BEFORE" relatedToTime="t1" /> <TLINK eventInstanceID="ei8" lid="l2" origin="USER" relType="BEFORE" relatedToTime="t1" /> <TLINK eventInstanceID="ei9" lid="l3" origin="USER" relType="DURING" relatedToEventInstance="ei8" /> <TLINK eventInstanceID="ei7" lid="l4" origin="USER" relType="DURING" relatedToEventInstance="ei8" /> <TLINK eventInstanceID="ei13" lid="l5" origin="USER" relType="SIMULTANEOUS" relatedToTime="t3" /> <TLINK eventInstanceID="ei13" lid="l6" origin="USER" relType="DURING" relatedToEventInstance="ei9" /> <TLINK eventInstanceID="ei10" lid="l7" origin="USER" relType="AFTER" relatedToEventInstance="ei2" signalID="s1" /> <TLINK eventInstanceID="ei10" lid="l8" origin="USER" relType="INCLUDES" relatedToEventInstance="ei5" /> <TLINK eventInstanceID="ei10" lid="l9" origin="USER" relType="INCLUDES" relatedToEventInstance="ei13" /> <TLINK eventInstanceID="ei5" lid="l10" origin="USER" relType="IDENTITY" relatedToEventInstance="ei6" /> </TimeML> 1. Après avoir récupéré la version 1.1 du FTiB, utiliser la bibliothèque xml de votre choix pour en extraire les informations pertinentes. 2. Commencer par extraire les informations TLINK before et after, pour construire une représentation en mémoire du graphe pour chaque texte. 3. Vérifier que le graphe est cohérent, et ajouter dans le graphe les relations obtenues par transitivité. Produire une sortie textuelle pour rendre visible le graphe : ei9 : doublé ei8 : prix t1 : premier ei9 < t1 ; ei8 < t1 4. Ajouter les relations simultaneous et identity, et vérifier de nouveau la cohérence du graphe en ajoutant les relations inférées. 5. Idem avec during et includes. Bonus Ajouter les autres types de relations. Le programme doit fonctionner sans erreur sur les 108 documents.