SYNTAXE ET INTERPRETATION - Association for Computational

Transcription

SYNTAXE ET INTERPRETATION - Association for Computational
30
1965 I n t e r n a t i o n a l
C o n f e r e n c e on C o m p u t a t i o n a l
Linguistics
SYNTAXE ET I N T E R P R E T A T I O N
B. Vauquois, G. Veillon,
C. E. T . A .
B.P.
8
J. Veyrunes
St M a r t i n d'H~res
/s-"f~'!~
- Is~re -
J.
Veyrmles
- I
I N T R 0 D U C T I O N
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Dans un syst&me de traduction automatique
sion de mod~les(o~
chacun d'eux repr~sente un niveau de la langue source
ou de la langue cible)
d'analyse
fond4 sur une succes-
il faut ~tablir
(relative ~ la langue source)
leur enchainement.
Dans la phase
les liaisons d'enchainement
dites "dirig6es de bas en haut" car les modules successifs
correspondent
des niveaux de hi4rarchie de plus en plus 61ev~s dans la langue
contraire,
dans la phase de synth~se
sont
(relative ~ la langue cible)
; au
les liai-
sons sont dirig4es de haut en bas.
L'analyse d'un texte de la langue source L consiste ~ trouver
dans
le module de niveau le plus 61ev~,
une suite de formules dont
appel6 mod@le M3, une formule ou
la representation dans L e s t
le texte donn~. Si
route formule de M 3 a pour representation dans L au moins uoe phrasede L
on dira que l'analyse se fait phrase ~ phrase. Toutes
sont les diverses
"~quivalentes"
repr6sentations
les phrases de L qui
d'une m~me formule de M 3 sont dites
par rapport au module. Toute phrase de L qui est une repre-
sentation commune ~ deux formules ou plus de M 3 est dite "ambigUe" dans le
modgle. On admettra que le mod61e M 3 possgde aussi une repr4sentation dans
la langue cible choisie L', sans se soucier de savoir si M 3 poss&de encore
d'autres
tions,
representations
dans des langues L", L"', etc... Dans ces condi-
~ toute phrase non ambigUe de L on peut faire correspondre une
phrase de L'. Appelons degr6 d'ambiguit~ d'une phrase de L par rapport au
J. Veyru[~es
mod&le,
le nombre de formules distinctes
2 -
qui ont cette phrase pour repr~-
sent~ation dans L. A route phrase de degr~ d'ambiguit~ n dans L correspond
alors au plus n phrases dans L'. La traduction ne pourra comporter qu'une
seule phrase dans L' si les representations
des n formules de M 3 darts L'
ont une intersection non vide.
Le schema du syst~me de traduction automatique envisag~ est alors le
suivant
:
4-
C~
cn
\
O~
~
o~
0.~
r't
i-t
~-
o
~-~
i~ .
m
N
r-t
"0
f~
rjl
0
f~
0~
</
n
0
1:3.,
ct
b-a
~.
',
'D
0
r~
~
C~
0
"4
0
/
r't
(n
rD
t::J
(D,
I
~n 0
fo
0
0
ro
-I-
r-'r
c~
;:Y
0
rt
~
0
~
rt
1~
H.
C]
0
0"0
0
o
¢
o3
I,O
V
o
0
q~
(~
r-t
C~
o~
(D
~o
I-I-
(D
(o
r-t
0~
<
o~
(h
/
J0 Veyrunes
Ainsi
les modules M 1 et M 2 contiennent
a) La pattie formelle qui r~soud
deux parties
:
le probl~me de d~cision
"la chaTne propos~e ~ l'entr~e appartient
ge artiFiciel de ce module ? Dans
git de trouver toutes
4 -
elle au langa-
l'afFirmative
les structures
:
associ~es
il s'a~ la chai-
he.
b) L'interpr~tation
quJ doit assurer
la liaison avec les
modules de niveau sup~rieur.
Dans sa partie "synth~se",
rJantes pris au module d'automate
L'exemple
ce schema correspond ~ quelques va-
linguistique propos~ par S. LAMB.
le plus simple est celui du module morphologique M I :
le probl~me de d~cision attachd ~ la partie
refus d'une chalne de morphemes
comme
~ormelle est l'acception ou le
~orme d'un mot de la langue. L'in-
terpr~tation syntaxique d'une chaine accept~e consiste ~ la transformer
dl~ments du vocabulaire
terminal du module syntaxique
que, valeurs de variables grammaticales,
r~gles
en
#catdgorie syntaxi-
interdites)0
L'interpr~-
ration s~m~mique de cette m~me chalne consiste ~ donner sa signification
soit sous forme d'~quivalents
t~s s~mantiques
dans la langue cible soit sous forme d'uni-
dans un langage pivot.
L'~tude du module syntaxique M 2 est beaucoup plus compliqu~e.
La partie
formelle de ce module consiste ~galement
de d~cision.
Etant donn~e une chalne de syntagmes
l'interpr~tation du module morphologique,
~ r~soudre un probl~me
~l~mentaires
il s'agit d'accepter
fournis par
ou de
,I. Veyrunes
refuser
cette chaine en tant que phrase
langue source.
source
En r~alit~,
l'interpr~tation
famille de chaines
syntaxiques.
de la famille,
correcte
A une chaSne de mots unique dans
morphologique
de syntagmes
Ainsi,
syntaxiquement
~ moins
fait correspondre
~l~mentaires
d'explorer
la r~solution
pratique
la
la langue
en g~n6ral
une
~ cause des homographies
successivement
dolt
dans
- 5 -
les prendre
toutes
les chalnes
en charge simul-
tan~ment.
En outre,
syntaxiquement
constructions
~tant donn6 que m~me une phrase constitute
ambigus peut admettre
syntaxiques,
plicit~ de structures,
correspondant
la langue naturelle
ser les chaSnes
le mod@le doit rendre compte de cette multi-
lorsqu'elle
existe,
sur chaque chaine de syntagmes
la partie
formelle
de syntagmes
les chalnes
du module
de la grammaire
accept~es
toutes
ainsi que l'algorithme
de la premiere
La deuxi~me
justifier
partie s'attache
~l~ments
soient acceptables
le bien-fond~
~ refu-
A aucune phrase et A
les structures
admissibles.
le formalisme
d'exploitation
~ montrer
fournies
d'6criture
de cette grammaire
la transformation
par la partie
en tant qu' "entr~es"
de ces contraintes,
de M 3 en troisi~me
consiste
partie de cette communication.
faut faire subir aux structures
pour qu'elles
syntaxique
qui ne correspondent
Le choix du type logique de mod61e,
font l'objet
plusieurs
~ cette phrase.
Ainsi,
~ournir pour
dans
de mots non
partie.
qu'il
formelle du module,
du mod&le M 3. Pour
on indiquera
enfin quelques
J. Veyrunes
L'adaptation
langue naturelle
non terminaux.
conduisant
d'un tel formalisme
syntaxique
conduit ~ un tr~s grand nombre d'~l~ments
On a donc ~t~ amen~ g utiliser
~ une grammaire
On ~crit
:
(5)
N ° R~gle
- a HVVa
(6)
N ° R~gle
de dimension
~-~-
B //VVB
LE VOCABULAIRE
I - Des categories
un formalisme
acceptable
[i~°~
d'une
terminaux
et
~quivalent
A ffVVA - SAT
i
TERMINAL
sortes d'~l~ments
type
g l'analyse
- 7
C ~ VVC
du modgle
VIV
syntaxique
est constitud
par 3
:
syntaxiques
not~es a, b, c, ... dans les r~gles
de
(5).
Exemples
: Substantif
Adjectif
commun
qualificatif
Conjonction
2 - Des valeurs
de coordination.
de variables
les r~gles de type
grammaticales
not~es VVa, VVb,
(6).
On associe en effet ~ chaque cat~gorie
p variables
grammaticales
VKi
I ~
pouvant
prendre n .-(VKi) valeurs
valeurs
de variables
variable
diff~rente
... dans
grammaticales,
i~
-
syntaxique
p, chaque variable
onutilise
chacune
le produit
appartenant
K
~Ki
de
g une
J. Veyrunes
Exemples
: "Nominatif
singulier
premiere personne"
3 - Des num~ros
de rggles
(6) sont rep~r~es
On d~sire
r~gle de grammaire
interdites:
LE V O C A B U L A I R E
: N ° rggle
:
de l ' a p p l i c a t i o n
de figurer dans une ou plusieurs
sont satur~es.
d'une
autres r~gles.
Cette liste de rggles,
les r~gles de type
(5) et
NON-TERMINAL
est ~galement
~ven-
(6) sous
non-terminales
constitu~ par 3 ~l~ments
:
not~es A, B, C ...
L'une d'entre elles est distinguee des autres
Exemple
(5) et
SAT.
I - Des categories
t~rise
present
Les r~gles de type
interdire au r~sultat
tuellement vide figure dans
II
; "Indicatif
etc...
par un numdro de r~gles
On dit que ces r~gles
la rubrique
inanim~"
- 8 -
et carac-
l ' o b t e n t i o n d'une structure de phrase.
: Groupe nominal g~n~ral,
2 - Des variables
grammaticales
non-terminales.
verbe g~n~ral,
associ~es,
...
cette fois, aux categories
J. Veyrunes
3 - Des num~ros
de r~$1es
interdites,
comme pr~c~demment.
Les r~gles de construction
que les r~gles
lexicales,
Les principaux
pe
saturer
~l~ments
(5) et (6) ont ~t~ d~finis
terminal
et du vocabulaire
VIV signifie
condition permettant
Identiques
de valider
donn~es.
Exemple
: 12 - B H
valeurs
C //- CAS
La r~gle 12 ne s'applique
de la variable
I
>---
des r~gles
de ty-
du vocabulaire
de Variables.
une r~gle de type
riables
f
aussi bien
des listes de r~gles.
comme constituants
C ont en commun certaines
"
en effet,
constitutifs
si B e t
des valeurs
peuvent,
non terminal.
Valeurs
I
- 9
C'est une
(6) seulement
d'une ou plusieurs
va-
~---
que si B et C ont en commun
CAS.
sont des s~parateurs.
l'ensemble
des ~l~ments
pr~c~dant >- s'appelle
la partie gauche de la r~gle
l'ensemble
des ~l~ments
suivant
la partie droite de la r & ~ e
>- s'appelle
Dans la partie gauche,
l'ensemble
des ~l~ments
pr~c~dant
I
s'appelle
le ler constituant
l'ensemble
des ~l~ments
suivant
I s'appelle
le 2~me constituant
lls sont notes I e t
Exemple
: La r~gle pr~c~dente
2 si n~cessaire.
compl~te
12 - B // I C // - CAS
:
~--- A // CAS
(1.2) -
Le point symbolisant
A seront
celles
l'intersection,
qui constituent
l'intersection
valeurs
du cas du ler constituant
valeurs
du cas du 2~me.
III VARIABLES
GRAMMATICALES
Leur
int~r~t
~
J. Veyrunes
- I0 -
les valeurs
du cas
de l'ensemble
des
de partie gauche avec l'une des
~
consiste
g r~aliser
d'~quivalence
sur le vocabulaire
Les ensembles
quotients
terminal
des partitions
en classes
V T associ~ aux r~gles
sont les categories
syntaxiques
(2).
en nombre
restreint.
Les conditions
n~glig~e
d'applications,
lors des diff~rentes
I) Valeurs
des variables
2) Intersections
restituant
partitions,
impos~es
l'information
sont de 2 types
:
(VVA, VVB).
de valeurs non vides
sur des variables
communes
(VIV).
D] D]
D~finition
:
La r~gle num~rot~e
la rggle num~rot~e
I sature ~ gauche
J relativement
A ~tant obtenue par l'application
constituant
(respectivement
Les ~l~ments
turation gauche ou droite.
~ droite),
~ la cat~gorie non terminale
A, si
de I, on interdit
le ler
le 2~me)
de SAT sont
(respectivement
~ A d'gtre
de la partie gauche de la r~gle J.
: J ' Jd selon qu'il s'agit de sag
On note J s'il n'y a pas d'ambiguit~.
J. Veyrunes
Transmission de saturations
:
Dans le cas de r~gles r4cursives
mission des saturations
Exemple
)----
A //
2-
A // I C / / -
>---
B //-
3
a //
)----
A
4
et //
>---
C
5
~ //
>---
c
I) Regrouper
des saturations
pr~sente 2 int~r~ts
:
dans la m~me cat~gorie non terminale des cat4gories
syntaxiques
lexicales
on peut d4cider de la trans-
de la partie gauche vers la partie droite.
: I - B // i A // -
L'utilisation
- II -
diff~rentes
: les saturations
correspondantes
diff~rencient
port~es par les 2 r~gles
leur comportement
syntaxique
futur.
2) Diminuer
le nombre de structures
jug~es ~quivalents obtenus dans
l'application de la grammaire.
Ainsi l'exemple pr4c4dent permet d'obtenir une seule
structure dans l'analyse des 4num4rations
a, a,
de type
.... , a et a
EXTENSIONS DU FORMALISME PROPOSE
:
Le formalisme ci-dessus reste c o n t e x t - f r e e ~ .
On peut
songer ~ l'~tendre pour traiter les probl~mes de constituants
continus
qui n'appartiennent
pas aux modules "context-free"
dis-
J. Veyrunes
I
-
- I2 -
Variables v~hiculaires ~ G ]
Ii s'agit d'une g~n~ralisation de la notion de variables
grammaticales
permettant de r~aliser des accords g distance entre
2 occurrences
(par ex : accord du pronom relatif avec son ante-
cedent)
et donc de traiter d'une mani~re g~n~rale le probl~me des
constituant s dis continus E ~ ,
~
•
Les variables v~hiculaires
cr~es lors de l'application
d'une r~gle, se transmettent vers l'~l~ment de partie droite
jusqu'~ ce qu'une r~gle y fasse appel.
2 - Empilement
de variables
v~hiculaires
- traitement
de structures
context-sensitive.
L'utilisation
des variables v~hiculaires
limit~ permet de traiter des structures
des structures
de constituants
en nombre
Context-Free
discontinus
ainsi que
qui se ram~nent ais~-
ment g des structures Context-Free.
L'utilisation d'un empilement
comme dans un automate g pile ordinaire
de structures
essentiellement
de variables v~hiculaires
- permet le traitement
context-sensitive.
par exemple des structures utilisant
C'est le cas
le mot "respectivement".
-
J. Veyrunes
Exemple
: La chaine A B C R
A'B'C'
implique
13 -
les livraisons
entre A et A'
Bet
B'
C et C'
On ~crira
)V A
indique
RA '
> ---
R / )V A
RB'
y---
R/ )V B
RC'
>---
R/ ~V C
CR
>---
R/ ~Vc
BE
)----
R/ )0 B
AR
>---
R/ PVA
l'empilement
de la variable
v~hiculaire
associd au
couple A,A'
)V A
indique
la suppression
associ~
au couple A,A'
On peut
v~hiculaires,
imaginer
pouvant
Les langages
context-sensitive.
confondent
dans la pile de la variable
en outre plusieurs
constituer
plusieurs
ainsi reconnus
sortes de variables
piles distinctes.
sont inclus dans les langages
Ii reste ~ prouver,
avec eux.
v~hiculaire
~ventuellement,
qu'ils se
J. Veyrunes
14 -
B - ALGORITHME D'EXPLOITATION DE LA GRAMMAIRE.
BALAYAGE.
L'analyse
d'une phrase selon la grammaire de type Context-Free
normale doit fournir une ou plusieurs
structures
On peut concevoir une recherche
en consid~rant
syst~matique de ces structure ~
tout d'abord la construction des n groupements
veau I (c'est-&-dire
de niveau 2, c'est-&-dire
2 syntagmes
de niveau I. Plus g~n~ralement,
de niveau p e n
de ni-
l'application des rggles du lexique), puis les
groupements
(I, (P-l),
arborescent~binaires
correspondant
& la combinaison de
on cherchera
les syntagmes
formant pour chacun d'entre eux les (p-l) possibilit~s
(2, p-2), ~ ,
p-i)
... (p-l, I).
Cet algorithme dQ & COKE, supposeconnue la longueur n de la
phrase. En utilisant un tel proc~d~, on voit que l'on construit
simultan~ment
terminaux.
tousles
syntagmes
Nous appellerons
de m~me niveau et couvrant
les m~mes
niveau p d'un syntagme le nombre de ter-
minaux qu'il regroupe et q le rang du premier de ceux-ci dans la
chaine
; si l'on n o t e ~
un sommet d'une structure arborescente
binaire ayant le niveau p e t
q,='q + I ... ~ q
n terminaux
couvrant les sommets terminaux
+ p - I, on peut associer & toute structure
(2n - I) sommets
(en comptant les terminaux).
couvrant
:
J. Veyrunes
- 15 -
o-I
6
Exemple
:
2
o~ I
Fig.
2
D'autre part,
s o m m e t s o ~q distincts
P
seul de niveau n.
il est clair qu'il n'y a au total que n (n + I)
2
: n de niveau I, (n - I) de niveau 2 ... et un
L'algorithme
LUKASIEWICZ
a montrg
structures
diff~rentes
consiste ~ examiner
que l'on peut associer
gun
la liste des syntagmes ho-
Au niveau I, cette liste fournit
correspondant
~ une forme.
sommetso ~q possibles.
P
2p-I
I
Cp
2p - I
sommet de niveau p.
A un sommet donn~est attach~e
mographes.
tousles
les diverses
homographies
J. Veyrunes
16 -
Le diagramme suivant permet de representer les sommets d'une
phrase de p mots. Les niveaux sont port,s en ordonn~e, et les num~ros
d'ordre en abscisse.
niveaux
i+
k_
Fig. 3
X
o_j+
k
N ° J'ordre
Aux syntagmes S~correspondant
les syntagmes S ju du sommet
S~
o~ kj + i + I
associ~es au sommet o-j
i+k
au sommet o"~, on peut associer
pour former les combinaisons
J. Veyr~ines
Le programme utilise un tel cadre, chaque sommet
une adresse de liste de syntagmes.
n'est pas connue,
tousles
par diagonales
syntagmes
terminaux,
permet de construire
correspondants
sur la diagonale.
successives.
associ~s aux j (j + I)
2
le (j + i) i~me
terminal
sommets correspondant auxj premiers
les syntagmes
o- ~tant
Comme la longueur de la phrase
les sommets sont parcourus
Si l'on suppose construits
- 17 -
aux j + I sommets
On commencera par examiner t o u s l e s
o~ de la
j + I
ji~me diagonale avec o~
I
(construction de syntagmes asso-
ci~s aux
O-de la j + Iigme
diagonale).
(j I
o~j
2
Puis les
o~de la
l)i~me diagonale avec
...
etc...
~,j + I
I
Fig. 4
j+~
J
L'int~r~t
>
de ce proc~d~ est de supprimer
la contrainte
sur la
longueur de la phrase. L'analyse progresse mot par mot et s'arr~te au
mot p s i
il existe un
syntagme de phrase associ~ au sommet o-I.
P
D'autre part, il est facile d'~viter un grand hombre de
balayages
lorsque
l'on peut savoir que t o u s l e s
syntagmes
associ~s
un sommet donn~ ne sont ~l~ments de gauche d'aucune r~gle.
La figure mat~rialise
famille de points.
Fig. 5
k-I k
cette
J. Veyrunes
II
REPRESENTATION DES STRUCTURES
pondan~.
SYNTAXIQUES
- I8 -
:
A chaque s o m m e t O "q est associ~e une liste d ~ s y n t a g m e s corresP
Ces syntagmes comprennent, outre les informations syntaxiques,
(c'est-g-dire
la cat~gorie,
les saturations
et les variables
cales), le num~ro de la r~gle qui a servi ~ les construire,
adresses des deux syntagmes,
droite et gauche,
grammatiet les
qui forment la partie
gauche de cette rggle.
Nous avons ainsi le schema suivant
I~J'lRil, I
]
:
~ig. 6
-11i~
/
~~Is I~
III REDUCTION DU NOMBRE D'HOMOGRAPHIES
:
La liste des syntagmes homographes
peut ~tre consid~rablement
ayant des valeurs
un sommet ~ ,q
P
associ~e ~ un sommet donn~
r~duite en ne conservant
syntaxiques diff~rentes.
sont alors d~crits
que les syntagmes
Les syntagmes associ~s
comme une liste de syntagmes auxquels
J. Veyrunes
est associde
une liste de r~gles:
q
o'p
Fig.
19
I
J
7
~
i
;
Ceci ~vite
dans la chaine
i
la proliferation
des structures
homographes
;
:
La directrice
de soci~t~ enrhum~e
Fig.
8
•
~
S2
Les syntagmes
7
m~me valeur
SIet
S 2 ayant
syntaxique
seront
group,s.
Cette homographie
tures au niveau
sup~rieur.
ne produira
pas de multiplicit~
de struc-
J. Veyrunes
IV
EXPLOITATION
DE LA GRAMMAIRE
L'exploitation
balayage.
DITE.
de la grammaire
Pour un nouveau
l'existence
PROPREMENT
syntagme
de ce syntagme
est li~e ~ l'algorithme
donn~,
on recherche
comme composant
Ceci utilise ~ la fois la cat~gorie
20
de
tout d'abord
de droite d'une r~gle.
et les saturations
port~es
par le
syntagme.
Lorsque
de telles
r~gles de grammairesaux
D~termination
maticales
liaisons
divers
cation interne de la grammaire
prend en charge
ci-dessus
V
les r~gles
Lorsqu'un
des variables
gram-
La codi~-
par un compilateur,
selon le formalisme
qui
d~crit
:
I
syntagme de type S j correspond
associ~es
Elle se pr~sente
graphe
satisfaction
est r~alis~e
donn~es
les
:
calcul du syntagme r~sultant.
de la chaine est arrgt~e.
des structures
sentant
on applique
(I, A).
FORME DU RESULTAT
l'analyse
couples
de la r~gle,
et des saturations,
sont permises,
l'ensemble
connexe
correspond
~ la famille
au syntagme de phrase trouv~.
comme une structure
des arborescentes
toutes
Le r~sultat
~ une phrase,
binaires,
les sous-structures
de demi treillis
contenant
communes
repr~-
en un seul
ou homographes.
J. Veyrunes - 21 -
DE U X I E M E
PARTI
E
INTERPRETATION DU MODELE SYNTAXIQUE
A - FORME DES STRUCTURES A INTERPRETER :
1
2
3
4
5
6
7
8
9
IO
Ii
LE PHENOMENE AUQUEL NOUS DECIDONS DE CONSACRER CE CHAPITRE EST NOUVEAU
I
T(tI)
I
N(nI)
J
I
N(prl)N(pr2)
J
>(vl)P ( ~
J
l
J
(il),~/A(a~
( n l > ~(n2)
(i2)
[(~3)
(vS)
(rl)
N(n3
V(v4)
Fig. 9
~H(v7)
12
J
V ( v 2 > ,A(a2>//
~~
E(fl>
J. Veyrunes
Dans un but de simplification,
th~orique de la mise en oeuvre pratique,
- 22 -
et pour s~parer la partie
nous ne consid4rons
ici que
le cas d'une structure simple sans homographes.
II s'agit donc d'une structure arborescente binaire dans
laquelle chaque sommet non terminal est un 414ment du vocabulaire non
terminal de la grammaire
(Syntagme). Les 41~ments terminaux de la
structure appartiennent au vocabulaire terminal et sont reli~s ~ des
414ments non terminaux
(r~gles lexicales) dont ils sont les seuls
descendants.
En outre, en chaque sommet non terminal,
de ce sommet,
le nom de la r~gle de grammaire
s'ajoute au nom
(rj) qui a permis de
le construire.
B - FORMES DE L'ENTREE DU MODELE M3. (RESULTAT DE L'INTERPRETATION):
Alors que nous avions une structure sur des syntagmes, nous
ne nous interessons plus maintenant qu'~ des fonctions,
correspon-
dant ~ une interpr4tation des r~gles de la grammaire. Les syntagmes
ont permis de d~terminer la coherence de la phrase et d'en d~duire
une structure. L'interpr~tation doit fournir une nouvelle structure sur des r~gles. En particulier,
la fonction d'ordre associ~e aux
terminaux (ordre s~quentel des mots dans le texte d'entr4e) peut
~tre modifi~e.
La structure obtenue est limit4e ~ une arborescence. Les
terminaux de cette nouvelle arborescence expriment dans le module M 2
les fonctions syntaxiques li~es aux unit~s
lexicales.
P~
>
O4
J. Veyrunes
• ,-=4
->
¢q
=>~
,-~
0
¢q
~4
4-J
04
¢q
IC
~4
0
~-4I
0
.r4
'-~ I U~ P~
¢0
23
J. Veyrunes
Un noeud de la structure
taxique pour son antecedent.
de fonctions
Ii est muni
qui le caract~risent.
les inPormations
n~cessaires
interpr~t~e
- 24 -
est une Fonction syn-
lui m~me d'un certain nombre
La structure est telle que toutes
& caract~riser
un noeud sont donn~es aux
noeuds du niveau suivant.
En g~n~ral,
le noeud precedent.
il existe un ~l~ment distingu~ qui caract~rise
Cet ~l~ment
(ou cette r&gle) pourrait d~finir
gouverneur dans un graphe de d~pendance.
v'2
C'est
(EST) par rapport & @ ou de v'4 (PHENOMENE)
Cependant
il existe des cas
a) o~ l'on rencontre plusieurs
Exemple
trois
le cas par exemple de
par rapport & v'4.
:
r&gles distingu~es
: l'~num~ration ci-dessous dans
:
laquelle n'
Fois.
A
n !
g21
B
!
n
1
\
le
et
c_
II w
I
apparait
J. Veyrunes
b) o3 la r~gle distinguee
ne conduit
directement
~ aucun ~l~ment
- 25 -
ter-
minal.
Exemp le :
PIERRE
ET
PAUL
VONT
ET
VIENNENT
n'l
~F2
n'l
'----~
v
~2
v'l
¢
Fig.
12
Tel est le cas pour le noeud ~ o~ v'2,
directement
~ VONT ~u VIENNENT)
r~gle distinguee
et exige
l'interm~diaire
ne conduit pas
v'
i"
J. Veyrunes
C - PROCEDE DE CONSTRUCTION DE LA STRUCTURE INTERPRETEE
L'exemple
respondant
:
qui a servi d'illustration en CA) et en (B), cor-
aux figures 9 et I0, montre respectivement
formelle et la structure
dans laquelle
- 26 -
interpr~t~e.
Pour effectuer
la structure
la transformation
:
a) les noms de syntagme disparaissent
b) les r~gles rj deviennent
r'j
c) l'ordre des syntagmes ~l~mentaires
(terminaux)
est ~ventuellement
modifi~
d) l'arborescence
ne poss&de plus une structure binaire,
d'une part ~ des donn~es d'interpr~tation
part ~ des algorithmes
on fait appel
sur les r~gles rj, d'autre
d'exploitation de ces donn~es.
I - DONNEES D'INTERPRETATION.
Les donn~es d'interpr~tation
sont les suivantes
:
- Toute r&gle de construction binaire rj de la forme AB~----C
par le symbole "g" ou "d" que le constituant
indique
distingu~ est celui de
gauche A ou celui de droit B.
-
Toute rggle contenant des variables v~hiculaires VHL indique par son
propre
Formalisme d'~criture
s'il s'agit d'introduction,
de transfert
ou de destruction pour chacune de ces variables v~hiculaires.
II - ALGORITHMES D'EXPLOITATION.
i) Algorithme de transformation
:
II s'agit de r~aliser un certain nombre de changements
hi~rarchie
dans la structure pr~sent~e ~ la figure 9 afin de r~tablir
les liaisons correctes dans le cas des gouvernements
d~finit
de
discontinus.
la creation d'une variable v~hiculaire par le symbole
I
~7
On
asso-
J. Veyrunes
- 27
ci~ ~ la r~gle de creation.
la transmission par le symbole • associ~ ~ la r~gle de transmission.
la suppression par le symbole
~ associ~ ~ la r~gle de suppres-
sion.
Ces symboles
naissance
sont notes ainsi que "g" ou "d" dans la phase de recon-
formelle.
On appelle chemin ~toil~ un chemin du graphe tel que le
noeud initial contienne
contiennent
le symbole
~
et les noeuds interm~diaires
le symbole ~.
Le noeud final est celui qui suit le noeud contenant
symbole
$et
formation g
le
que l'on atteint ~ partir de ce dernier en suivant
l'in-
(respectivement 3).
Soit C . un chemin ~toil~ de longueur p commencant
nl
au noeud
n,
]_
C~ni = (Ni' Ni+l'
''" ' Ni+ P+I )
A chaque noeud Ni+ j de C~ ou associe le sous-graphe Ti+ j de
ni
sommet Ni+ j e t ne contenant ni Ni+j+ 1 ni ses descendants.
L'algorithme
graphe,
~ partir
consiste ~ traiter successivement
de l a r a ~ i n e
tousles
C~. du
nl
de l a s t r u c t u r e .
Pour chacun d'eux, pris dans cet ordre le traitement
a) transformer C~ni = (Ni, Ni+l,
consiste
... , Ni+p, Ni+p+ I) en le chemin
(non
J. Veyrunes
~toil~)
de longueur p : Cni+p = (Ni+l ' "'" ' Ni+p' Ni' Ni+p+l)
restant attaches
aux noeuds
Ni+ j auxquels
ils ~taient primitivement
associ~s.
b)
- 28
on note sur N. autant de • diff~rents
i
chemins ~toil~s entre
Ni+ p et Ni+p+ 1.
que l'on a interrompu de
J. Veyrunes - 29 -
2) Algorithme de construction des noyaux.
Sur le plan th~orique cet algorithme se divise en deux phases. En premier lieu on e~fectue la s4quence d'op~rations qui suit.
On proc~de, niveau par niveau, en commengant par le niveau
terminal, ~ l'a~fectation pour chaque noeud d'un symbole not6, soit
r'j d4duit du nom de r~gle rj port4 par le noeud imm4diatement ant4rieur, soit
.A.
La r~gle d'affectation est donn~e dans tousles
cas possibles par les graphes suivants :
r.
(d)
1
r. Cg)
/%
b
Iri
r I.
1
I
r I
i
Exemple :
CE
CHAPITRE
EST
NOUVEAU
(ce)
1
n' 2
aI
I
(chapitre) (est) (nou~m)
1
i v
Ji
a'2
~-
n2
~
i
g
.
'J4 (d)
14
fig. 15
J. Veyrunes
En outre,
dans certains
r. (d g) la r~gle d'application
r.
1
- 30 -
cas, nous aurons des r~gles du type
est la suivante
:
(d, g)
il n'y a pas de r'
La figure I~ montre le r~sultat de l'application de l'algorithme
(i) et de cette phase de l'algorithme
melle de la figure 9.
(2) sur la structure
for-
J. VeyriLnes -31-
J. Veyrunes
Ensuite,
on transforme
l'arborescence
les noyaux de la phrase.
Pour cela on consid~re
tousles
:
chemins
du type
(R'i, A , ... A ) notes
On d~finit
r(R'.)
alors
U V(A)
1
En pratique,
et en r~tablissant
Ainsi,
Dans
graphe
i
tion
et
n,l A
A
i
i
binaire pour constituer
dans
le graphe
obtenu
~ chaque R'i
(~'i' G), avec G(R' i , A . . . , A )
...
on r~alise
ce graphe en supprimant
de A ~ ses successeurs
les noeuds
sur le R'..
i
sont conserves.
le cas o~ il y a deux ~ s o u s
transform4,
P'g
le graphe
les liaisons
les noeuds R'
~'i associ6s
- 32 -
il y a lieu de d~finir
. Ce cas se rencontrera
un R'i, pour d6finir
~'
_ i
le
par l'union des chemins
en particulier,
pour
la coordina-
:
Bn, 1
'g'l
,//
A
n'l
' g'l
o
B
/
n'l
J. Veyrunes
TROI
S I EME
PARTI
-33 -
E
LE MODELE M3.
C'est un langage
representation
une
artificiel
famille de phrases
la langue source L (et aussi dans
dans
lequel chaque
significatives
formule a pour
~quivalentes
dans
la langue cible pour que la traduc-
tion soit possible).
Le "degr~ de signification"
d~pend ~videmment
signification
du module.
dans L
On se borne ici ~ mettre en ~vidence
la
syntaxique.
A partir de la structure
taxique
que l'on peut atteindre
(figure
fournie par l'interpr~tation
I0) ~ propos de l'exemple
choisi,
syn-
la formule d~-
duite dans M3 est celle donn~e par le graphe de la figure
Le module M3 accepte
r~gles de sa grammaire
et les codes s~m~niques
tacher aux noeuds
SUJET, ACTION,
une structure
faisant
intervenir
associ~s
des ~l~ments
ATTRIBUTION,
etc
interpr~t~e
g la fois les ~l~ments
aux unit~s
lexicales
du vocabulaire
...).
de M2 si les
permettent
de M3 (par exemple
r'j
d'at:
J, V e y r u n e s
o
z
j
v
oz~
O0
=
.
.,.4
"~
k
/
/~
H
Z
~
H
~ m
g
.
~
Z
•o
w
u
"~
-.--
0
q0
z
~ N
~1
-
34
J. V e y r u n e s
- BI
BLI
35 -
O G R A P H I E -
(t)
C. BERGE
Th~orie des G r a p h e s
DUNOD - Paris.
(2)
J. C O L O M B A U D
Langages a r t i f i c i e l s en analyse s y n t a x i q u e Th&se de 3&me cycle - U n i v e r s i t ~ de Grenoble
(1964).
(3)
G. H. M A T T H E W S
D i s c o n t i n u i t y and A s y m m e t r y in Phrase
Structure G r a m m a r s - Inf. and Contr. 6 - 137 146 (1963).
(4)
G. H. M A T T H E W S
A Note on A s y m m e t r y in Phrase Structure
Grammars - Inf. and Contr. 7 - 360 - 365
et ses applications
(1964)
(5)
N. N E D O B E J K I N E
L. TORRE
Mod&le de la syntaxe russe - I. Structures
abstraites dans une g r a m m a i r e 'context-free'
Document C.E.T.A. G - 201-I (1964).
(6)
B. V A U Q U O I S
G. V E I L L O N
J. V E Y R U N E S
A p p l i c a t i o n des grammaires formelles aux
mod&les linguistiques en t r a d u c t i o n automatique.
C o m m u n i c a t i o n au Congr~s de Prague (Sept. 1964).
(7)
G. V E I L L O N
J. V E Y R U N E S
Etude de la r ~ a l i s a t i o n pratique d'une
g r a m m a i r e 'context-free' et de l'algorithme
associ~. Document C.E.T.A. G - 2OO1- i. (1964).