File Information

File: 05-lr/acl_arc_1_sum/cleansed_text/xml_by_section/metho/73/c73-2018_metho.xml

Size: 12,432 bytes

Last Modified: 2025-10-06 14:11:13

<?xml version="1.0" standalone="yes"?>
<Paper uid="C73-2018">
  <Title>FIM TRE PLU PRE IND</Title>
  <Section position="1" start_page="0" end_page="0" type="metho">
    <SectionTitle>
JACQUES COURTIN
UN ANALYSEUR SYNTAXIQUE INTERACTIF POUR LA
COMMUNICATION HOMME-MACHINE
</SectionTitle>
    <Paragraph position="0"> Nous envisageons la r&amp;lisation d'un syst~me de communication Homme-Machine en langues naturelles, qui pourrait 8tre utilis6 par exemple pour l'dtude de la langue elle-mSme ou pour la rdalisation d'un syst~me questions-r~ponses sttr un sujet d~termind (consultation d'tme banque de donn~es et r6ponses approprides).</Paragraph>
    <Paragraph position="1"> Avant d'en arriver ~t la rdalisation du module s~mantique, il faut se d~finir un module d'analyse morphologique et un module d'analyse syntaxique. N~anmoins, nous pensons que la sdmantique dolt pouvoir intervenir le plus rapidement possible afin de lever les ambiguit~s rencontr~es au niveau du module pr~cddent.</Paragraph>
    <Paragraph position="2"> Dans cet exposd, nous nous limiterons ~ l'&amp;ude des deux premiers modules.</Paragraph>
    <Paragraph position="3"> D~s ~t present, nous pr6cisons que nous nous sommes orient,s vers des syst~mes interactifs afin d'dtablir un vdritable dialogue entre l'utilisateur et la machine.</Paragraph>
    <Paragraph position="4"> Pour l'analyse morphologique, nous ne nous smnmes pas limitds uniquement fi la reconnaissance du mot mais dgalement ~t celle des lo cutions non ambigues afin d'dviter leurs reconstructions au niveau de la syntaxe. Ce premier module constitue k lui seul un v&amp;itable syst~me puisque nous avons d6fmi un dditeur morphologique conversationnel dont les grandes lignes seront explicit~es en 1.</Paragraph>
    <Paragraph position="5"> Quant ~t l'analyseur syntaxique, nous nous sommes fixds comme objectif d'obtenir directement des structures de dSpendances car elles sont facilment interpr~tables. Nous avons donc abandonn~ les structures de constituants obtenues ~t partir des grammaires &lt;&lt; context-free ~ pour les raisons suivantes: les algorithmes d'analyse avaient l'inconv~nient majeur de conduire k une tr~s grande combinatoire. On pouvait certes la limiter en introduisant des &lt;&lt; validations-saturations )) qui avaient le d~savantage de demander au linguiste de d~finir le cheminement de l'algorithme au niveau de la grammaire. I1 en rdsultait une tr~s grande difficultd de mise au point.</Paragraph>
  </Section>
  <Section position="2" start_page="0" end_page="0" type="metho">
    <SectionTitle>
184 JACQUES COURTIN
</SectionTitle>
    <Paragraph position="0"> D'autre part, cette d6marche nous semblait peu naturelle et ndcessitait ensuite l'6criture d'un module suppl~mentaire permettant d'obtenir des structures plus facilement interpr6tables que les structures de constituants.</Paragraph>
    <Paragraph position="1"> Nous avons 6galement 6cart6 les algorithmes ddfinis k partir d'une grammaire de d6pendances du fair m~me qu'elle ndcessite un nombre important de r~gles car it taut expliciter toutes les configurations possibles de d6pendants sous un gouverneur donn6.</Paragraph>
    <Paragraph position="2"> Le choix que nous avons fait a 6t6 d'accepter comme donn6es des structures de d6pendances. Cette strat6gie, qui sera ddfinie en 2, conduit naturellement k un syst~me d'apprentissage. L'algorithme n'acceptant que des relations entre les cat6gories, il fera appel ~t une grammaire context-free pour valider une sous-structure terminale en vdrifiant les accords entre les variables. I1 est ~t noter que l'6criture de cette grammaire sera extr~mement simplifi6e 6tant donn6 qu'il suftit de pr6ciser tmiquement les conditions de r4dcriture des variables grammaticales entre les catdgories.</Paragraph>
    <Paragraph position="3"> Cette ddmarche nous semble beaucoup plus naturelle. Nous pr6cisons d~s maintenant que pour des facilit6s de r6alisation nous ne traiterons que des structures de ddpendances projectives.</Paragraph>
    <Paragraph position="4"> Nous pouvons r6sumer le projet par le sch6ma ci-dessous:</Paragraph>
  </Section>
  <Section position="3" start_page="0" end_page="0" type="metho">
    <SectionTitle>
UN ANALYSEUR SYNTAXIQUE INTERACTIP 185
1. EDITEUR MORPHOLOGIQUE CONVERSATIONNEL
</SectionTitle>
    <Paragraph position="0"> Cet ~diteur s'adresse ~ deux categories d'utilisateurs: -- le sp6cialiste qui est charg~ de la r~alisation du systbme morphologique du point de vue linguistique, le non sp6cialiste qui d6sire faire de l'analyse morphologique sans ~tre oblig~ de connaltre le fonctionnement du syst~me.</Paragraph>
    <Paragraph position="1"> 1.1. Les outils mis ~ la disposition du spddaliste.</Paragraph>
    <Paragraph position="2"> -- L'analyse morphologique est r6alis4e ~t l'aide d'une grammaire d'dtats finis munie de validations et de saturations qui permet non seulement de reconnaltre un mot de la langue mais 4galement de r&amp;liser en parallSle une transduction des variables.</Paragraph>
    <Paragraph position="3"> -- Du point de vue morphologique, chaque mot peut 8tre rangd dans une classe ayant un certain comportement linguistique. Par exemple, en franqais les verbes du premier groupe: aimer, chanter, diviser, etc ..... admettent la mSme conjugaison. On a donc choisi arbitrairemerit un mot de la classe afin de pouvoir, au moment de l'indexage, faire rdfdrence ~. ce mot. C'est ce que nous avons appel4 un module.</Paragraph>
    <Paragraph position="4"> Par exemple, si on choisit la base chant comme modhle, dans le dictionnaire il suffira de dire que les bases DIVIS, AIM, etc ... se comportent comme CHANT du point de vue de la conjugaison verbale.</Paragraph>
    <Paragraph position="5"> -- Nous avons donc mis k la disposition du linguiste un petit langage extrSmement simple qui lui permettra d'6crire les r6gles de grammaire et les modhles. La mise au point se faisant ~ l'aide d'un terminal par l'interm~diaire du systhme CP/CMS de l'universit4 de Grenoble, l'utilisateur peut donc ~. tout moment modifier les rhgles et les mod61es qui sont ensuite compil4s en vue du traitement morphologique.</Paragraph>
    <Paragraph position="6"> -- Quant au dictionnaire, il est important de noter: a) qu'il est organisd par ordre alphab4tique et en fonction de la fr~quence des mots.</Paragraph>
    <Paragraph position="7"> b) Qu'&amp;ant donn6 que l'on d~sire obtenir tousles d~coupages possibles, on a utilis4, pour l'identification, la technique du Iongestmatch; c'est-k-dire que l'on cherche la plus longue superposition possible entre l'occurrence et un ~ldment du dictionnaire; une fois trouvde, on recherche tm 418ment plus court quc cette dernihre et ainsi de suite.</Paragraph>
    <Paragraph position="8"> Nous avons donc organis4 le dictionnaire de telle sorte qu'ayant trouv4</Paragraph>
  </Section>
  <Section position="4" start_page="0" end_page="0" type="metho">
    <SectionTitle>
186 JACQUES COIYRTIN
</SectionTitle>
    <Paragraph position="0"> la plus longue superposition possible, on obtienne &lt;~ presque gratuitement ~ les ~ldments qui sont plus courts.</Paragraph>
    <Paragraph position="1"> c) qu'6tant donn6 que l'on d6sire analyser des formes completes telles que: c)gauche de, c) droite de, etc .... , le blanc ne sera plus consid6r6 comme un s6parateur.</Paragraph>
    <Paragraph position="2"> 1.2. Les outils mis ~ la disposition du non sp3cialiste et du sp3cialiste. Nous avons voulu donner k l'utilisateur, en cours d'ex6cution d'analyse morphologique, la possibilit6: -- de corriger un mot real orthographi6.</Paragraph>
    <Paragraph position="3"> -- d'interroger le dictionnaire; --d'indexer automatiquement, sans &amp;re oblig6 de connaltre les modbles, gr,~ce k un syst~me d'6quivalence; de donner une dquivalence morphologique sans pour cela ~tre oblig6 d'introduire le mot dans le dictionnaire (cette option est particuli~rement int6ressante pour les noms propres, noms de villes, les mots rares, etc ...); de faire du pas k pas et ainsi pouvoir v6rifier les rdsultats apr~s chaque mot.</Paragraph>
    <Paragraph position="4"> Nous avons 6numdr6 ici les fonctions principales de cet 6diteur, 6tant bien entendu que routes ces possibilit6s sont offertes k l'utilisateur en cours d'ex6cution et qu'elles ne remettent pas en cause la pattie du texte d6j~t analys6e.</Paragraph>
  </Section>
  <Section position="5" start_page="0" end_page="0" type="metho">
    <SectionTitle>
2. ANALYSE SYNTAXIQUE
</SectionTitle>
    <Paragraph position="0"> Pour r&amp;liser cette analyse, nous nous sommes servis de la notion de poids qui avait 6t6 introduite dans le syst~me de traduction automatique du C.~.T.A. pour effectuer la g6ndration du fran~ais.</Paragraph>
    <Paragraph position="1"> Nous rappelons ici la d6finition du poids.</Paragraph>
    <Paragraph position="2"> Poids. A chaque sommet de la structure de d6pendances, on va affecter un poids. Les poids n6gatifs correspondront aux mots plac6s k gauche du gouvemeur, et les poids positifs ~. ceux placds k droite, le gouverneur ayant un poids z6ro par rapport ~t ses d6pendants.</Paragraph>
    <Paragraph position="3"> D'autre part, il est 6galement important de noter clue le poids est en m~me temps caract6ristique d'une fonction syntaxique.</Paragraph>
  </Section>
  <Section position="6" start_page="0" end_page="188" type="metho">
    <SectionTitle>
ON ANALYSEUR SYNTAXIQUE INTERACTIF 187
</SectionTitle>
    <Paragraph position="0"> Nous avons ~galement ajout6 une cat~gorie syntaxique appel6e phrase qui est telle que tousles gouverneurs d'tme phrase auront un poids -t- 1 par rapport ~t cette catdgorie.</Paragraph>
    <Paragraph position="2"> Nous allons done demander ~t l'utilisateur de d6crire la langue en fournissant au syst~me des relations de d@endances munies de poids.</Paragraph>
    <Paragraph position="3"> Nous nous sommes done d6finis un tableau ~ trois dimensions A (n,n,p) o?.1 nest le hombre de cat6gories, et p le hombre maximum de relations diffdrentes entre deux cat6gories.</Paragraph>
    <Paragraph position="4"> ~ Exemple: si pour la phrase le petit chien noir mange la soupe, le linguiste nous a fourni la structure suivante:</Paragraph>
    <Paragraph position="6"> le tableau aura la forme suivante:</Paragraph>
    <Paragraph position="8"> Nous donnons maintenant les points principaux de l'analyseur en terminant par un exemple qui permettra de d6terminer la philosophie de la m6thode.</Paragraph>
    <Paragraph position="9"> Soit une phrase X1 X2 ............. X. oh Xi est une cat~gorie syntaxique. null On extrait du tableau pr~c6dent A les informations propres ~t cette phrase.</Paragraph>
    <Paragraph position="11"> P/j: ensemble des poids entre le d6pendant X~ et le gouverneur X~.</Paragraph>
  </Section>
  <Section position="7" start_page="188" end_page="188" type="metho">
    <SectionTitle>
UN ANALYSEUR SYNTAXIQUE INTERACTIF 189
</SectionTitle>
    <Paragraph position="0"> Propridtds de ce tableau: b) i~tant donn~ que nous ne traitons que des structures de d~pendances projectives, nous avons les propri6t&amp; suivantes: bl VC/, V i, avec i &gt; j, si l'ensemble Pis n'est pas vide, il ne peut ~tre constitu6 que de poids strictement positifs.</Paragraph>
    <Paragraph position="1"> b2 Vi, Vs, avec i &lt; j, si l'ensemble Piy n'est pas vide, il ne peut &amp;re constitu6 que de poids strictement ndgatifs.</Paragraph>
    <Paragraph position="2"> Le premier pas de l'algorithme consiste donc en la suppression des poids positifs ou des poids ndgatifs des ensembles Psi suivant que i &lt; j ou i&gt;j.</Paragraph>
    <Paragraph position="3"> Etude de plusieurs ddpendants ~ droite d'un gouverneur.</Paragraph>
    <Paragraph position="4"> Etant donn6 qu'il n'y a auctme relation entre les ddpendants ~ droite et les d6pendants ~. gauche, nous nous posons le probl~me suivant: soit X s. un gouverneur, et X~I X~2 ........... X,, n d6pendants possibles de Xj avec Nous avons d'abord la solution 6vidente d'un seul d6pendant. On les prendra donc successivement les uns apr~s les autres pour savoir si l'on peut construire tree telle structure.</Paragraph>
    <Paragraph position="5"> Ensuite, il faudra examiner la possibilit6 de deux d6pendants, puis de trois, etc .... jusqu'~, n d6pendants.</Paragraph>
    <Paragraph position="6"> Nous allons donner maintenant l'algorithme qui permet de d6terminer si n d6pendants sent possibles.</Paragraph>
    <Paragraph position="7"> Soient Pili, Pi2s ........ P~,i l'ensemble des poids correspondant ~t x,.l x,3 ........ x,., pour obtenir ~.~,. il faut trouver un poids de l'ensemble x,, x,2</Paragraph>
  </Section>
class="xml-element"></Paper>
Download Original XML