المستخلص: |
L’un des problèmes qui défient des chercheurs travaillant sur le TALN( ) est sans doute les ambiguïtés générées par les applications linguistiques quelles soit morphologiques, syntaxiques ou sémantiques. De ce fait, une multitude de scénarios de résultats est à prendre en considération. En effet, une confusion détectée entre deux ou plusieurs alternatives pendant une phase d’analyse engendre au moins deux solutions concurrentes. Le problème majeur dans un tel cas réside dans le choix du meilleur scénario possible. Le contexte linguistique précis de l’arabe insiste sur la présence d’une multitude de critères qui témoignent de la fonction de plusieurs contraintes (grammaticale, sémantique, logique et statistiques). Dans ce domaine, la réalisation d’un système performant exige qu’il soit robuste, rapide et moins ambigu afin de permettre une analyse grammaticale correcte. Le but de cet article, outre de faire une description du phénomène de l’ambiguïté et les approches existantes de la levée d’ambiguïté telles que l’utilisation des modèles mathématiques et stochastiques (probabiliste et statistique) ou l’introduction des modèles par contraintes -à base de règles-, vise à analyser et modéliser un prototype d’un système de désambiguïsation morphosyntaxique de l’arabe en proposant une méthode originale basée sur la théorie décisionnelle sous une approche AMD( ) permettant le classement multicritère des scénarios de désambiguïsation en vue d’en faire émerger le meilleur. Cette démarche a l’avantage de réduire les scénarios dominés et de classer le reste selon différents critères d’évaluation.
|