المستخلص: |
De nos jours, l’extraction d’informations suscite un intérêt grandissant auprès de la communauté des chercheurs activant dans le domaine de l’ingénierie des langues. En effet, elle est d’un intérêt capital pour de nombreux domaines connexes relevant du TALN. Cet article vise à donner un aperçu sur un travail qui est en cours de réalisation et qui concerne le développement d’un système d’extraction d’informations pour les textes de la presse arabophone en ligne. Généralement, toute solution d’extraction d’informations englobe les tâches suivantes: reconnaissance des entités nommées, reconnaissance des relations entre ces entités avec la résolution des co-références dans certains cas. Pour l’élaboration de notre système, nous nous sommes intéresser, dans une première étape, à l’identification des entités nommées arabes: noms propres (personnes, organisations, lieux), expressions temporelles et expressions de mesure, en s’inspirant de la catégorisation des entités nommées, issue des conférences MUC. Et ce, avec une certaine adaptation pour le cas de la langue arabe. La seconde étape, a concerné l’extraction des relations entretenues entre les actants/acteurs. Pour notre cas, nous nous intéressons aux relations liées à la notion de «Rencontre»,
|