المستخلص: |
Cet article présente un système d'extraction semi- automatique de collocations, paramétrable selon plusieurs langues. Le système combine méthodes statistiques et filtrage linguistique, exploitant les propriétés morphosyntaxiques contextuelles des collocations. Ces propriétés sont identifiées dans des corpus annotés et étiquetés. L’analyse linguistique d'une classe particulière de collocations - les constructions verbo-nominales VN (Gledhill 2007) - est réalisée dans le cadre de la grammaire systémique fonctionnelle (Halliday 1985). Cette analyse permet d'identifier des classes de collocations spécifiques avec leurs propriétés morphosyntaxiques et de définir les filtres linguistiques. Nous présentons les résultats de l'extraction effectuée sur les corpus roumain et français.
|