المستخلص: |
إن كمية المعلومات التي ما فتئت تتزايد في شتى الميادين، ولدت لدى الباحثين حاجة ماسة إلى هيكلة وتنظيم المحتوى الرقمي للوثائق المختلفة. فبينما تتوفر أدوات عديدة مجانية الاستعمال والمستخدمة في استخراج المصطلحات من النصوص اللاتينية كالفرنسية والإنجليزية، نلاحظ أن اللغة العربية تفتقر لمثل هذه الأنظمة، الشيء الذي اضطرنا إلى محاولة تكييف البعض منها بغية تطبيقها على النصوص العربية، رغم أنه في أغلب الحالات يتطلب منا القيام بكثير من التغييرات المعقدة للتوصل إلى نتائج مقبولة. في هذا البحث، نقدم أداة أنشئت في الأصل لمعالجة نصوص اللغة الإنجليزية، لكننا قمنا بتكييفها بغية استعمالها في معالجة النصوص العربية وبالضبط في الاستخراج الآلي للمتلازمات اللفظية الخاصة بميدان محدد كالطب، الاقتصاد، التاريخ، الدين، الرياضة الخ... تستعمل هذه المصطلحات في بناء أنطولوجيا يمكن توظيفها في تطبيقات مختلفة أهمها تحسين البحث على الشبكة العنكبوتية. وإن كنا قد بدأنا بتطبيق هذه الطريقة على النص القرآني الكريم، لقدسيته، فإنه يمكن استعمالها على أي ميدان آخر.
|