المستخلص: |
في هذا البحث قمنا باختيار ملخصات من 242 وثيقة باللغة العربية وهذه الملخصات كانت متخصصة في علمي الحاسوب ونظم المعلومات، لقد قمنا ببناء نظـام اسـترجاع لمعالجة البيانات باللغة العربية، وتم تطبيق تقنية الفهرسة التلقائية على الوثائق العربيـة، بحيث تم بناء النظام باستخدام نمـوذج المتجهـات الموجهـةVector Space model) ) باستخدام أربعة أصناف استخدمت حساب درجة التشابه بين الاستعلام والوثيقـة وتمـت مقارنة النتائج لهذه الأصناف من المتجهات، وكانت النتيجة إن صنف الاحتمـال أظهـر أفضلية في عملية الاسترجاع مقارنة مع باقي أنواع المتجهات.
This paper has selected 242 Arabic abstract documents which were used by (Hmeidi & Kanaan, 1997). All these abstracts are about computer science and information systems. We also designed and built an automatic information retrieval system from scratch to handle Arabic data. The system was implemented in C# NET language, and Runs on IBM/PCs and compatible microcomputer. An automatic indexing technique has been implemented for this corpus. The system was built using Vector Space Model (VSM), In this model all mesurments were taken. Cosine measure, Dice measure, Jaccard measure, Dice measure, Jaccard measure, and Inner product similarity were used. The retrieval results using. at the retrieval result is better than the retrieval result for in Arabic documents.
|