ارسل ملاحظاتك

ارسل ملاحظاتك لنا







المعايير اللغوية لتقييم محركات البحث العربية على شبكة الإنترنت

المصدر: مؤتمر المحتوى العربي في الانترنت - التحديات والطموح
الناشر: جامعة الإمام محمد بن سعود الاسلامية
المؤلف الرئيسي: عبدالرسول، عمرو جمعة (مؤلف)
المجلد/العدد: مج 3
محكمة: نعم
الدولة: السعودية
التاريخ الميلادي: 2011
مكان انعقاد المؤتمر: الرياض
الهيئة المسؤولة: جامعة الإمام محمد بن سعود الإسلامية
الشهر: أكتوبر
الصفحات: 67 - 80
رقم MD: 101367
نوع المحتوى: بحوث المؤتمرات
قواعد المعلومات: HumanIndex
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: تعد نظم البحث واسترجاع المعلومات أحد أهم الطرق التي نلجأ إليها للتغلب على مشكلة فوضى المعلومات أو تضخم الإنتاج الفكري على الشبكة العالمية. ويمكن لمستخدمي محركات البحث التي تتعامل مع العربية على شبكة الإنترنت، أن يدرك الهوة الواسعة بين مخرجات هذه المحركات وبين ما يجب أن تكون عليه النتائج المرجوة فيما يخص البحث باللغة العربية. وقد ركز هذا البحث على المعايير اللغوية لتقييم محركات البحث العربية على الشبكة العالمية، وأقتصر تقييم محركات البحث لغويا -في هذا البحث- على المعايير التي ينبغي توافرها في أي محرك بحثي عربي عند التعامل مع كلمات البحث دون التطرق إلى نتائج البحث، ففي حالة نجاح المحرك في التعامل مع كلمات البحث وفق معايير لغوية محددة، فإن من شأن ذلك أن يسفر عن نتائج جيدة وسليمة لكلمات البحث هذه. وتناول البحث تقييم طريقة تعامل محرك البحث مع كلمات البحث على مستويين اثنين؛ مستوى صرفي وآخر دلالي، فمن المعايير اللغوية لتعامل محرك البحث مع كلمات البحث على المستوى الصرفي: 1-مراعاة التدقيق اللغوي للمدخلات (Input) 2-مراعاة الأخطاء الإملائية (The common spelling errors) ٣-مراعاة الأشكال الكتابية أ-مراعاة أشكال الكلمات المعربة ب-مراعاة الأشكال اللهجية للكلمات العربية ج-مراعاة أشكال لغة الفرانكو آراب د-مراعاة أشكال الكلمات المركبة من كلمتين بينهما مسافة ه-مراعاة أشكال الكلمات التي تحتوي حروفا تنطق ولا تكتب 4-مراعاة زوائد الكلمة العربية (من السوابق واللواحق) (suffixs- Affixes (Prefixes 5-مراعاة حالات إعراب الكلمة العربية المعربة بالحروف لا بالحركات ومن المعايير اللغوية لتعامل محرك البحث مع كلمات البحث على المستوى الدلالي 1-مراعاة الترادف (synonymy) ٢-مراعاة المشترك اللفظي (Homonymy) ٣-مراعاة كلمات التوقف (Stop words)

Information Retrieval (IR) systems are among the ways sought to solve the problems generated by the large intellectual production on the internet. Users of internet search engines can realize the wide gap between the actual and needed outputs of these engines when using Arabic language to provide search keywords. This study focuses on using lingual parameters to evaluate Arabic search engines on the internet. The evaluation will be limited, in this study, to the lingual parameters that should be available on an Arabic search engine while processing search input keywords regardless the search outputs. When a search engine succeeds in processing search keywords according to defined lingual parameters, good and integrated outputs will be obtained in relation with search keywords. This study evaluates the way by which a search engine processes search keywords on morphological and semantic basis. Morphological parameters included in a search engine include: 1- Spelling check of the search keywords (input) 2- The common spelling errors 3- The different forms of writing, i.e.: a- the different graphical forms of words according to grammatical cases b- the different graphical forms of words when written as spoken in different dialects c- the graphical forms generated by Anglo-Arab trend of writing d- the graphical forms of hyphenated words e- the graphical forms of words that have pronounced but not written sounds 4- Arabic words affixes (prefixes-suffixes) 5- Words whose graphical forms change in accordance to grammatical cases Semantic parameters included in a search engine include: 1- Synonymy 2- Homonymy 3- Stop words