ارسل ملاحظاتك

ارسل ملاحظاتك لنا







يجب تسجيل الدخول أولا

Semi-Automatic Method for Infoboxes Extraction for Arabic Wikipedia Articles

العنوان بلغة أخرى: طريقة شبه آلية لاستخلاص معلومات مختصرة لمقالات ويكبيديا العربية
المؤلف الرئيسي: شبلاق، سليم محمد سليم (مؤلف)
مؤلفين آخرين: عوض الله، رواية فوزى (مشرف)
التاريخ الميلادي: 2016
موقع: غزة
الصفحات: 1 - 93
رقم MD: 821923
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

26

حفظ في:
المستخلص: تعتبر اللغة العربية واحدة من أكثر اللغات انتشارا في العالم. هناك ما يقارب 5% من سكان العالم يتحدثون اللغة العربية، على الرغم من ذلك فإن اللغة العربية تعاني من ضعف نسبة المحتوى العربي على الإنترنت. ويكيبيديا هو موقع ويب يحتوي على موسوعة من المقالات متعددة اللغات ومدعوم من مؤسسة ويكيبيديا. هو واحد من أكبر قواعد البيانات التي تحتوي على المعرفة في مختلف المجالات حتى اللحظة بالإضافة لأنه من المواقع التي تستحوذ على ترتيب مترفع في تصنيف جوجل حيث أنه يظهر دائما في أولى نتائج البحث. النسخة العربية من ويكيبيديا هي جزء من موقع ويكيبيديا ولكنه يعتبر ذو محتوى ضعيف مقارنة بمحتوى اللغات الأخرى. هناك عدد كبير من المقالات الموجودة في النسخة العربية من ويكيبيديا تعتبر مقالات (بذرة) وهي مقالات تحتوي على معلومات قليلة جدا عن موضوع المقال. بعض الباحثين عملوا على زيادة وإثراء المحتوى الخاص ب ويكيبيديا، لكن أغلب الجهود مركزة على اللغات الأخرى غير اللغة العربية. هذا البحث يهدف لزيادة المحتوى الرقمي العربي بالإضافة لتحسين عملية التعديل الخاصة بالمقالات العربية. يركز الهدف الأساسي للبحث على تطوير طريقة لاقتراح محتوى لمقالات ويكيبيديا العربية لإثراء المحتوى الخاص بمقالات (بذرة) العربية أو إنشاء مقالات جديدة. تأتي هذه الطريقة المقترحة بالاعتماد على طرق تابعة لمجال استخراج المعلومات، الأسئلة المجابة والتنقيب عن النصوص لاستخلاص المعلومات من المستندات والوثائق الموجودة على الويب. المعلومات التي يتم استخراجها ستكون متاحة للمحررين للمراجعة والتعديل قبل إضافتها على ويكيبيديا. في هذا البحث تم التركيز على إثراء صندوق المعلومات والذي يعتبر ملخص للمقالات ويتم وضعه في الزاوية اليمنى/ اليسرى للمقال. قمنا بتطوير أربعة خوارزميات رئيسية تهدف لاستخلاص مكان (ميلاد، وفاة) وتاريخ (ميلاد، وفاة) والاسم الكامل للشخصية التي يتم البحث عنها بالإضافة لعمل خوارزمية التصويت التي تعمل على كل خوارزمية لزيادة دقة النتيجة المرشحة للظهور للمستخدم. قمنا بعمل العديد من التجارب لقياس أداء الخوارزميات واقتصرت التجارب على المجال السياسي، وحققت هذه التجارب دقة نسبتها 80.3%.

عناصر مشابهة