ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Semantic Word Clustering from Large Arabic Text

العنوان بلغة أخرى: العنقدة الدلالية لكلمات النص العربى الكبير
المؤلف الرئيسي: ابو فياض، طارق عيسى جبريل (مؤلف)
مؤلفين آخرين: بركة، ربحى سليمان (مشرف)
التاريخ الميلادي: 2018
موقع: غزة
الصفحات: 1 - 56
رقم MD: 1014021
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

26

حفظ في:
LEADER 04098nam a22003497a 4500
001 1512585
041 |a eng 
100 |9 548356  |a ابو فياض، طارق عيسى جبريل  |e مؤلف 
245 |a Semantic Word Clustering from Large Arabic Text 
246 |a العنقدة الدلالية لكلمات النص العربى الكبير 
260 |a غزة  |c 2018 
300 |a 1 - 56 
336 |a رسائل جامعية 
502 |b رسالة ماجستير  |c الجامعة الإسلامية (غزة)  |f كلية تكنولوجيا المعلومات  |g فلسطين  |o 0123 
520 |a  مع الزيادة السريعة في حجم النص على الويب حيث أصبحت البيانات النصية عالية الأبعاد (الآلاف من آلاف الكلمات في كل مجال) وتحمل معلومات دلالية. هذه الزيادة تطلبت إلى تقنيات تجميع الكلمات التي يمكنها أن تجمع الكلمات إلى مجموعات ذات معني وعلي أساس تشابهها، والتي يمكن استخدامها في العديد من مهام استرجاع المعلومات في محركات البحث وخورازميات التصنيف وتوسيع استعلام البحث. في هذه الرسالة نقترح استخدام أداة أو نموذج "word2vec" لبناء المتجه التمثيلي لكلمات النص العربي الكبير والتي سوف تعطي معاني ومميزات دلالية للمساعدة في بناء مجموعات دلالية من كلمات النص العربي الكبير. وهذا يتضمن المعالجة المسبقة للنص، بناء المتجه التمثيلي باستخدام نموذج "word2vec"، بناء نموذج التصنيف والمجموعات الدلالية باستخدام طريقة "Pipeline" وخورازمية التصنيف "Extra tree classifier" . تم قمنا بأخذ النص الذي تم معالجته ومصفوفة تردد المصطلحات لبناء مصنف المتجهات باستخدام خورازمية التصنيف "Extra tree classifier" واستخدامه في تصنيف وتنبؤ الكلمات إلى الفئات المحددة مسبقا. قمنا بتطبيق نموذج التصنيف وإجراء تجارب عديدة باستخدام النموذج، حيث أن النتائج أظهرت إلى فعالية النموذج لإنشاء مجموعات دلالية من النص العربي الكبير. وتظهر نتائج التصنيف إلى أن السمات المستخرجة من كلمات المتجهات قد مكنت نموذج التصنيف من تحقيق دقة عالية وصحة بأكثر من 85%. كما أن النتائج تشير إلى أن نموذج التصنيف لا يخضع إلى حالة "under fitting" (أي أن النموذج لا يؤدي أداء ضعيفا على بيانات التدريب)، وأيضا لا يخضع إلى حالة "Over fitting" (أي أن النموذج يؤدي أدا ء جيدا على كل من بيانات التدريب والاختبار). 
653 |a العنقدة الدلالية  |a النص العربى الكبير  |a الخورزميات 
700 |a بركة، ربحى سليمان  |g Baraka, Rebhi S.  |e مشرف  |9 440675 
856 |u 9808-001-010-0123-T.pdf  |y صفحة العنوان 
856 |u 9808-001-010-0123-A.pdf  |y المستخلص 
856 |u 9808-001-010-0123-C.pdf  |y قائمة المحتويات 
856 |u 9808-001-010-0123-F.pdf  |y 24 صفحة الأولى 
856 |u 9808-001-010-0123-1.pdf  |y 1 الفصل 
856 |u 9808-001-010-0123-2.pdf  |y 2 الفصل 
856 |u 9808-001-010-0123-3.pdf  |y 3 الفصل 
856 |u 9808-001-010-0123-4.pdf  |y 4 الفصل 
856 |u 9808-001-010-0123-5.pdf  |y 5 الفصل 
856 |u 9808-001-010-0123-O.pdf  |y الخاتمة 
856 |u 9808-001-010-0123-R.pdf  |y المصادر والمراجع 
856 |u 9808-001-010-0123-S.pdf  |y الملاحق 
930 |d y 
995 |a Dissertations 
999 |c 1014021  |d 1014021 

عناصر مشابهة