LEADER |
04098nam a22003497a 4500 |
001 |
1512585 |
041 |
|
|
|a eng
|
100 |
|
|
|9 548356
|a ابو فياض، طارق عيسى جبريل
|e مؤلف
|
245 |
|
|
|a Semantic Word Clustering from Large Arabic Text
|
246 |
|
|
|a العنقدة الدلالية لكلمات النص العربى الكبير
|
260 |
|
|
|a غزة
|c 2018
|
300 |
|
|
|a 1 - 56
|
336 |
|
|
|a رسائل جامعية
|
502 |
|
|
|b رسالة ماجستير
|c الجامعة الإسلامية (غزة)
|f كلية تكنولوجيا المعلومات
|g فلسطين
|o 0123
|
520 |
|
|
|a مع الزيادة السريعة في حجم النص على الويب حيث أصبحت البيانات النصية عالية الأبعاد (الآلاف من آلاف الكلمات في كل مجال) وتحمل معلومات دلالية. هذه الزيادة تطلبت إلى تقنيات تجميع الكلمات التي يمكنها أن تجمع الكلمات إلى مجموعات ذات معني وعلي أساس تشابهها، والتي يمكن استخدامها في العديد من مهام استرجاع المعلومات في محركات البحث وخورازميات التصنيف وتوسيع استعلام البحث. في هذه الرسالة نقترح استخدام أداة أو نموذج "word2vec" لبناء المتجه التمثيلي لكلمات النص العربي الكبير والتي سوف تعطي معاني ومميزات دلالية للمساعدة في بناء مجموعات دلالية من كلمات النص العربي الكبير. وهذا يتضمن المعالجة المسبقة للنص، بناء المتجه التمثيلي باستخدام نموذج "word2vec"، بناء نموذج التصنيف والمجموعات الدلالية باستخدام طريقة "Pipeline" وخورازمية التصنيف "Extra tree classifier" . تم قمنا بأخذ النص الذي تم معالجته ومصفوفة تردد المصطلحات لبناء مصنف المتجهات باستخدام خورازمية التصنيف "Extra tree classifier" واستخدامه في تصنيف وتنبؤ الكلمات إلى الفئات المحددة مسبقا. قمنا بتطبيق نموذج التصنيف وإجراء تجارب عديدة باستخدام النموذج، حيث أن النتائج أظهرت إلى فعالية النموذج لإنشاء مجموعات دلالية من النص العربي الكبير. وتظهر نتائج التصنيف إلى أن السمات المستخرجة من كلمات المتجهات قد مكنت نموذج التصنيف من تحقيق دقة عالية وصحة بأكثر من 85%. كما أن النتائج تشير إلى أن نموذج التصنيف لا يخضع إلى حالة "under fitting" (أي أن النموذج لا يؤدي أداء ضعيفا على بيانات التدريب)، وأيضا لا يخضع إلى حالة "Over fitting" (أي أن النموذج يؤدي أدا ء جيدا على كل من بيانات التدريب والاختبار).
|
653 |
|
|
|a العنقدة الدلالية
|a النص العربى الكبير
|a الخورزميات
|
700 |
|
|
|a بركة، ربحى سليمان
|g Baraka, Rebhi S.
|e مشرف
|9 440675
|
856 |
|
|
|u 9808-001-010-0123-T.pdf
|y صفحة العنوان
|
856 |
|
|
|u 9808-001-010-0123-A.pdf
|y المستخلص
|
856 |
|
|
|u 9808-001-010-0123-C.pdf
|y قائمة المحتويات
|
856 |
|
|
|u 9808-001-010-0123-F.pdf
|y 24 صفحة الأولى
|
856 |
|
|
|u 9808-001-010-0123-1.pdf
|y 1 الفصل
|
856 |
|
|
|u 9808-001-010-0123-2.pdf
|y 2 الفصل
|
856 |
|
|
|u 9808-001-010-0123-3.pdf
|y 3 الفصل
|
856 |
|
|
|u 9808-001-010-0123-4.pdf
|y 4 الفصل
|
856 |
|
|
|u 9808-001-010-0123-5.pdf
|y 5 الفصل
|
856 |
|
|
|u 9808-001-010-0123-O.pdf
|y الخاتمة
|
856 |
|
|
|u 9808-001-010-0123-R.pdf
|y المصادر والمراجع
|
856 |
|
|
|u 9808-001-010-0123-S.pdf
|y الملاحق
|
930 |
|
|
|d y
|
995 |
|
|
|a Dissertations
|
999 |
|
|
|c 1014021
|d 1014021
|