المؤلف الرئيسي: | Basheer, Mohammad (Author) |
---|---|
مؤلفين آخرين: | Arafeh, Labib (Advisor) |
التاريخ الميلادي: |
2017
|
موقع: | جنين |
الصفحات: | 1 - 95 |
رقم MD: | 1018846 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | الجامعة العربية الأمريكية - جنين |
الكلية: | كلية الدراسات العليا |
الدولة: | فلسطين |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
تحليل المشاعر والآراء أصبح أمرا ملحا وضروريا، خاصة أن المؤسسات والحكومات وشركات القطاع الخاص مهتمون جدا بمعرفة ما يفكر به الناس تجاه أحداث أو منتجات معينة. حجم البيانات على شبكة الإنترنت هائل وينمو بسرعة. معالجة وتحليل هذا الحجم من البيانات أمر صعب ومكلف؛ ولهذا السبب فإن الحلول القائمة لتحليل المشاعر تعاني من أوجه القصور، مثل الأبعاد العالية والدقة المنخفضة. ولذلك فإن عملية اختيار الميزات ذات الصلة بالتحليل والتصنيف هي مسألة بحث. إن اختيار السمات ذات الصلة التي تعطي دقة عالية في التصنيف ليست مهمة سهلة. ولذلك، فإن الهدف من هذه الأطروحة هو تصنيف الآراء على أساس النص إلى مشاعر إيجابية وسلبية بشكل فعال عن طريق اختيار مجموعة ميزات فرعية ذات الصلة. لحل هذه المشكلة، نقدم نهجا يستخدم التعلم الآلي وخوارزميات التحسين التطورية في اختيار مجموعة ميزات فرعية فعالة في أربع طرق. أولا، يتم اختيار مجموعة ميزات فرعية على أساس خوارزمية التعلم الآلي. وتستخدم خوارزمية متجهات الدعم الآلي لإنتاج متجه الوزن بعد عملية التعلم التي تحتوي على القيم التي تمثل أهمية المصطلح لعملية التصنيف. ثانيا، يتم استخدام خوارزمية التطور لتحسين عملية اختيار مجموعة ميزات فرعية من المجموعة التي نتجت من الطريقة الأولى من أجل تحسين عملية التصنيف. الطريقة الثالثة تهجن ما بين التعلم الآلي القائم على مجموعة الميزات الفرعية التي تم إنشاؤها بواسطة الطريقة الأولى مع الطرق الإحصائية القائمة على مجموعة الميزات الفرعية التي نتجت باستخدام طريقة اختيار ارتباط الميزات. الطريقة الرابعة تسمى الطريقة الهجينة المحسنة، حيث يتم تطبيق التطور التحسيني على المجموعة الفرعية للمميزات التي نتجت عن الطريقة الثالثة. واستخدمت ثلاث مجموعات بيانات معروفة لتحليل المشاعر متاحة للجمهور لاختبار النهج المقترح والتحقق منه. الأول هو مجموعة البيانات القطبية (D1) V2.0، والثاني هو مجموعة البيانات القطبية (D2) V1.0، والثالث هو D3 الذي هو مزيج من D1 و D2. يتم تقييم أداء تصنيف المشاعر في هذا البحث باستخدام الدقة، والإرجاع، والضبط، ومقياس متوسط الدقة والإرجاع. النتائج التي تحققت في هذا البحث تفوق النتائج الواردة في الدراسات الحالية. في نهجنا حققنا في الطريقة الأولى باستخدام التعلم الآلي كطريقة لنوزين الميزات نتيجة عالية وصلت إلى 98.79، واستطعنا أن نحسن من نتائج الطريقة الأولى لتصل إلى نتيجة أعلى فقد وصلت نتائج الطريقة الثانية إلى 99.21 باستخدام التطور التحسيني، وعندما دمجت الميزات التي تم توزينها عن طريق التعلم الآلي باستخدام التوزين بخوارزمية الدعم الآلي مع الميزات التي تم توزينها بالطريق الإحصائي باستخدام التوزين بارتباط الميزات وصلت نتيجة التصنيف للميزات الناتجة عن الميزات المدموجة إلى 99.46 وهذه نتيجة أفضل من النتائج السابقة، وعندما تم التحسين على مجموعة الميزات الفرعية الناتجة عن الطرق الهجينة استطعنا أن نزيد الدقة لتصل إلى 99.71 وأن نقلل حجم المجموعة الفرعية. الميزات التي نتجت عن عملية المعالجة المشاعر كانت كبيرة جدا، وقد تحققت هذه النتائج باستخدام أفضل الميزات ذات العدد القليل لمأخوذة من الميزات التي استخرجناها من عملية المعالجة للمشاعر بالمقارنة مع الأعمال القائمة مما يقلل من الوقت اللازم في عملية التصنيف. |
---|