LEADER |
04844nam a22003497a 4500 |
001 |
1485669 |
041 |
|
|
|a eng
|
100 |
|
|
|9 471684
|a أبو سليمان، ناصر صادق
|e مؤلف
|
245 |
|
|
|a Automatic Topic Classification System of Spoken Arabic News
|
246 |
|
|
|a النظام الآلي للتصنيف الموضوعي للأخبار المنطوقة باللغة العربية
|
260 |
|
|
|a غزة
|c 2017
|
300 |
|
|
|a 1 - 107
|
336 |
|
|
|a رسائل جامعية
|
502 |
|
|
|b رسالة ماجستير
|c الجامعة الإسلامية (غزة)
|f كلية الهندسة
|g فلسطين
|o 0370
|
520 |
|
|
|a إن أهم العواقب الرئيسية لما يعرف ب "عصر الإنترنت" هو الانتشار الواسع للبيانات المتنوعة نوعا وموضوعا. هذا الانتشار بحاجة ملحة إلى نظام آلي لتصنيف هذه البيانات لتسهيل عملية البحث. مثل هذا النظام معمول به بشكل كبير في البيانات النصية المكتوبة ولكن مع ازدياد حجم البيانات النصية المنطوقة (الصوتية) بشكل كبير تظهر الحاجة إلى نظام آلي لتصنيف البيانات النصية المنطوقة بشكل مباشر دون الحاجة لتحويلها لنصوص مكتوبة ومن ثم تطبيق الخوارزميات المتبعة في النصوص المكتوبة. النظام المباشر تم مناقشته بشكل بسيط في الأبحاث السابقة على النصوص المنطوقة باللغة الإنجليزية وبشكل يكاد ينعدم على نظيراتها باللغة العربية نظرا لصعوبة التعامل مع اللغة العربية إضافة لعدم توفر مجموعة بيانات نصية منطوقة باللغة العربية تصلح لعملية التصنيف الموضوعي. هذا البحث يرتكز بشكل رئيسي على إنشاء نظام متكامل ابتداء من استخراج الكلمات المفتاحية آليا لكل صنف على حدا. ولاحقا يتم الاستفادة من هذه الكلمات في نظام تصنيف النص المنطوق بشكل مباشر وذلك اعتمادا على الخصائص الصوتية للكلمة وليس بالطريقة المعتادة عبر تحويله إلى نص مكتوب. تم تحويل النصوص المكتوبة باللغة العربية المستخدمة كثيرا في التصنيف الموضوعي للنصوص المكتوبة (ALJ-NEWS) إلى نصوص منطوقة عبر متحدثين متنوعين للاستفادة منها في هذا البحث. في عملية استخراج الكلمات المفتاحية تم الاعتماد على DTW كطريقة لقياس تكرار الكلمة المنطوقة داخل الصنف عبر مقارنة الخصائص المستخرجة (MFCC) لكل كلمة. في هذا البحث تم الاعتماد على (HMM and DTW) كطرق لتصنيف الكلمة المنطوقة اعتمادا على الخصائص المستخرجة (MFCC and PLP-RASTA) من الكلمة المنطوقة. تم اقتراح آلية جديدة لعمل تقطيع للملف الصوتي إلى كلمات منفصلة في هذا البحث. وبالنظر إلى تقييم الأداء التصنيفي للنظام. تم استخدام معايير عدة: (F1-measure, Accuracy, Precision and Recall). النظام المقترح أعطى نتائج جيدة في عملية التصنيف حيث سجل نظام التصنيف ما متوسطة 90.26% باستخدام DTW و91.36% باستخدام HMM على مقياس F1-measure بالإضافة إلى أن دقة تحديد الكلمات المفتاحية كانت 89.65%.
|
653 |
|
|
|a هندسة الحاسب الآلى
|a النظم الآلية
|a النصوص المنطوقة
|a التصنيف الموضوعى
|a المعالجة اللغوية
|
700 |
|
|
|9 471686
|a Alhanjouri, Mohammed A.M
|e Advisor
|
856 |
|
|
|u 9808-001-008-0370-T.pdf
|y صفحة العنوان
|
856 |
|
|
|u 9808-001-008-0370-A.pdf
|y المستخلص
|
856 |
|
|
|u 9808-001-008-0370-C.pdf
|y قائمة المحتويات
|
856 |
|
|
|u 9808-001-008-0370-F.pdf
|y 24 صفحة الأولى
|
856 |
|
|
|u 9808-001-008-0370-1.pdf
|y 1 الفصل
|
856 |
|
|
|u 9808-001-008-0370-2.pdf
|y 2 الفصل
|
856 |
|
|
|u 9808-001-008-0370-3.pdf
|y 3 الفصل
|
856 |
|
|
|u 9808-001-008-0370-4.pdf
|y 4 الفصل
|
856 |
|
|
|u 9808-001-008-0370-5.pdf
|y 5 الفصل
|
856 |
|
|
|u 9808-001-008-0370-O.pdf
|y الخاتمة
|
856 |
|
|
|u 9808-001-008-0370-R.pdf
|y المصادر والمراجع
|
856 |
|
|
|u 9808-001-008-0370-S.pdf
|y الملاحق
|
930 |
|
|
|d y
|
995 |
|
|
|a Dissertations
|
999 |
|
|
|c 875164
|d 875164
|