ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Adaptation of Acoustic and Language Model for Improving Arabic Automatic Speech Recognition

العنوان بلغة أخرى: مؤائمة النموذج الصوتي واللغوي لزيادة فاعلية التعرف التلقائي على المنطوق العربي
المؤلف الرئيسي: Enshassi, Oussama Soliman (Author)
مؤلفين آخرين: El-Halees, Alaa (Advisor)
التاريخ الميلادي: 2016
موقع: غزة
الصفحات: 1 - 90
رقم MD: 736508
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

24

حفظ في:
المستخلص: إن التعرف التلقائي على الكلام (ASR) عبارة عن ترجمة الكلمات المنطوقة إلى نص من خلال الحاسوب. فقد تم دمج هذه التقنية في العديد من النظم؛ ومع ذلك، فإن تطبيقات التعرف على الكلام باللغة العربية ما زال يشوبها نسبة عالية من الخطأ؛ الأمر الذي يعزى أساسا إلى الاختلاف في نطق الكلمة الواحدة. فالاختلاف في نطق الكلمة الواحدة يؤدي إلى عدم التوافق بين الخطاب العربي والنماذج المدربة لذلك الغرض. إن التباين في نطق الكلمة الواحدة لهو مشكلة رئيسة في تطوير دقة تطبيقات التعرف التلقائي على الخطاب المستمر باللغة العربية. فقد يحدث التباين على مستوى اللفظ، أو الكلمة، أو الجملة. ففي هذه الأطروحة يقترح الباحث أسلوبا لتكييف نموذجا صوتيا ونموذجا لغويا في ظل موارد محدودة للناطقين باللغة العربية. كما تم إجراء عمل مبدئي على القاموس الصوتي. وتم اقتراح النمذجة الصوتية العربية للتغلب على التباين في نطق الكلمة الواحدة في ظل موارد محدودة للناطقين باللغة العربية، فإذا كان هناك العديد من النماذج الصوتية العربية المتاحة يمكننا اقتراح نهجا هجينا يعمل على استيفاء نموذج صوتي أو دمجه لتكييف النموذج الصوتي المرجو الوصول إليه. وقد أثبت الأسلوب المقترح أنه فعال جدا للتعامل مع التباين الحاصل في الخطاب العربي. وقد تم قياس معدل الخطأ في الكلمات (WER) لكلا النظامين. وقد تبين أن نظام الخط الأساسي لديه نسبة خطأ في الكلمات تساوي 13.28% التي انخفضت بشكل ملحوظ إلى 11.04% في النظام المحسن. وبالإضافة إلى ذلك، اقترح الباحث أسلوبا لتكييف النموذج اللغوي، وتوصلت النتائج إلى أن نظام الخط الأساسي لديه نسبة خطأ في الكلمات تساوي 12.4% والتي انخفضت بشكل ملحوظ إلى 8.4% في النظام المحسن. وأظهرت النتائج أيضا أن تطبيق الأسلوب الصوتي الهجين يليه أسلوب استيفاء النموذج اللغوي الذي حقق تطورا ملحوظا بنسبة 5.32% في نسبة الخطأ في الكلمات. وأن نظام الخط الأساسي لديه نسبة خطأ في الكلمات تساوي 13.28%، والتي انخفضت بشكل ملحوظ إلى 7.96% في النظام المحسن. ومع ذلك، فإن القواعد الصوتية المقترحة في القاموس الصوتي لم تؤد إلى تطور كبير.

عناصر مشابهة