Adaptation of Acoustic and Language Model for Improving Arabic Automatic Speech Recognition

Enshassi, Oussama Soliman; El-Halees, Alaa

Adaptation of Acoustic and Language Model for Improving Arabic Automatic Speech Recognition

العنوان بلغة أخرى:	مؤائمة النموذج الصوتي واللغوي لزيادة فاعلية التعرف التلقائي على المنطوق العربي
المؤلف الرئيسي:	Enshassi, Oussama Soliman (Author)
مؤلفين آخرين:	El-Halees, Alaa (Advisor)
محكمة:	نعم
التاريخ الميلادي:	2016
موقع:	غزة
الصفحات:	1 - 90
رقم MD:	736508
نوع المحتوى:	رسائل جامعية
اللغة:	الإنجليزية
الدرجة العلمية:	رسالة ماجستير
الجامعة:	الجامعة الإسلامية (غزة)
الكلية:	كلية تكنولوجيا المعلومات
الدولة:	فلسطين
قواعد المعلومات:	Dissertations
مواضيع:	علم الأصوات اللغوية \| اللغة العربية \| النقد اللغوي
رابط المحتوى:	صفحة العنوان المستخلص قائمة المحتويات 24 صفحة الأولى 1 الفصل 2 الفصل 3 الفصل 4 الفصل 5 الفصل الخاتمة المصادر والمراجع

عدد مرات التحميل

24

المستخلص:

إن التعرف التلقائي على الكلام (ASR) عبارة عن ترجمة الكلمات المنطوقة إلى نص من خلال الحاسوب. فقد تم دمج هذه التقنية في العديد من النظم؛ ومع ذلك، فإن تطبيقات التعرف على الكلام باللغة العربية ما زال يشوبها نسبة عالية من الخطأ؛ الأمر الذي يعزى أساسا إلى الاختلاف في نطق الكلمة الواحدة. فالاختلاف في نطق الكلمة الواحدة يؤدي إلى عدم التوافق بين الخطاب العربي والنماذج المدربة لذلك الغرض. إن التباين في نطق الكلمة الواحدة لهو مشكلة رئيسة في تطوير دقة تطبيقات التعرف التلقائي على الخطاب المستمر باللغة العربية. فقد يحدث التباين على مستوى اللفظ، أو الكلمة، أو الجملة. ففي هذه الأطروحة يقترح الباحث أسلوبا لتكييف نموذجا صوتيا ونموذجا لغويا في ظل موارد محدودة للناطقين باللغة العربية. كما تم إجراء عمل مبدئي على القاموس الصوتي. وتم اقتراح النمذجة الصوتية العربية للتغلب على التباين في نطق الكلمة الواحدة في ظل موارد محدودة للناطقين باللغة العربية، فإذا كان هناك العديد من النماذج الصوتية العربية المتاحة يمكننا اقتراح نهجا هجينا يعمل على استيفاء نموذج صوتي أو دمجه لتكييف النموذج الصوتي المرجو الوصول إليه. وقد أثبت الأسلوب المقترح أنه فعال جدا للتعامل مع التباين الحاصل في الخطاب العربي. وقد تم قياس معدل الخطأ في الكلمات (WER) لكلا النظامين. وقد تبين أن نظام الخط الأساسي لديه نسبة خطأ في الكلمات تساوي 13.28% التي انخفضت بشكل ملحوظ إلى 11.04% في النظام المحسن. وبالإضافة إلى ذلك، اقترح الباحث أسلوبا لتكييف النموذج اللغوي، وتوصلت النتائج إلى أن نظام الخط الأساسي لديه نسبة خطأ في الكلمات تساوي 12.4% والتي انخفضت بشكل ملحوظ إلى 8.4% في النظام المحسن. وأظهرت النتائج أيضا أن تطبيق الأسلوب الصوتي الهجين يليه أسلوب استيفاء النموذج اللغوي الذي حقق تطورا ملحوظا بنسبة 5.32% في نسبة الخطأ في الكلمات. وأن نظام الخط الأساسي لديه نسبة خطأ في الكلمات تساوي 13.28%، والتي انخفضت بشكل ملحوظ إلى 7.96% في النظام المحسن. ومع ذلك، فإن القواعد الصوتية المقترحة في القاموس الصوتي لم تؤد إلى تطور كبير.

عناصر مشابهة

Automatic Speech Emotions Recognition for Arabic Language
بواسطة: العمري، ليث محمد علي منشور: (2018)
PHARYNGEAL AND EMPHATIC SOUNDS IN ARABIC SPEECH RECOGNITION
بواسطة: Al Otaibi, Yousef Ajami منشور: (1997)
AUTOMATIC EXTRACTION OF ARABIC SUB-WORD UNITS FOR CONTINUOUS SPEECH RECOGNITION
بواسطة: Nahar, Khalid Mohamed Oqlah منشور: (2013)
Acoustic Analysis of Threatening Intonation in Jordanian Arabic and American English
بواسطة: Al Salim, Anas Fawzat Ali منشور: (2010)
An Acoustic Study of Vowel Pharyngealization in Egyptian Arabic
بواسطة: Rifaat, Amira Aboshirif and Khaled منشور: (2018)

Adaptation of Acoustic and Language Model for Improving Arabic Automatic Speech Recognition

عدد مرات التحميل

24

عناصر مشابهة

دليل المستخدم

دليل الفيديو