ارسل ملاحظاتك

ارسل ملاحظاتك لنا







A Comparative Study of Classification Techniques for English to Arabic Speech Recognition

العنوان بلغة أخرى: دراسة مقارنة لتقنيات التصنيف للتعرف على ترجمة الكلام من اللغة الإنجليزية إلى اللغة العربية
المؤلف الرئيسي: Al-Omari, Ayoub Abdelrahman (Author)
مؤلفين آخرين: Nasereddin, Hebah H. O. (Advisor)
التاريخ الميلادي: 2016
موقع: عمان
الصفحات: 1 - 99
رقم MD: 788280
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة الشرق الأوسط
الكلية: كلية تكنولوجيا المعلومات
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

9

حفظ في:
المستخلص: تعتبر أنظمة معالجة الكلام واحدة من أهم المجالات التطبيقية في أنظمة معالجة الإشارات الرقمية. وتتألف أنظمة التعرف على الكلام والترجمة إلى نظامين الرئيسية، ويمثل أول نظام من وجهة نظر ال ASR يحتوي على مستويين وهما مستوى استخراج الميزة باستخدام MFCC، من خلال استخدام تقنيات التماثل الثلاث المشهورة باستخدام DTW، وHMM، وDBN. النظام الثاني هو نظام MT والذي أساسا تم تحقيقه من خلال استخدام ثلاثة أساليب التي هي المنهج المعتمد على الإحصائيات والمنهج المعتمد على أساس القواعد، والمنهج القائم على الخلط بينهما والذي سمي بالمنهج الخليط. في هذه الدراسة قدمنا دراسة مقارنة بين تقنيات التصنيف من وجهة نظر ASR، وكذلك الترجمة المعتمدة على المناهج من وجهة نظر MT. ولذلك فقد تم استخدام معدل الاكتشاف وكذلك استخدمنا معدل الخطأ لتقييم دقة الجمل المترجمة. وعلاوة على ذلك، لقد قمنا بتصنيف الملفات الصوتية إلى أربع فئات التي كانت أخبار، التخاطب، والعبارات العلمية. أظهرت النتائج التجريبية أن استخدام تقنية DBN كأسلوب تصنيف حققت أفضل معدل اكتشاف بنسبة (79.2%) مقارنة مع HMM وDTW عن فئة الأخبار. ومع ذلك، حققت تقنية تصنيف HMM على أفضل معدل اكتشاف بنسبة (80.1%) لفئة الأخبار، والعبارات العلمية بنسبة (86%)، وعبارات السيطرة بنسبة (63.8%). في المقابل، وذلك باستخدام DTW كأسلوب تصنيف في ASR كان سلوك سلبي على معدل الاكتشاف لجميع فئات الكلام. لقد قمنا بدراسة ثلاثة مترجمات على الإنترنت لإظهار آثار نوع الكلام وتقنية تصنيف ASR على معدل خطأ في الترجمة. ولذلك، فإن النموذج المستند على القاعدة التي تم تمثيله باستخدام سحابة IBM قد حقق أعلى النتائج لغالبية فئات الكلام مع (13.93%) في التخاطب، (7.38%) في العبارات العلمية، و(17.91%) في فئات السيطرة. ومع ذلك، باستخدام نموذج يستند الإحصائية- التي كان يمثلها مترجم جوجل المباشر- ترجمة أظهرت النتائج التجريبية أن نتائج الفئتين التخاطب والمصطلحات العلمية كانت نسبة الخطأ بفرق غير ملموس مقارنة مع استخدام مبدأ القواعد. في المقابل، باستخدام نموذج الترجمة الهجينة فلقد أثرت على معدل الخطأ في تقنيات التصنيف ASR ثلاثة ولجميع فئات الكلام الذي تم تعيينه بوصفه واحد من الآثار السلبية.

عناصر مشابهة