العنوان بلغة أخرى: |
Automated system to distinguish accents |
---|---|
المصدر: | المجلة العربية الدولية للمعلوماتية |
الناشر: | اتحاد الجامعات العربية - جمعية كليات الحاسبات والمعلومات |
المؤلف الرئيسي: | الرحماني، إسراء جاسم حرفش (مؤلف) |
مؤلفين آخرين: | حسن، عبدالكريم عبدالوهاب (م. مشارك) |
المجلد/العدد: | مج4, ع8 |
محكمة: | نعم |
الدولة: |
السعودية |
التاريخ الميلادي: |
2015
|
الشهر: | يناير |
الصفحات: | 53 - 58 |
ISSN: |
1658-5933 |
رقم MD: | 866009 |
نوع المحتوى: | بحوث ومقالات |
قواعد المعلومات: | science, HumanIndex, EduSearch |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
تناولنا في هذا البحث بناء نظام تمييز لكنات آلي (Automatic Accents Recognition) على مجموعة مغلقة من المتكلمين، إن النظام يقوم بتمييز مجموعة من اللكنات الإنكليزية من أشخاص من أصل عربي وأميركي وبريطاني. إن اللكنات هنا تتكون من ستين مقطع صوتي، وتكون جميع المقاطع الصوتية مقسمة إلى مجموعتين مجموعة التدريب ومجموعة الاختبار حيث يقوم النظام بتمييز لكنة المقطع الصوتي الذي يختاره المستخدم من مجموعة الاختبار بالاعتماد على الصفات المميزة التي يستخرجها منه ويقوم بمقارنتها مع الصفات المميزة التي قام باستخراجها وتخزينها على شكل قاعدة بيانات من بيانات التدريب. وفي مرحلة استخراج الصفات المميزة لكل إشارة صوتية استخدمنا لهذا الغرض معامل الطيف الترددي، (Mel frequency cepstral coeffictients) والذي يعتبر من المعاملات الشائعة الاستعمال في هذا المجال. أما في مرحلة التمييز أي تمييز اللكنه المدخلة، فهنا أجرينا تجارب على ثلاثة نماذج من طرق التمييز طبقناها كلا على حدة منها إحصائية وهي التحليل التمييزي Linear discriminant analysis ومسافة الارتباط Correlation distance ومنها ما يعتمد قياس المسافة وهي إزاحة الوقت الديناميكية Dynamic Time Wrapping، ولكل طريقة من هذه الطرق الثلاث تعتمد قدرتها في التمييز على مجموعة من الأمور تم ملاحظتها خلال العمل منها ما يعتمد على كمية بيانات التدريب ومنها ما يعتمد بكثرة على مدى ارتباط البيانات في نفس الصنف. We covered in this research the building of an automatic accent-discrimination (Accent Recognition) system, and its application on a closed group of English speakers which contains people of Arab descent, Americans and people from the UK. The system classify a range of different accents among the group. About sixty audio clips were recorded and used in the research. The clips were equally divided into two sets: a training set and a test set. The system labels each of the test clips based on the characteristics (traits) abstracted from it that match the voice traits that were abstracted from the training set and stored in the database. Hence, the research is divided into two phases: (1) The extraction of important characteristics from the 30 training clips and storage of such data in the database, and (2) the extraction and matching of characteristics from clips (of the test set) to the stored data in the database to recognize and classify the accent. In the extraction phase, we used the Mel frequency Cepstral coefficient, which is commonly used by researchers in the field for identifying special traits in voices. In the classification stage we had experimented with three voice-discrimination/recognition models including 2 statistical-based methods: Linear discriminant analysis and the Correlation distance, and the Dynamic Time Wrapping method which is based on distance measurement. The ability of each of these three methods to distinguish accents depends on the amount of training data and (some of which depend heavily on) the extent of the correlation among data elements of the same class. |
---|---|
ISSN: |
1658-5933 |