ارسل ملاحظاتك

ارسل ملاحظاتك لنا









Formants and Prosodic Features' Effects on Arabic Speaker Identification Accuracy in Noisy Environments

العنوان بلغة أخرى: تأثير البواني الصوتية والخصائص النبرية على دقة التعرف على المتكلم العربي في بيئات صاخبة
Effets des Formants et des Paramètres Prosodiques sur la Précision de L'identification du Locuteur Arabe dans des Environnements Bruités
المصدر: اللسانيات
الناشر: مركز البحث العلمى والتقنى لتطوير اللغة العربية
المؤلف الرئيسي: Boubakeur, Khadidja Nesrine (Author)
مؤلفين آخرين: Debyeche, Mohamed (Co-Author)
المجلد/العدد: مج30, ع2
محكمة: نعم
الدولة: الجزائر
التاريخ الميلادي: 2024
الشهر: ديسمبر
الصفحات: 40 - 52
DOI: 10.38169/0661-030-002-006
ISSN: 1112-4393
رقم MD: 1541949
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: AraBase
مواضيع:
كلمات المؤلف المفتاحية:
البواني الصوتية | الخصائص النبرية | النغمة | الشدة | التعرف الآلي على المتكلم | ASI | MFCC | Prosodic Features | Pitch | Energy | Formants | HMM | Noise
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: تتناول هذه الدراسة استخدام البواني الصوتية والخصائص النبرية، تحديدًا النغمة والشدة، لتحديد هوية المتحدث في بيئات صاخبة. لتعزيز قوة النماذج الصوتية ضد التغيرات في إشارات الكلام في بيئات صاخبة، تمت إضافة معاملات (MFCC) إلى هذه الميزات. تم إنشاء نظام تعرف آلي على المتكلم يعتمد على نماذج ماركوف المخفية (HMM). أظهر الجمع بين البواني الصوتية والميزات النبرية مع معاملات (MFCC) تحسنًا في دقة التعرف على المتكلم، خاصة في البيئات ذات الضوضاء العالية، بنسبة تصل إلى 10% مقارنة بالنظام القائم فقط على MFCC. تُظهر النتائج أن استخدام معاملات متعددة يعزز بشكل كبير من أداء نظام التعرف الآلي على المتكلم في وجود الضوضاء، مقارنة بالنظام القائم على MFCC وحده.

This study investigates the use of formants and prosodic features, specifically pitch and intensity, for speaker identification in real conditions. To enhance the robustness of the acoustic models against speech signal variations in noisy environments, Mel-Frequency Cepstral Coefficient (MFCC) are added to these features. A Speaker Identification system based on Hidden Markov Models (HMM) is implemented in the independent text mode. The combination of formants and prosodic features with cepstral features improves the identification accuracy, particularly in high-noise environments, up to 10%, in comparison to an MFCC based system. The results show that the use of multivariate feature vectors significantly improves the performance of an identification system in the presence of noise compared to an MFCC-based system.

Ce travail porte sur l'utilisation des formants et des paramètres prosodiques, notamment la fréquence fondamentale (Pitch) et l'intensité, pour l'identification du locuteur dans un environnement bruité. Afin d’améliorer la robustesse des modèles acoustiques face aux variations du signal de parole dans des environnements bruités, les paramètres cepstraux de fréquence Mel (MFCC) sont ajoutés à ces caractéristiques. Un système d'identification automatique du locuteur basé sur des modèles de Markov cachés (HMM) est mis en oeuvre. La combinaison des formants et des paramètres prosodiques avec les caractéristiques cepstrales permet d'améliorer la robustesse des systèmes d'identification, en particulier dans des environnements très bruyants, avec une amélioration de 10% par rapport à un système basé sur les MFCC. Les résultats montrent que l'utilisation de vecteurs de caractéristiques multivariées permet l'amélioration des performances d'un système d'identification en présence de bruit par rapport à un système basé sur les MFCC.

ISSN: 1112-4393

عناصر مشابهة