العنوان بلغة أخرى: |
اكتشاف شدة عسر التلفظ باستخدام الشبكات العصبية المتكررة والتلافيفية Détection de la Gravité de la Dysarthrie à L'aide de Réseaux Neuronaux Récurrents et Convolutionnels |
---|---|
المصدر: | اللسانيات |
الناشر: | مركز البحث العلمى والتقنى لتطوير اللغة العربية |
المؤلف الرئيسي: | Hamza, Amina (Author) |
مؤلفين آخرين: | Addou, Djamel (Co-Author) |
المجلد/العدد: | مج30, ع2 |
محكمة: | نعم |
الدولة: |
الجزائر |
التاريخ الميلادي: |
2024
|
الشهر: | ديسمبر |
الصفحات: | 27 - 39 |
DOI: |
10.38169/0661-030-002-004 |
ISSN: |
1112-4393 |
رقم MD: | 1541944 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | الإنجليزية |
قواعد المعلومات: | AraBase |
مواضيع: | |
كلمات المؤلف المفتاحية: |
تصنيف اضطراب التلفظ | المؤشرات الصوتية | العلاج الآلي للكلام | Dysarthria Classification | CNN | RNN | CRNN | Acoustic Parameters | Automatic Speech Assessment
|
رابط المحتوى: |
الناشر لهذه المادة لم يسمح بإتاحتها. |
المستخلص: |
يعتمد تشخيص ومراقبة اضطراب التلفظ، وهو اضطراب في الكلام ناجم عن مشاكل عصبية حركية تؤثر على النطق، على تقييم دقيق لدرجة اضطرابه القصوى. عند إنشاء أنظمة آلية لتحديد وتصنيف الكلام عند اضطراب التلفظ، فإن التصنيف الدقيق لدرجة الاضطراب أمر ضروري. باستخدام نماذج الشبكة العصبية، وتحديدا الشبكات العصبية المتكررة (RNN) والشبكات العصبية التلافيفية (CNN)، تقدم هذه الورقة تحقيقاً شاملاً حول كيفية التمييز بين الأصوات ذات الاضطراب التلفظي بين مجموعة من عينات الأصوات الطبيعية وتصنيف شدة اضطراب التلفظ. من بين السمات المستخدمة في الدراسة، استعملنا جودة الصوت، والمؤشرات النغمية، والبواني الصوتية، ومؤشرات التردد الميلاني (MFCC)، والمنحنيات الطيفية. أن مقارنة قدرة الشبكات التلافيفية والشبكات المتكررة على تحديد الشذوذ في البيانات الطبيعية، بالإضافة إلى النموذج الهجين الذي يجمع بين الشبكات العصبية التلافيفية والشبكات المتكررة (CRNN)، يعتبر هدفنا من هذه الدراسة. قمنا باستغلال قاعدة البيانات Nemours لتقييم أداء نماذجنا للشبكات العصبية. في النهاية لاحظنا نسبة 99.8% التي تحصلنا عليها تعتبر أعلى دقة تصنيف تم تحقيقها باستخدام هذه القاعدة. The diagnosis and monitoring of dysarthria, a speech disorder caused by neuro-motor problems that affect articulation, depend on a precise evaluation of its severity. When creating automated systems to identify and categorize dysarthric speech, accurate severity classification is essential. Using neural network models, specifically recurrent neural networks (RNN) and convolutional neural networks (CNN), this paper offers a thorough investigation of how to distinguish dysarthric voices among a collection of normal voice samples and categorize the severity of dysarthria. Among the features used in the study are voice quality, prosodic parameters, formants, Mel frequency cepstral coefficients (MFCC), and spectrograms. Comparing the ability of convolutional networks and reccurents to identify abnormalities in normal data, as well as the hybrid model that combines convolutional and reccurent neural networks (CRNN), is our goal. The Nemours corpus database is used to assess these neural network models' performances. Notably, 99.8% is the highest classification accuracy attained with this corpus. Le diagnostic et le suivi de la dysarthrie, un trouble de la parole causé par des problèmes neuromoteurs qui affectent l'articulation, dépendent d'une évaluation précise de sa gravité. Lors de la création de systèmes automatisés pour identifier et catégoriser la parole dysarthrique, une classification précise de la gravité est essentielle. En utilisant les modèles de réseaux neuronaux, en particulier les réseaux neuronaux récurrents (RNN) et les réseaux neuronaux convolutionnels (CNN) , cet article propose une étude approfondie de la manière de distinguer les voix dysarthriques parmi une base d'échantillons de voix normales et de catégoriser la gravité de la dysarthrie. Parmi les caractéristiques utilisées dans l'étude figurent la qualité de la voix, les paramètres prosodiques, les formants, les coefficients cepstraux Mel (MFCC) et les spectrogrammes. Nous Comparons la capacité des réseaux convolutionnels et récurrents à identifier les anomalies dans les données normales, ainsi que le modèle hybride qui combine les réseaux neuronaux convolutionnels et récurrents (CRNN) , qui est notre objectif. La base de données du corpus Nemours est utilisée pour évaluer les performances de ces modèles de réseaux neuronaux. Nous avons enregistré un taux de 99,8% de précision de classification qui est le taux le plus élevée atteint avec ce corpus. |
---|---|
ISSN: |
1112-4393 |