LEADER |
05572nam a2200277 4500 |
001 |
1902378 |
024 |
|
|
|3 10.37575
|
041 |
|
|
|a eng
|
044 |
|
|
|b السعودية
|
100 |
|
|
|9 126510
|a الشرهان، إيمان
|e مؤلف
|
245 |
|
|
|a Developing a Stress Prediction Tool for Arabic Speech Recognition Tasks
|
246 |
|
|
|a تطوير أداة لتمييز مواضع النبر في الكلمات لأنظمة التعرف الآلي على الكلام العربي
|
260 |
|
|
|b جامعة الملك فيصل
|c 2021
|
300 |
|
|
|a 119 - 125
|
336 |
|
|
|a بحوث ومقالات
|b Article
|
520 |
|
|
|a يتطلب تطوير تطبيقات المعالجة الآلية للغة العربية مراعاة الخصائص اللغوية المختلفة الموجودة في الكلام، وترجمة تلك الخصائص الكلامية كتابيا، من أجل تقليل التعقيد الحسابي، وبالتالي تقليل معدل الخطأ في التعرف على الكلمات. تعتبر الخواص الكلامية فوق القطعية - كالنبر - من الخصائص الأساسية للكلام، والتي يمكنها بدورها أن تعزز أداء العديد من تطبيقات المعالجة الآلية للكلام. تستهدف الدراسة الحالية تطوير أداة تقوم بتقسيم الكلمة إلى المقاطع التي تتكون منها، وتمييز المقاطع المنبورة بشكل آلي، وسيتم استخدام مخرجات هذه الآلة في بناء القاموس الصوتي اللازم لتطوير نظام التعرف التلقائي على الكلام العربي. يجب أن تكون هذه الآلة دقيقة ومبنية على أسس لغوية صحيحة حتى تكون مفيدة تطبيقيا، ولاختبار فعالية ودقة الآلة المطورة قامت الدراسة بتطوير أنموذجين مختلفين لبرنامج التعرف الآلي على الكلام العربي بهدف مقارنة أدائهما. يستخدم الأنموذج الأول في بناء النموذج الصوتي للنظام القاموس الصوتي الأساسي (بدون نبر)، بينما يعتمد الأنموذج الثاني على القاموس المولد آليا باستخدام الأداة التي قمنا بتطويرها. تشير النتائج إلى تفوق استخدام القاموس المولد آليا على الاستخدام التقليدي للقاموس الصوتي، وذلك بتخفيض معدل الخطأ في التعرف على الكلمات بنسبة (5.6%) عند تمييز كل محتويات المقطع المنبور، وتحسن بنسبة (3.5%) عند استخدام القاموس الذي يميز الحركات المنبورة فقط. تعتبر هذه النتائج مشجعة للقيام بدراسات مستقبلية تقوم بتوظيف المميزات العروضية للكلام عند تطوير تطبيقات معالجة الكلام الآلية المختلفة.
|
520 |
|
|
|b Developing natural language processing applications for Arabic must consider the different linguistic characteristics found in speech and translate those characteristics to script in order to reduce computational complexity and therefore reduce the word error rate (WER). Suprasegmental features are fundamental properties of speech that can enhance the performance of many natural speech processing applications. The present study considered stress as a prosodic feature comprising the prominence of syllables in speech by developing a tool that generated phonetic transcriptions and predicted the stress position. The generated transcription was used to create the phonetic dictionary necessary for developing an automatic speech recognition (ASR) system. This tool had to be accurate, linguistically motivated, and applicationally useful; therefore, the effectiveness of the generated stress-marked phonetic dictionary was tested by comparing the performance of a standard fixed dictionary-based system with that of one using the automatically generated dictionary. The research reported a 5.6% reduction in WER when using a dictionary with stress markers attached to each phone in the stressed syllable and a 3.5% reduction in WER when using a dictionary with stress markers assigned only to stressed vowels. These results encourage future studies to employ prosodic features of speech when developing different speech processing applications.
|
653 |
|
|
|a الدراسات اللغوية
|a اللغة العربية
|a مواضع النبر
|a الأنظمة الآلية
|a المعالجة اللغوية
|
692 |
|
|
|a الخصائص فوق القطعية
|a النبر
|a الكتابة الصوتية
|a نظام التعرف الآلي على الكلام
|b Suprasegmental Features
|b Stress
|b Phonetic Transcription
|b Automatic Speech Recognition
|
773 |
|
|
|4 العلوم الإنسانية ، متعددة التخصصات
|6 Humanities, Multidisciplinary
|c 016
|e Scientific Journal of King Faisal University - Humanities and Management Sciences
|f Al-Migalat al-ilmayat li-Gamiat al-Malik Faisal
|l 002
|m مج22, ع2
|o 0185
|s المجلة العلمية لجامعة الملك فيصل - العلوم الإنسانية والإدارية
|v 022
|x 1319-6944
|
700 |
|
|
|a الناجم، صلاح راشد
|g Al-Najem, Salah
|e م. مشارك
|9 173483
|
856 |
|
|
|u 0185-022-002-016.pdf
|
930 |
|
|
|d y
|p y
|q n
|
995 |
|
|
|a EcoLink
|
995 |
|
|
|a HumanIndex
|
999 |
|
|
|c 1159333
|d 1159333
|