ارسل ملاحظاتك

ارسل ملاحظاتك لنا









ROBUST TEXT-INDEPENDENT SPEAKER RECOGNITION WITH SHORT UTTERANCE IN NOISY ENVIRONMENT USING SVD AS A MATCHING MEASURE

العنوان بلغة أخرى: التعرف آلياً على متحدث في بيئة ضوضائية باستخدام تجزئ القيمة المفردة كقياس للتطابق حينما تكون العبارة المنطوقة قصيرة
المصدر: مجلة جامعة الملك سعود - علوم الحاسب والمعلومات
الناشر: جامعة الملك سعود
المؤلف الرئيسي: Al Dhaheri, Rabah Wasel (Author)
مؤلفين آخرين: Al Saadi, Fuad E. (Co-Author)
المجلد/العدد: مج17
محكمة: نعم
الدولة: السعودية
التاريخ الميلادي: 2005
الصفحات: 23 - 41
ISSN: 1319-1578
رقم MD: 665164
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: science
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: قدمت في هذه الورقة طريقة جديدة للتعرف على متحدث في بيئة ضوضائية دون النظر إلى العبارة المنطوقة. تبدأ هذه الطريقة بتحليل العبارة المنطوقة وإيجاد سمات تعتمد على معاملات التنبؤ الخطية لكل متحدث مسجل في قاعدة البيانات. هذه السمات تخزن على أنها دلائل على المتحدثين وعند عملية اختبار أي متحدث والتعرف عليه تحلل أيضا العبارة التي ينطقها ويستخرج منها السمات الخاصة بالمتحدث وتقارن هذه السمات بكل السمات الموجودة في قاعدة البيانات. المقارنة تتم بإيجاد نسبة القيمة المفردة الكبرى على القيمة المفردة الصغرى والمتحدث الذي يعطي أكبر نسبة يعتبر هو المتحدث المجهول. طبقت هذه الطريقة على عشرين متحدث (16 رجلا و4 نساء). يقوم كلا منهم بنطق عشرين عبارة اختبار وقد أثبتت هذه الدراسة على أن الطريقة المقترحة أفضل من الطرق الأخرى التي أجريت عليها الدراسة تحت كل الظروف المختلفة من الضوضاء حيث حصلنا على نسبة تعرف تصل إلى 94% في حالة عدم وجود ضوضاء، وحينما تكون الضوضاء عالية جدا (نسبة الإشارة إلى نسبة الضوضاء- (dB، فإن النسبة تصل إلى 32%.

A new technique for text-independent speaker recognition for noisy speech is presented. This technique is based on finding the ratio of the singular values of the feature vectors of the unknown speaker and each of the N reference features stored in the constructed database. The ith reference feature that gives the largest ratio is considered the feature of the unknown speaker. An o/erall correct recognition accuracy of 94% for clean speech and 32% for noisy speech of 0 dB SNR was obtained. A further step was conducted to enhance the noisy features by series expansion. The improvement in the recognition rate using the proposed SVD-based algorithm is compared with other distance measure algorithms. It is found that the proposed technique when cepstral features are used outperforms the conventional matching measure such as the Euclidean, the Weighted and the Mahalonobis distances, respectively.

ISSN: 1319-1578

عناصر مشابهة