ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Speaker age detection using eigen value

المصدر: المجلة العراقية للعلوم الإحصائية
الناشر: جامعة الموصل - كلية علوم الحاسوب والرياضيات
المؤلف الرئيسي: Al Saif, Khalia I. (Author)
مؤلفين آخرين: Abd Alnaby, Hiba A. (Co-Author)
المجلد/العدد: ع 20
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2011
الصفحات: 271 - 290
ISSN: 1680-855X
رقم MD: 422284
نوع المحتوى: بحوث ومقالات
قواعد المعلومات: EcoLink
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

3

حفظ في:
المستخلص: في هذا البحث تم اقتراح خوارزمية تعمل على تصنيف عمر المتكلم الى أحد الصنفين: صغار السن وكبار السن بالاعتماد على اشارة كلامه. تعتمد الخوارزمية المقترحة على استخلاص خواص اشارة الكلام من أجل الحصول على تمثيل ملخص لتلك الإشارة ومن ثم الاستفادة من تلك الخواص في عملية التصنيف. تم في هذه الخوارزمية اعتماد القيم المميزة لمصفوفة التباين التي تم تكوينها من بيانات إشارة الكلام (تكون عادة احادية البعد) بعد اعادة ترتيبها على هيئة عدد (2, 4, 8, 16, 32, 64) من المصفوفات الثنائية المربعة كعامل أساسي في عملية التمييز بين الصنفين. تتكون الخوارزمية المقترحة من مرحلتين رئيستين: -المرحلة الأولى: تضمنت إعداد ملف البيانات والذي ضم القيم المميزة لعدد من الأشخاص (80) من كلا الصنفين صغار وكبار السن (ولكلا الجنسين). إذ تم في هذه المرحلة ايضا إيجاد المعدل العام لتلك القيم لكل صنف بشكل مستقل ومن ثم ايجاد منحني حد العتبة الذي يمثل الحد الفاصل بين الصنفين. -المرحلة الثانية: ويتم فيها عملية التصنيف من خلال مقارنة المنحني الذي يمثل القيم المميزة لاشارة الكلام مع منحني حد العتبة. إذ تم اعتماد عدد من المقاييس في عملية تقييم دقة التصنيف. وإذ تراوحت قيم معامل الارتباط (correlation coefficient) بين (0.9610، 0.9994) عندما m=2 وm=64 على التوالي (وهذا يعني أنه كلما زادت عدد المصفوفات المكونة منها اشارة الكلام زاد مقدار الترابط)، مع وجود تباين كبير عند قياس عامل mmse. فبعد تطبيق الخوارزمية المقترحة على 50 شخص من كلا الجنسين وجد أن الخوارزمية نجحت في تصنيف عمر الأشخاص بنسبة %80 وأخفقت بنسبة %20 منهم.

In this research an algorithm was suggested for classifying a speaker age to two classes: (young and old classes) based on his speech signal. The suggested algorithm depend on a speech signal feature extraction in order to get a compact representation for this signal and to adopte these features in the classification process. In this algorithm, the eigen values of the covariance matrix was adopted as a principle parameter in the recognition between the two classes. It was constructed from the data of the speech signal (usually one dimension )after rearranghng it into a number (2,4,8,16,32,64) of a two dimension square matrix array . The suggested algorithm include two main stages: ¨ 1st stage: includes data file preparation that contains the eigen values for a number of persons belong to both classes young and old (with different gender), in this stage the average of these values for each class to be calculated separately and the threshold curve(which represents the boundary seperating between two classes) were also computed. Second stage: in this stage the classification process was done by comparing the curve that represents the eigen values of the speech signal, with the threshold curve, a different number of performance parameters are adopted in the evaluation the accuracy of the classification process. The measured correlation value was in range of (0.9610, 0.9994 ) when m=2 and m=64, respectively (this means whenever the number of arrays that the speech signal constructed from it increases, the correlation coefficient also increases) , while a clear difference can be seen with mmse parameter. After applying the suggested algorithm on 50 persons from both genders, the algorithm passed in applying 80% and failed in percentage 20% of them.

وصف العنصر: ملخص لبحث منشور باللغة الانجليزية
ISSN: 1680-855X