ارسل ملاحظاتك

ارسل ملاحظاتك لنا







A New Approach for Arabic Text Extraction, Recognition and Speaking from Video Film

العنوان بلغة أخرى: منهجية جديدة لأستخراج تميز ونطق النص العربي من فيديو الأفلام
المؤلف الرئيسي: عبد الهلالي، نور على (مؤلف)
مؤلفين آخرين: الموسوي، كاظم مهدي هاشم (مشرف)
التاريخ الميلادي: 2016
موقع: الناصرية
التاريخ الهجري: 1437
الصفحات: 1 - 66
رقم MD: 1007566
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة ذي قار
الكلية: كلية التربية للعلوم الانسانية
الدولة: العراق
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

12

حفظ في:
المستخلص: مع الازدياد الواضح للبحوث المهتمة بمحاكاة الفعاليات البشرية ومعالجات اللغات الطبيعية بالإضافة إلى الانتشار الواسع لاستخدامات الفيديو تعليميا وترفيهيا ركز الكثير من الباحثين على استخراج الكائنات من الفيديو ومن أهمها النصوص باعتبارها مهمة للغاية في العديد من التطبيقات حيث تحتوي الكائنات النصية الموجودة في الفيديو على الكثير من المعلومات الدلالية ذات الصلة بمحتوى الوسائط المتعددة ومع ذلك لازال استخراج النص من الفيديو هو مهمة صعبة للغاية بسبب اختلاف حجم ونوع الخط بالإضافة إلى تعقيد الخلفية. أما تمييز النصوص العربية فما زالت تشكل تحديا نظرا لطبيعة الحروف العربية المتصلة والمشكلة. أما تحويل النص إلى كلام فهو التحدي الأكثر صعوبة لقلة الدراسات الخاصة بالنطق الآلي للغة العربية وعدم وجود قواعد ثابتة لتشكيل حركات النص العربي. قدمنا في هذه الأطروحة خوارزميات لاستخراج النص من الفيديو تشمل كشف/تحديد موقع النص وتتبع وتجزئة النصوص العربية من فيديوهات الأفلام وخوارزميات تميز النص العربي المستخرج من الفيديو بالإضافة إلى خوارزميات تحويل هذا النص إلى كلام منطوق. الهدف العام من هذا البحث هو تقديم نظام شامل يساهم في مساعدة غير القادرين على قراءة النص كالمكفوفين والأطفال أو الأميين ليتسنى لهم الاستفادة من المحتوى النصي للفيديو بالإضافة لدعم البحوث الخاصة باللغة العربية في مجال استخراج الفيديو وتميزه أو نطق النصوص المكتوبة. نستخدم طريقة أسقاط الملامح في الكشف وتحديد النص في إطارات الفيديو التي تمت معالجتها وتحويلها إلى صيغة ثنائية تليها مرحلة تتبع النص فالنص داخل الفيديو يستمر لفترة زمنية على الشاشة لأسباب تتعلق برؤية الأنسان فيتم تتبعه للتخلص من النصوص المكررة حيث استخدمنا طريقة الاختلاف بين الإطارات المتتابعة. أما مرحلة التجزئة فاعتمدنا طريقة إسقاط الملامح الأفقية لتجزئة الأسطر في الإطار الواحد وأسقاط الملامح العمودية لتجزئة أسطر النصوص إلى مقاطع الكلمات ليتم بعدها تميزها بالاعتماد على مقارنتها مع القوالب المخزنة باستخدام معامل الارتباط تليها مرحلة تشكيل النص فالنص المستخرج خالي من الحركات تقوم هذه العملية بإضافة الحركات إلى النص ليتسنى لنا تحويله إلى كلام مفهوم وقد استخدمنا معجم مصغر يشمل مجموعة من الكلمات العربية المشكلة. أما مرحلة تحويل النص إلى صوت فقمنا ببناء قاعدة بيانات تشمل حالات تلفظ كل حرف أي لكل حرف تسعة حالات وبناء خوارزمية دمج هذه الأصوات اعتمادا على المسح المتسلسل لكلمات النص المشكل بالإضافة إلى تسجيل مجموعة من الكلمات للحصول على صوت ملائم أكثر. لقد تم تنفيذ هذه الخوارزمية باستخدام برنامج Matlab R2013a وحاسوب HP EliteBook workstation corei7 واختبرنا النظام على خمسة فيديوهات متنوعة وكانت نتائج التجارب مرضية وصلت إلى اعلى من 90%.