ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Automatic Arabic Text Diacritization Using Recurrent Neural Networks

العنوان بلغة أخرى: التشكيل الآلي للنصوص العربية باستخدام الشبكات العصبونية ذات التغذية الراجعة
المؤلف الرئيسي: عربيات، آلاء خالد رضوان (مؤلف)
مؤلفين آخرين: عبندة، غيث على (مشرف)
التاريخ الميلادي: 2015
موقع: عمان
الصفحات: 1 - 64
رقم MD: 1044354
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الاردنية
الكلية: كلية الدراسات العليا
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

25

حفظ في:
المستخلص: النصوص العربية المستخدمة حاليا في المدارس والجامعات وأماكن العمل وفي الكتب والإعلام غالبا ما تكون غير مشكلة. السبب في هذا هو لتقليل أجور الطباعة. نتيجة لذلك، الكثير من الكلمات تكون مبهمة وذلك لأن نفس الكلمة ممكن أن تقرأ بأكثر من طريقة وممكن أن يكون لها أكثر من معنى. أبناء اللغة العربية يستطيعون استنباط اللفظ الصحيح والمعنى لكلمة معينة من خبرتهم وعلمهم باللغة ومن سياق الجملة لكن الأجانب والأطفال الذين يتعلمون اللغة حديثا لا يستطيعون، بالإضافة لذلك تطبيقات اللغة الحاسوبية مثل تمييز الكلام بشكل آلي والتحويل من نص مكتوب إلى كلام منطوق والعديد من التطبيقات الأخرى كلها تحتاج إلى أن يكون النص مشكولا. عالج الباحثون في هذا المجال مسألة التشكيل بطرق مختلفة. من هذه الطرق تلك التي تعتمد على قواعد النحو والصرف لاستنباط حركات التشكيل المناسبة، وأخرى تعتمد الطرق الإحصائية، وهناك نوع هجين حقق أفضل النتائج لغاية الآن؛ وهو الذي يدمج بين الطرق الإحصائية والمعرفة اللغوية بقواعد النحو والصرف. تم تقديم مقترح جديد لتشكيل النصوص في هذا البحث بحيث يتم استغلال الشبكات العصبونية ذات التغذية الراجعة في استرجاع حركات التشكيل باستخدام طريقة تحويل المتسلسلات للشبكات العميقة ثنائية الاتجاه ذات وحدات التخزين طويلة الأمد وقصيرة الأمد. أثبتت هذه الطريقة الإحصائية كفاءتها في مجال التشكيل حيث حققت نتائج متفوقة على قريناتها من الطرق في الأبحاث الأخرى. قمنا بعد ذلك ببناء طرق أخرى تعتمد على هذه الطريقة الإحصائية ولكن بإضافة معلومات لغوية تساعد الشبكات العصبونية ذات التغذية الراجعة على استرجاع علامات التشكيل بشكل أفضل لنحصل على طريقة هجينة. تم تعزيز نتائج الشبكات العصبونية ببعض الوسائل التصحيحية وهذا ساهم في تحسين دقة التشكيل أكثر فأكثر. إضافة المعلومات اللغوية ساعد الشبكات العصبونية ذات التغذية الراجعة على تحقيق نتائج هي الأكثر دقة لغاية الآن في مجال أنظمة التشكيل الهجينة. باستخدام كتاب جمعية البيانات اللغوية الجزء الثالث، حقق نظامنا الهجين نسبة خطأ في التشكيل على مستوى الحرف 2.74% ونسبة خطأ على مستوى الكلمة 9.66%. إذا لم نحتسب حركة التشكيل على الحرف الأخير فإن نسبة الخطأ على مستوى الحرف تصبح 1.24% و3.95% على مستوى الكلمة.

عناصر مشابهة