ارسل ملاحظاتك

ارسل ملاحظاتك لنا







استخدام خوارزميات تعلم الآلة لتصنيف همزتي الوصل والقطع

العنوان المترجم: Using Machine Learning Algorithms to Classify Hamzat Al-Wasl and Hamzat Al-Qat'
المصدر: مجلة كلية الآداب والعلوم الإنسانية
الناشر: جامعة قناة السويس - كلية الآداب والعلوم الإنسانية
المؤلف الرئيسي: الثقفي، طلال أحمد شداد (مؤلف)
المؤلف الرئيسي (الإنجليزية): Al-Thaqafi, Talal
مؤلفين آخرين: علي، ياسر نصر الدين السيد (م. مشارك) , عبدالمعطي، محمد فتحي عبدالفتاح (م. مشارك) , بشير، طلال الطاهر قطبي (م. مشارك)
المجلد/العدد: ع35
محكمة: نعم
الدولة: مصر
التاريخ الميلادي: 2020
الشهر: ديسمبر
الصفحات: 11 - 47
DOI: 10.21608/jfhsc.2021.72432.1016
ISSN: 2536-9458
رقم MD: 1167410
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: AraBase, HumanIndex
مواضيع:
كلمات المؤلف المفتاحية:
الذكاء الاصطناعي | خوارزميات تعلم الآلة | همزة الوصل | همزة القطع | خوارزميات التصنيف | اللغة العربية | Artificial Intelligent | Machine Learning Algorithms | Hamza | Wasl | Gtaa | Classification Algorithms | Arabic Language
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

101

حفظ في:
المستخلص: تعتبر اللغة العربية كائن حي ينمو ويتطور بالممارسة والتطبيق الصحيح لجميع آدابها وفروعها النحوية والصرفية والدلالية والمعجمية، وفي هذه الدراسة البحثية نستعرض مساهمة التقنية في تطور اللغة العربية لاسيما الرسم الصحيح لهمزتي الوصل والقطع. يهدف هذا البحث بشكل خاص لبناء نموذج منصف ذكي يعمل على تصنيف الكلمات العربية المبتدئة بحرف الألف، وتصنيف همزتها إلى همزة وصل أو همزة قطع من خلال استخدام تقنيات الذكاء الاصطناعي بصورة عامة، وخوارزميات تعلم الآلة بصورة خاصة من أجل تأسيس معايير دقيقة وصحيحة في رسم همزتي الوصل والقطع بالصورة الصحيحة، وبذلك نكون قد طوعنا التقنية لتسهم في خدمة اللغة العربية. اعتمد هذا البحث على تجميع الكلمات العربية المبتدئة بالهمزة وذلك عن طريق تصميم استبانة رقمية مهمتها تجميع أكبر قدر من الكلمات المبتدئة بالهمزة وتصنيفها لهمزتي وصل أو قطع وفقاً للقواعد النحوية المتبعة في ذلك، تم نشر الاستبانة على الويب وتمت تعبئتها بواسطة 50 متخصص في النحو بدرجات علمية متفاوتة، حيث بلغ عدد الكلمات الكلية المصنفة 400 كلمة، وبعد معالجة واستبعاد الكلمات المكررة وعددها 101 كلمة، حصلنا على عدد 299 كلمة صالحة لتطبيقها على نموذج المصنف، وبناء على حجم ونوع البيانات المجمعة وآلية التصنيف المتبعة تم تطبيق خوارزميات تصنيف تتناسب مع العينة المجمعة مثل خوارزمية آلة دعم المتجه (SVM) وخوارزمية نايف بيز (NB) وخوارزمية الجار الأقرب (KNN) وذلك من خلال استخدام لغة Python ومكتبة (sk- learn). بعد تدريب نماذج المصنفات المستخدمة وقياس دقة الخوارزميات تبين أن خوارزمية آلة دعم المتجه (SVM) قد حصلت على أعلى دقة للنموذج بنسبة 92% وهي نسبة مرتفعة وكافية لحل مشكلة البحث.

The Arabic language is considered a living organism that grows and develops through the correct practice and application of all its literature and its syntactic, morphological, semantic, and lexical branches. In this research study, we review the contribution of technology to the development of Arabic language, especially the correct writing of Hamzat Alwasl and Hamzat Alqatae. This research aims to build a smart Classifier model to classify Arabic words beginning with the letter alif and their hamza into conjunctive and disjunctive through the using of artificial intelligence techniques in general and machine learning algorithms to establish accurate and correct criteria in writing the conjunctive and disjunctive hamza correctly. Consequently, technology would be adapted to contribute to the service of Arabic language. This research relied on the compilation of Arabic words beginning with hamza by designing a digital questionnaire. The task of this questionnaire is to collect the largest number of words beginning with hamza and to classify them as Alwasl and Hamzat Alqatae according to the grammatical rules followed in this process The questionnaire was circulated in the internet web and was filled out by fifty specialists in syntax with different academic ranks The total number of classified words reached 400 words and after processing and excluding the repeated words, 101 words, we obtained 299 valid words to be applied to the Classifier model, and based on the size and type of the collected data and the classification mechanism followed, classification algorithms were applied that fit the collected sample such as the vector support machine algorithm. Naif Biz algorithm, and Nearest neighbor algorithm by using Python language and sk-lcam library. After training the used classificatory models and measuring the accuracy of the algorithms, it was quite apparent that the vector support machine (SVM) algorithm had obtained the highest accuracy of the model (92%), a high and enough percent to solve the research problem.

ISSN: 2536-9458

عناصر مشابهة