العنوان بلغة أخرى: |
Examining the Relationship between Data Resource Utilization and Natural Language Processing Quality: Analytical Study of Siri as a Model |
---|---|
المصدر: | المجلة العربية للنشر العلمي |
الناشر: | مركز البحث وتطوير الموارد البشرية - رماح |
المؤلف الرئيسي: | البادي، هند بادي علي (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Albadi, Hind Badi |
مؤلفين آخرين: | العبيدي، رنا عبدالله (م. مشارك) |
المجلد/العدد: | ع60 |
محكمة: | نعم |
الدولة: |
الأردن |
التاريخ الميلادي: |
2023
|
الشهر: | تشرين الأول |
الصفحات: | 394 - 422 |
ISSN: |
2663-5798 |
رقم MD: | 1436964 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | EduSearch, HumanIndex |
مواضيع: | |
كلمات المؤلف المفتاحية: |
معالجة اللغات الطبيعية | الذكاء الاصطناعي | موارد البيانات | المساعدات الرقمية الصوتية | Natural Language Processing | Artificial Intelligence | Data Resources | Siri | Voice Digital Assistant
|
رابط المحتوى: |
المستخلص: |
تساهم تقنية معالجة اللغة الطبيعية في العديد من المجالات مثل الرعاية الصحية وخدمة العملاء، والإدارة المالية، والبحث الأكاديمي وغيرها الكثير. نظرا للاختلافات في اللغات الموجودة في جميع أنحاء العالم، يمكن أن يختلف استخدام تطبيقات معالجة اللغة الطبيعية في الفعالية اعتمادا على اللغة المستخدمة. هدفت الدراسة إلى الكشف عن الفروقات التي تنشأ عند استخدام تطبيقات معالجة اللغة الطبيعية بلغات مختلفة، وقياس أسباب هذه الاختلافات باستخدام أداة Siri كنموذج لإحدى تقنيات معالجة اللغات الطبيعية وذلك بالتركيز على ثلاث لغات العربية والإنجليزية "الأمريكية" والإسبانية. اعتمدت الدراسة المنهج الوصفي التحليلي لتحليل عمل تطبيقات معالجة اللغات الطبيعية المتاحة لكل لغة من اللغات المختارة، وذلك من خلال أدوات الملاحظة والاختبار كوسيلة لرصد وتوثيق الملاحظات. بعد إجراء الاختبارات المحددة لـ Siri عن طريق 21 أمر مقسمة إلى ثلاث فئات (أوامر أساسية، أوامر مركبة، أوامر للترفيه) وكل أمر مقسم إلى 7 أسئلة، خلصت الدراسة إلى أن السبب الرئيسي للاختلافات أو الضعف في جودة النتيجة يعود إلى التفاوت بين توافر وجودة مصادر البيانات باللغة العربية مقارنة بالإنجليزية والإسبانية. في حين مقدرة اللغتين الإنجليزية والإسبانية في الوصول إلى العديد من مصادر البيانات بشكل أفضل. بغض النظر عن عدد الناطقين الهائل باللغة يعد توفر الموارد المصنفة والمقننة لغويا وبلغة يمكن أن تفهمها الآلة أمرا آخرا من شأنه أن يؤثر على جودة الاستجابة. توصي الدراسة أنه يجب إيلاء الاهتمام إلى تعزيز مصطلحات اللغة العربية من قبل المتحدثين الأصليين واستخدامها لإنشاء مصادر بيانات من شأنها تحسين جودة تطبيقات معالجة اللغة الطبيعية لتحقيق أقصى استفادة من التقنيات المتاحة، والحصول على مخرجات عالية الجودة. Natural language processing (NLP) technology is crucial in enhancing the performance of many fields, including healthcare, customer service, financial management, and academic research. However, the effectiveness of NLP applications varies depending on the language used, due to the significant differences that exist in languages globally. Therefore, this study aims to explore the differences that arise when employing NLP applications in different languages, using Siri as a model for natural language processing techniques. The study focuses on three languages, Arabic, "American" English, and Spanish. The study adopts a descriptive-analytical approach to analyze the performance of NLP applications available for each selected language. Through observing and testing tools to monitor and document observations, the study assesses the quality of the results obtained from Siri's specific tests. Consequently, the study discovers that language disparities and the quality of data sources contribute to the weaknesses in the quality of the results of the Arabic language compared to English and Spanish. Therefore, the study recommends using native speakers' Arabic language terms to create data sources to improve the quality of NLP applications and achieve higher-quality outputs. |
---|---|
ISSN: |
2663-5798 |