العنوان بلغة أخرى: |
تجربة تقييم البيانات الضخمة لمعالجة قواعد البيانات XML |
---|---|
المؤلف الرئيسي: | العبرية، الغالية (مؤلف) |
مؤلفين آخرين: | Al-Badawi, Mohammed K. (Advisor) |
التاريخ الميلادي: |
2018
|
موقع: | مسقط |
الصفحات: | 1 - 69 |
رقم MD: | 972168 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة السلطان قابوس |
الكلية: | كلية العلوم |
الدولة: | عمان |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
بسبب تنوع مصادر وأشكال المعلومات أصبح تطور التكنولوجيا سريعا وينافس الحاجة لتحليل وتنفيذ العمليات في أجهزة الحاسب الآلي وخاصة المعالجات. تكنولوجيا البيانات الضخمة انتشرت على نطاق واسع لتغطي هذه الحاجة وتصنف قواعد بيانات الأكس أم أل (XML DB) المنتشرة بأحجام متزايدة مثالا على نوع البيانات التي من الممكن معالجتها باستخدام البيانات الضخمة (Big-Data). بسبب طبيعة هذه البيانات مثل أنها لا تتبع هيكل مبني على العلاقات مثل الجداول فأنه يوجد تحديات لمعالجة هذه البيانات. حيث بالأمكان تأثر معالج البيانات الضخمة بأنواع الاستعلامات وبخصائص (أبعاد) رئيسية لذلك النوع من قواعد البيانات: بعد الحجم والذي يقاس بعدد العناصر المدخلة، بعد العرض والذي يقاس بمتوسط عدد الأبناء لكل عنصر في القاعدة، وبعد العمق والذي يقاس بعدد المستويات المتداخلة في القاعدة. تهدف هذه الدراسة إلى معرفة الخصائص التي ممكن أن تؤثر إيجابيا أو بطريقة سلبية أثناء استعلام بيانات الأكس أم أل عندما نستخدم في بيئة البيانات الضخمة. وللتحقق من مدى تأثير البيانات الضخمة فقد تم اختيار تطبيق البيانات الضخمة يسمى (Marklogic) حيث تتم بتشغيل مجموعة محددة من الاستعلامات (queries) لاستخلاص معلومات معينة من مجموعة قواعد بيانات يمثل كل منها خاصية أو أكثر من الخصائص الثلاثة المذكورة أعلاه. يتم تسجيل الوقت الذي يستغرقه كل استعلام حتى يعطي النتائج النهائية ليتم بعد ذلك التحكيم بين الاستعلامات المقارنة (compared XML Queries) لقياس مدى التأثير وذلك من خلال مقارنة الوقت المستغرق لأكبر عدد ونوع من الاستعلامات المستخدمة في العملية. كلا من قواعد البيانات والاستعلامات مأخوذة من المعيار الثلاثي الأبعاد بعد التحسين (EXTENDING THE 3D XML BENCHMARK) الذي اثبت أنه مكمل للمعايير السابقة. أوضحت النتائج أن بعد العرض للبيانات له تأثير سلبي على معظم الاستعلامات في بيئة البيانات الضخمة. إضافة إلى ذلك أن استعلام (join on value) له تأثير بطيء على أداء الوقت. بالمقابل بعد موقع البيانات ليس له تأثير واضح على الأداء في بيئة البيانات الضخمة. وأخيرا، توصلت الدراسة إلى أنه يمكن إجراء المزيد من التجارب حول تأثير البيانات الضخمة للمعيار الثلاثي الأبعاد بعد التحسين (Extended 3D~ XBench) على عملية تقييم الأنظمة من خلال زيادة عدد الاستعلامات وقياس تأثيرها أو قياس تأثر متغيرات أخرى غير الوقت مثل CPU UsageوConsumption Memoryو IO-Operations. كما يمكن إعادة إجراء عملية تقييم المعيار المستخدم في هذه الدراسة على أنظمة منفصلة ومقارنتها مع النظام الواحد أو مقارنة برامج مختلفة لقواعد بيانات في بيئة البيانات الضخمة. |
---|