ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Big Data: How the Open-Source Software will Open the Doors for Innovation in Libraries

العنوان بلغة أخرى: البيانات الضخمة: البرامج مفتوحة المصدر فتحت الأبواب للابتكار في المكتبات
المصدر: مجلة آداب المستنصرية
الناشر: الجامعة المستنصرية - كلية الآداب
المؤلف الرئيسي: الوائلي، زينب عبدالواحد سلمان (مؤلف)
المجلد/العدد: ع100
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2022
الشهر: كانون الأول
الصفحات: 23 - 43
ISSN: 0258-1086
رقم MD: 1337008
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: AraBase
مواضيع:
كلمات المؤلف المفتاحية:
البيانات الضخمة | المكتبات الجامعية | منصة هادوب | معالجة البيانات | الأنظمة مفتوحة المصدر | Big Data | University Libraries | Hadoop Platform | Data Processing | Open Source Systems
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: في هذا البحث تم استعراض كيفية التعامل مع البيانات الضخمة، إذ إن جمع وتخزين المعلومات والتحليل للبيانات أصبح مسألة لا يمكن السيطرة عليها من خلال برامج معالجة البيانات بأحجامها التقليدية، سابقا كانت واحدة من أكبر العقبات التي تواجه شركات التكنولوجيا والمؤسسات الناشئة ومحللي البيانات هي كيفية القدرة على معالجة مثل هذه الأحمال الكبيرة من البيانات والتي كانت عائقا كبيرا للعديد من الشركات الناشئة أو المؤسسات البحثية غير الربحية، لكن البرامج الحديثة مفتوحة المصدر مثل Hadoop وغيره أزالت هذه الحواجز، Hadoop هو منصة أو إطار عمل برمجي يسمح بتخزين ومعالجة البيانات على نطاق واسع، وهو مجاني ومتاح لجميع المبرمجين والمطورين. يهدف البحث إلى تحديد كيفية التعامل مع مجموعة من البيانات التي يتجاوز حجمها قدرة برامج قواعد البيانات المعروفة لالتقاطها وتخزينها وإدارتها وتحليلها والذي يتطلب أشكالا مبتكرة وفعالة لمعالجتها تختلف عن معالجة البيانات العادية بحيث تمكن مستخدميها من تحسين الرؤيا واتخاذ القرارات. عينة البحث هي الرسائل والاطاريح الجامعية المتاحة بشكل رقمي بصيفة PDF وبصيفة Word والمتوفرة في المكتبة المركزية للجامعة المستنصرية، وقد بلغت (107345) رسالة وأطروحة جامعية تمثل 2.49 تيرا بايت مقابل 25661 كتابا إلكترونيا مخزنة في هذه المكتبة، وتمثل 5852 ميغا بنصها الكامل، وبهذا بلغ العدد الإجمالي للبيانات المؤرشفة 3.08 تيرا بايت. وعلى الرغم من تنوع قواعد البيانات بين مكتبات الجامعة المختلفة، لكن السمة الغالبة في البحث هي حسب الموضوع أو المؤلف أو العنوان. ويتم استخدام طريقة البحث هذه في معظم أنواع قواعد البيانات المكتبية، ومن خلال عدة معايير منها الوقت والدقة وحجم المصادر التي يتم استدعاؤها في وقت واحد توصلت الباحثة في نتائج بحثها بأن الوضع الحالي غير مرضي وربما يستمر كذلك في المستقبل بسبب التزايد المستمر في أعداد وأحجام الرسائل والاطاريح الجامعية وما يقابله من تنافس قوي من قبل البحوث العلمية إذ أصبح الباحثين يتوجهون لها في الوقت الحاضر ومع تعقيدات الوصول إلى المعلومات الكاملة لمحتوى تلك الرسائل والاطاريح وعدم إتاحتها بالنص الكامل في أغلب قواعد البيانات وذلك بسبب عدم استخدام التقنيات الملائمة للتعامل مع البيانات الضخمة واستيعاب هذا الكم من البيانات فهذا يعني تردي الطلب على الاطاريح الجامعية قياسا بتزايد قوة الطلب على البحوث العلمية بسبب تعقيدات الوصول لمحتوياتها بالنص الكامل وعدم ملاءمة استراتيجيات البحث التقليدية لمواكبة احتياجات المستفيدين خاصة مع تزايد إتاحة الكتب بشكل رقمي رغم وجود بعض المحددات للوصول إلى المحتوى الرقمي الكامل للكتب الرقمية. أوصت الباحثة أنه من الضروري استخدام تقنيات تستجيب لاستراتيجيات البحث خاصة في البيانات الضخمة والبحث المتقدم عبر استخدام برنامج Hadoop لتغطية المخرجات الفكرية في المستقبل، وإمكانية استثمار Hadoop في مجال البيانات الضخمة واختيار المكتبة المركزية في الجامعة المستنصرية نموذجا للتعامل مع البيانات الضخمة وكيف يمكن إن تساهم في تنظيمها.

Big Data, defined in this paper as the gathering and storage of information and analysis on a scale typically untenable for traditional, mass-market data-processing software, has previously been one of the biggest obstacles facing tech companies, startups, and analytic researchers. The ability to process such large data loads has been a significant barrier of entry to the market for many young companies or not for profit research organization, but recent open-source software, such as Hadoop, have removed those barriers. Hadoop, a programming framework that allows for large-scale data storage and processing, is free and available to all developers. This software allows independent developers, the exceeds size whose data of set a with deal to how determine to aims research The which analyze, and manage store, capture, to programs database known-well of ability data ordinary from differ that processing of forms effective and innovative requires research. The making-decision and vision improve can users its that so processing in digitally available theses and theses university is sample PDF and Word and format (107345) to amounted, University Mustansiriya-Al of library central the in available this in stored e-books 25661 to compared terabytes, 2.49 representing thesis, and theses of number total the thus and, text full its in megabytes 5852 representing and library, the between databases of diversity the Despite. terabytes 3.08 reached data archived author subject, by is searcher the in feature dominant the libraries, university different through and, databases library of types most in used is method research This title, or at called are that sources the of size the and accuracy, time, including criteria, several from competition strong corresponding the and theses and theses University. time one the with and time present the at them to turning are researchers as research, scientific theses and theses these of content the for information full accessing of complexities appropriate of lack the to due databases most in text full in available being not and a means this data, of amount The this absorb and data large with deal to techniques demand increasing the to compared theses, university for demand the in deterioration text full the in contents its accessing of complextiesi the to due research scientific for the of needs the with pace keep to strategies research traditional of inadequacy the and the despite digital, in books of availability increasing the with especially beneficiaries, The digital, books of content digital full the access to limitations some of presence search to respond that techniques use to necessary is it that recommended researcher using by research, advanced and data big in especially strategies, the Hadoop program the in investing Hadoop of possibility the and future, the in outputs intellectual cover to a is University Mustansiriya-Al at library central The choosing and data big of field it organizing to contribute can it how and data big with dealing for model

ISSN: 0258-1086