ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Web Mining based on Island Genetic Algorithms

العنوان بلغة أخرى: التنقيب في الشبكة العنكبوتية الواسعة باستخدام خوارزميات الجزر الجينية
المؤلف الرئيسي: Mezyan, Noha Marwan Ismail (Author)
مؤلفين آخرين: Samawi, Venus W. (Advisor)
التاريخ الميلادي: 2009
موقع: المفرق
الصفحات: 1 - 125
رقم MD: 819131
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة آل البيت
الكلية: كلية الأمير الحسين بن عبد الله لتكنولوجيا المعلومات
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

8

حفظ في:
المستخلص: يستخدم مختلف الناس الشبكة العنكبوتية الواسعة (WWW) كمنجم للمعلومات للبحث في مختلف المجالات. فبكل بساطة، يتم إدخال الاستعلام إلى محرك البحث (search engine) الذي يفحص ملايين الصفحات العنكبوتية لإيجاد الصفحة ذات الصلة الأقرب لذلك الاستعلام. إن الشبكة العنكبوتية الواسعة تختلف من يوم لآخر، ليس فقط من حيث حجم المعلومات بل من حيث محتويات الصفحات العنكبوتية أيضاً، وبالتالي فإن محرك البحث التقليدي قد يُظهر صفحات ذات جودة متدنية بين النتائج التي يولدها. يُضاف إلى ما سبق ازدياد الحاجة إلى مزيد من الوقت يومياً لإيجاد ما يبحث عنه المستخدم. ولذلك ظهرت الحاجة إلى تقنية تحسِّن نتائج محرك البحث التقليدي من ناحيتين: الوقت المستهلك في البحث، ودرجة صلة الصفحات العنكبوتية الناتجة عن عملية البحث بالاستعلام المدخل. من الممكن أن يتم ذلك من خلال التنقيب في الشبكة العنكبوتية الواسعة باستخدام الخوارزميات الجينية (Genetic Algorithms). وبالفعل درست العديد من الأبحاث موضوع التنقيب في الشبكة العنكبوتية الواسعة إما في محتواها (Web content mining)، أو في تركيبها (Web structure mining)، أو في استعمالها (Web usage mining) باستخدام الخوارزميات الجينية. ولكن هذه الأبحاث لم تستخدم الخوارزميات الجينية المتوازية والتي قد تحقق نتائج واعدة ليس من حيث جمع الصفحات العنكبوتية ذات الصلة فحسب بل من حيث تقليل الوقت المستهلك في عملية البحث في مخزن معلومات ضخم جداً كالشبكة العنكبوتية الواسعة، حيث يكون أسلوب التوازي في الخوارزميات الجينية مثل خوارزمية الجُزر الجينية (Island Genetic Algorithm) فكرة جيدة. في هذا البحث تم دراسة التنقيب في محتوى الشبكة العنكبوتية الواسعة باستخدام أربع جُزر جينية مختلفة عن بعضها البعض من حيث طرق الاختيار ودوال الصلاحية، حيث تستخدم الجزيرة الأولى طريقة الاختيار التنافسي العشوائي (random tournament selection) ومعامل جاكرد (Jaccard's coefficient)، والجزيرة الثانية تستخدم معامل أوتشِيا (Ochiai's coefficient) ونفس طريقة الاختيار المستخدمة في الجزيرة السابقة، أما الجزيرة الثالثة فتستخدم طريقة الاختيار غير المتحيز (unbiased tournament selection) ومعامل جاكرد، وأخيراً، الجزيرة الرابعة التي تستخدم معامل أوتشِيا كدالة صلاحية ونفس طريقة الاختيار غير المتحيز المستخدمة في الجزيرة الثالثة. إن التنقيب في محتوى الشبكة العنكبوتية الواسعة باستخدام هذه الجُزر المختلفة سيقود إلى بحث أسرع في الشبكة العنكبوتية الواسعة، حيث أن هذه الجُزر يمكن أن تعمل بشكل مستقل عن بعضها البعض على خوادم (servers) مختلفة مما يُنتج أداءً متوازياً. ومما يجدر ذكره أن تقنية توسعة الاستعلام (query expansion) قد استخدمت في هذا البحث أيضاً. تم تفعيل عملية البحث الجينية المتوازية باستخدام الجُزر مرتين، أولاهما قبل توسعة الاستعلام، وثانيهما بعد توسعة الاستعلام. إن استخدام تقنية البحث هذه تحسِّن نتائج البحث في الشبكة العنكبوتية الواسعة، ومن ثم فإن تشابه جيب التمام (cosine similarity) سيحكم على درجة صلة الصفحات العنكبوتية المسترجعة بالاستعلام. ولتحسين النتائج النهائية والحصول على عدد أكبر من الصفحات العنكبوتية ذات صلة أقرب بالاستعلام؛ يتم دمج وترتيب النتائج النهائية المتولدة من الجُزر الأربعة بالاعتماد على قيم تشابه جيب التمام. كما يدرس البحث سلوك الجُزر الأربعة من خلال مقارنة قدرتهم على استرجاع الصفحات العنكبوتية ذات الصلة الأقرب بالاستعلام.

عناصر مشابهة