A Proposal of Deep Web Crawling System by Using Breath-First Approach

Tahseen, Israa; Salim, Duaa

A Proposal of Deep Web Crawling System by Using Breath-First Approach

المصدر:	المجلة العراقية لتكنولوجيا المعلومات
الناشر:	الجمعية العراقية لتكنولوجيا المعلومات
المؤلف الرئيسي:	Tahseen, Israa (Author)
مؤلفين آخرين:	Salim, Duaa (Co-Author)
المجلد/العدد:	مج9, ع2
محكمة:	نعم
الدولة:	العراق
التاريخ الميلادي:	2018
الصفحات:	48 - 61
DOI:	10.34279/0923-009-002-004
ISSN:	1994-8638
رقم MD:	1028880
نوع المحتوى:	بحوث ومقالات
اللغة:	الإنجليزية
قواعد المعلومات:	HumanIndex
مواضيع:	علوم الحاسوب \| البيانات \| الويب العميق \| قواعد البيانات
كلمات المؤلف المفتاحية:	Deep Web \| Crawler \| Search Engine \| Token \| Hidden Data
رابط المحتوى:	PDF (صورة)

عدد مرات التحميل

26

LEADER	03385nam a22002537a 4500
001	1766473
024		\|3 10.34279/0923-009-002-004
041		\|a eng
044		\|b العراق
100		\|9 557454 \|a Tahseen, Israa \|e Author
245		\|a A Proposal of Deep Web Crawling System by Using Breath-First Approach
260		\|b الجمعية العراقية لتكنولوجيا المعلومات \|c 2018
300		\|a 48 - 61
336		\|a بحوث ومقالات \|b Article
520		\|a الكثير من البيانات الموجودة على الشبكة العنكبوتية العالمية لا تزال غير متاحة للغوص من قبل محركات البحث، في ضوء الحقيقة لابد من الكشف عن هذه البيانات عند الطلب من قبل المستخدم عندما يقوم بمليء النموذج. الجزء الغامض من الويب والذي يكون مخبأ وراء الواجهات يعرف بالويب العميق ويسمى أيضاً بالويب الغير مرئي، حوالي 96% من البيانات تكون مخفية وراء واجهات الويب العميق. هذه الرسالة تهدف إلى بناء نظام الغوص العميق للويب الذي يستخرج البيانات المخفية وكذلك جميع الروابط التشعبية التي تشير إلى صفحات الويب الأخرى باستخدام طريقة السعة أولاً. الاستنتاجات التي تم التوصل إليها في هذا البحث هي: تحميل محتويات الويب العميق بواسطة استخدام طريقة الطفو السطحي مع قواعد البيانات الغير مهيكلة، والنتائج المدخلة أثبتت بأن الصفحات ذات الجودة العالية بالنسبة لاستعلام المستخدم يتم عرضها للمستخدم في أعلى قائمة النتائج.
520		\|b A lot of data on the WWW stay unavailable to crawlers of web search engines, so it must uncovered data when the users submits form with valid inputs. The obscure of some portion of web which is hidden behind the interfaces is define as a Deep web, It is also called invisible web. Around 96% of data are hidden behind the Deep web interfaces. This paper aims to build a Deep web Crawling system that extract the hidden data and all hyperlinks that are pointing to other web pages by using Breath-first search. The concluded issues in this research are: downloading the deep web content by using the surfacing approach with un-structural DB, the yielded results prove that a higher quality pages which relevant to user query is displayed to the user at the top of the results list.
653		\|a علوم الحاسوب \|a البيانات \|a الويب العميق \|a قواعد البيانات
692		\|b Deep Web \|b Crawler \|b Search Engine \|b Token \|b Hidden Data
700		\|9 557456 \|a Salim, Duaa \|e Co-Author
773		\|4 علوم المعلومات وعلوم المكتبات \|6 Information Science & Library Science \|c 004 \|e Iraqi Journal of Information Technology \|f Al-Maǧallaẗ al-ʻirāqiyyaẗ li-tiknulūǧiyā al-maʻlūmāt \|l 002 \|m مج9, ع2 \|o 0923 \|s المجلة العراقية لتكنولوجيا المعلومات \|v 009 \|x 1994-8638
856		\|u 0923-009-002-004.pdf
930		\|d y \|p y \|q n
995		\|a HumanIndex
999		\|c 1028880 \|d 1028880

عناصر مشابهة

A Proposed Model For Data Warehouse ETL Processes
بواسطة: El-Sappagh, Shaker H. Ali منشور: (2011)
An Anonymization Technique Using Intersected Decision Trees
بواسطة: Fletcher, Sam منشور: (2015)
A Performance Evaluation Of In-memory Databases
بواسطة: Kabakus, Abdullah Talha منشور: (2017)
Estimation of Null Value in Relational Data Base System Using K-Nearest Neighbor and Decision Tree
بواسطة: Al Samadi, Sarah منشور: (2013)
Federated database framework for disease outbreak information and norification systems : a Web service approach
بواسطة: Ghaleb, Mustafa منشور: (2014)

A Proposal of Deep Web Crawling System by Using Breath-First Approach

عدد مرات التحميل

26

عناصر مشابهة

دليل المستخدم

دليل الفيديو