ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Basic Steps to Get Data Quality for Data Mining

المصدر: مجلة كلية التربية
الناشر: الجامعة المستنصرية - كلية التربية
المؤلف الرئيسي: Tawfik, Zaki S. (Author)
المجلد/العدد: ع 6
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2010
الصفحات: 117 - 128
ISSN: 1812-0380
رقم MD: 426739
نوع المحتوى: بحوث ومقالات
قواعد المعلومات: EduSearch
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: البيانات المستخرجة من مصادر المختلفة تتكامل وتحول إلى الصيغة المناسبة. هذه البيانات تحتوي على العديد من الأخطاء أو عدم تناسق في البيانات لذلك من الضروري تنظيف إزالة الأخطاء من البيانات الموجودة للحصول على بيانات عالية الجودة قبل إجراء عملية تعدين البيانات. تعد عملية التنظيف البيانات من هذه المهمة الأولى لأي تحليل البيانات. من دون أجراء عملية تنظيف البيانات تكون من الصعب تطبيق خوارزميات تعدين البيانات لأن النتائج سوف تكون غير جيدة. لذلك تم وضع خطوات أساسيات لتنظيف البيانات التي تستخرج من مصادر عديدة للحصول على بيانات ذات نوعية جيدة وذات قيمة عالية في عملية تعدين البيانات وتخزين البيانات وتخفيض التكاليف وزيادة الأرباح نتيجة دقة البيانات الناتجة، مع تنفيذ لبيانات لتنفيذ خطوات تم اختيار بيانات من استمارة الفحوص المختبرية للكيمياء السريرية لمستشفى اليرموك التعلمي لكشف الأخطاء وإزالتها أو عدم اتساق البيانات المرضى.

The Data extracted from many sources will be integrated and then transform into suitable form. Tthese data may be includes many errors and noise or inconsistencies data. It is necessary to clean the data to get quality data before the data mined from errors and noise data. The cleaning is the first task before any data analysis. The resultant of cleaning analysis/model can be stamped for data quality which very impotent for data minig process because without data quality the algorithms of data nining can not work well or the result of algorithms not good. Therefor this paper deal with Basics steps to clean data that extracted from many sources to get good quality data for data mining also reduce processing time, storage data and reducing costs and increasing profits, for this case an implementation for data selected from clinical chemical test for yarmook hospital education to detect and remove the errors or noise and or inconsistencies data.

وصف العنصر: ملخص لبحث منشور باللغة الإنجليزية
ISSN: 1812-0380

عناصر مشابهة