المصدر: | مجلة كلية التربية |
---|---|
الناشر: | الجامعة المستنصرية - كلية التربية |
المؤلف الرئيسي: | Tawfik, Zaki S. (Author) |
المجلد/العدد: | ع 6 |
محكمة: | نعم |
الدولة: |
العراق |
التاريخ الميلادي: |
2010
|
الصفحات: | 117 - 128 |
ISSN: |
1812-0380 |
رقم MD: | 426739 |
نوع المحتوى: | بحوث ومقالات |
قواعد المعلومات: | EduSearch |
مواضيع: | |
رابط المحتوى: |
الناشر لهذه المادة لم يسمح بإتاحتها. |
المستخلص: |
البيانات المستخرجة من مصادر المختلفة تتكامل وتحول إلى الصيغة المناسبة. هذه البيانات تحتوي على العديد من الأخطاء أو عدم تناسق في البيانات لذلك من الضروري تنظيف إزالة الأخطاء من البيانات الموجودة للحصول على بيانات عالية الجودة قبل إجراء عملية تعدين البيانات. تعد عملية التنظيف البيانات من هذه المهمة الأولى لأي تحليل البيانات. من دون أجراء عملية تنظيف البيانات تكون من الصعب تطبيق خوارزميات تعدين البيانات لأن النتائج سوف تكون غير جيدة. لذلك تم وضع خطوات أساسيات لتنظيف البيانات التي تستخرج من مصادر عديدة للحصول على بيانات ذات نوعية جيدة وذات قيمة عالية في عملية تعدين البيانات وتخزين البيانات وتخفيض التكاليف وزيادة الأرباح نتيجة دقة البيانات الناتجة، مع تنفيذ لبيانات لتنفيذ خطوات تم اختيار بيانات من استمارة الفحوص المختبرية للكيمياء السريرية لمستشفى اليرموك التعلمي لكشف الأخطاء وإزالتها أو عدم اتساق البيانات المرضى. The Data extracted from many sources will be integrated and then transform into suitable form. Tthese data may be includes many errors and noise or inconsistencies data. It is necessary to clean the data to get quality data before the data mined from errors and noise data. The cleaning is the first task before any data analysis. The resultant of cleaning analysis/model can be stamped for data quality which very impotent for data minig process because without data quality the algorithms of data nining can not work well or the result of algorithms not good. Therefor this paper deal with Basics steps to clean data that extracted from many sources to get good quality data for data mining also reduce processing time, storage data and reducing costs and increasing profits, for this case an implementation for data selected from clinical chemical test for yarmook hospital education to detect and remove the errors or noise and or inconsistencies data. |
---|---|
وصف العنصر: |
ملخص لبحث منشور باللغة الإنجليزية |
ISSN: |
1812-0380 |