ارسل ملاحظاتك

ارسل ملاحظاتك لنا







An Efficient Approach for Medical Text Categorization Based on Clustering and Similarity Measures

العنوان بلغة أخرى: طريقة فعالة لتصنيف النصوص الطبية بالاعتماد على العنقدة ومقاييس التشابه
المصدر: مجلة ميسان للدراسات الأكاديمية
الناشر: جامعة ميسان - كلية التربية الأساسية
المؤلف الرئيسي: Khaleel, Amal Hameed (Author)
المجلد/العدد: مج15, ع29
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2016
الصفحات: 113 - 130
DOI: 10.54633/2333-015-029-015
ISSN: 1994-697X
رقم MD: 1185899
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: HumanIndex, EduSearch
مواضيع:
كلمات المؤلف المفتاحية:
Data Mining | Text Mining | Text Categorization "TC" | Midline | Euclidean Minimum Spanning Tree "EMST" | Cosine Similarity | Common Word Similarity
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
LEADER 04555nam a22002657a 4500
001 1931066
024 |3 10.54633/2333-015-029-015 
041 |a eng 
044 |b العراق 
100 |9 634642  |a Khaleel, Amal Hameed  |e Author 
245 |a An Efficient Approach for Medical Text Categorization Based on Clustering and Similarity Measures 
246 |a طريقة فعالة لتصنيف النصوص الطبية بالاعتماد على العنقدة ومقاييس التشابه 
260 |b جامعة ميسان - كلية التربية الأساسية  |c 2016 
300 |a 113 - 130 
336 |a بحوث ومقالات  |b Article 
520 |b The huge amount of medical information available in the medical document, makes the use of automated text categorization methods essential in clinical diagnosis and treatment. Automatic categorization of a text can provide information about classes which a text belongs to. This paper can serve as a medical diagnosis tool for categorization patient records by propose text categorization algorithm based on the similarity cluster centers for the categorization of patients with eye diseases records. We propose VEMST algorithm as update to EMST algorithm by using variance to find cluster centers. A text categorization algorithm is developed using two similarity measures (cosine, common words) to classify the categorical data. The results showed that when the number and size of medical documents used great for training the classification accuracy increases, as we noticed when we use comparing medical terms method in the preprocessing phase, the accuracy is better than the use of frequency of all terms in medical document, as well as the execution time at least. Finally, we found the performance of our system when we use the cosine similarity measure is better than his performance with the use of the similarity of common words scale. 
520 |a إن وجود كميات هائلة من المعلومات الطبية في المستندات الطبية، جعل استخدام أساليب التصنيف الآلي للنصوص ضروري في التشخيص والعلاج السريري. التصنيف الآلي للنص يستطيع أن يوفر معلومات حول توقع الصنف الذي ينتمي إليه النص. هذا البحث يمكن أن يكون بمثابة أداة تشخيص طبي لتصنيف سجلات المرضى وذلك باقتراح خوارزمية تصنيف النص بالاعتماد على تشابه المراكز العنقودية لتصنيف سجلات المرضى المصابين بأمراض العين. اقترحنا خوارزمية (VEMST) كتحديث لخوارزمية (EMST) وذلك باستخدام التباين لإيجاد المراكز العنقودية وتم تطوير خوارزمية تصنيف النص باستخدام مقياسي التشابه (جيب التمام، الكلمات المشتركة) لتصنيف البيانات المنعقدة. حيث أظهرت النتائج أنه عندما يكون عدد وحجم الوثائق الطبية المستخدمة للتدريب كبير فإن دقة التصنيف تزداد، كذلك لاحظنا عند استخدامنا طريقة مقارنة المصطلحات الطبية في مرحلة المعالجة الأولية، إن الدقة تكون أفضل من استخدام التكرار لكل الكلمات في النص الطبي بالإضافة إن وقت التنفيذ أقل. أخيراً، وجدنا أداء نظامنا عندما نستخدم مقياس التشابه جيب التمام هو أفضل من أدائه مع استخدام مقياس التشابه للكلمات المشتركة. 
653 |a التشخيص الطبي  |a سجلات المرضى  |a أمراض العيون  |a الوثائق الطبية  |a المعالجة الآلية 
692 |b Data Mining  |b Text Mining  |b Text Categorization "TC"  |b Midline  |b Euclidean Minimum Spanning Tree "EMST"  |b Cosine Similarity  |b Common Word Similarity 
773 |4 التربية والتعليم  |4 العلوم الإنسانية ، متعددة التخصصات  |6 Education & Educational Research  |6 Humanities, Multidisciplinary  |c 015  |e Maisan Journal of Academic Studies  |f Maǧallaẗ Mīsān li-l-dirāsāt al-akādīmiyyaẗ  |l 029  |m مج15, ع29  |o 2333  |s مجلة ميسان للدراسات الأكاديمية  |v 015  |x 1994-697X 
856 |u 2333-015-029-015.pdf 
930 |d y  |p y  |q n 
995 |a HumanIndex 
995 |a EduSearch 
999 |c 1185899  |d 1185899 

عناصر مشابهة