العنوان بلغة أخرى: |
Theory-Based Model Validation in the Generalized Multifactor Dimensionality Reduction Algorithm for Ordinal Phenotypes |
---|---|
المصدر: | المجلة العراقية للعلوم الإحصائية |
الناشر: | جامعة الموصل - كلية علوم الحاسوب والرياضيات |
المؤلف الرئيسي: | عثمان، محمد إبراهيم (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Othman, Mohammed Ibraheem |
مؤلفين آخرين: | الخالدى، زيد طارق صالح عباوى (م. مشارك) |
المجلد/العدد: | مج20, ع2 |
محكمة: | نعم |
الدولة: |
العراق |
التاريخ الميلادي: |
2023
|
الشهر: | ديسمبر |
الصفحات: | 212 - 224 |
ISSN: |
1680-855X |
رقم MD: | 1445537 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | EcoLink |
مواضيع: | |
كلمات المؤلف المفتاحية: |
خوارزمية تخفيض الأبعاد | الانحدار اللوجستي الترتيبي | التداخلات الجينية | الأنماط الظاهرية | Dimensionality Reduction Algorithm | Ordinal Logistic Regression | Genetic Interactions | Phenotypes
|
رابط المحتوى: |
الناشر لهذه المادة لم يسمح بإتاحتها. |
LEADER | 07687nam a22002417a 4500 | ||
---|---|---|---|
001 | 2191498 | ||
041 | |a ara | ||
044 | |b العراق | ||
100 | |9 766182 |a عثمان، محمد إبراهيم |e مؤلف |g Othman, Mohammed Ibraheem | ||
245 | |a التحقيق النظري للنماذج في خوارزمية تخفيض الأبعاد متعددة العوامل المعممة للأنماط الظاهرية الترتيبية | ||
246 | |a Theory-Based Model Validation in the Generalized Multifactor Dimensionality Reduction Algorithm for Ordinal Phenotypes | ||
260 | |b جامعة الموصل - كلية علوم الحاسوب والرياضيات |c 2023 |g ديسمبر | ||
300 | |a 212 - 224 | ||
336 | |a بحوث ومقالات |b Article | ||
520 | |a تشير الدراسات السريرية إلى العلاقة الوثيقة بين بعض الأمراض ووجود تداخلات محددة بين العوامل الجينية وكما هو الحال في كثير من الدراسات، فإن كشف التداخلات الجينية ذات التأثير الكبير على ظهور الأمراض الوراثية يحتاج إلى تحليلات إحصائية مستفيضة. وبسبب الحجم الهائل للبيانات الجينية في الجنس البشري، فكان لا بد من تطوير طرق إحصائية مكيفة للتعامل مع البيانات الأبعاد العالية. تعد خوارزمية تخفيض الأبعاد متعددة العوامل Multifactor Dimensionality Reduction (MDR) أحد الخوارزميات اللامعلمية الرائدة في هذا المجال. حيث تعمل الخوارزمية على تخفيض أبعاد البيانات الجينية للحصول على أهم تداخل ذات تأثير مباشر على زيادة احتمالية ظهور الأمراض الوراثية. وتعتمد الخوارزمية في تكوينها على مجموعة من الإجراءات اللامعلمية لتشخيص التداخل الجيني الأعلى تأثيرا على متغيرات الاستجابة الثنائية حصرا. وكأي طريقة إحصائية، فإن هذه الخوارزمية لا تخلو من نقاط الضعف والمحددات التطبيقية، لذا كان لا بد من تطوير الخوارزمية لتجاوز المعوقات. أحد نقاط الضعف في هذه الخوارزمية هي عدم إمكانية الخوارزمية من التعامل مع البيانات التي تحتوي على متغير استجابة من النوع الترتيبي. طور بعض الباحثين تعميما لخوارزمية تخفيض الأبعاد متعددة العوامل لتمكينها من العامل مع البيانات الترتيبي. مع ذلك فإن الخوارزمية المعممة أكثر تعقيدا من الخوارزمية الأصلية. لذلك اقترحنا تطوير الخوارزمية المعممة تطويرا بسيطا وذلك بتوظيف الانحدار اللوجستي الترتيبي في تصنيف الأفراد في العينة، مع الإبقاء على جميع خطوات الخوارزمية الأصلية دون تغيير. ومن ناحية أخرى، فإن خوارزمية MDR تعتمد أسلوبا لا معلميا للتحقق من معنوية التداخلات المرشحة في الخوارزمية. وينبني هذا الإجراء اللامعلمي على فكرة الاختبارات التبادلية، وهو يستهلك وقتا زمنيا طويلا جدا مقارنة بالإجراءات المعلمية المعتمدة على الأساليب النظرية. اقترح بعض الباحثين استخدام توزيع القيمة المتطرفة المعمم للتحقق من المعنوية الإحصائية للتداخلات المرشحة، لكن لم يرد استخدام هذا الأسلوب إلا مع المتغيرات المعتمدة المستمرة والثنائية. تم في هذا البحث توظيف الأسلوب النظري المعتمد على توزيع القيمة المتطرفة المعمم بدلا من الاختبارات التبادلية المعتمدة في الخوارزمية وذلك عندما يكون متغير الاستجابة من النوع الترتيبي. |b Clinical studies indicate a close relationship between some diseases and the presence of specific interactions between genetic factors. As is the case in many studies, revealing genetic interactions that have a significant impact on the emergence of genetic diseases requires extensive statistical analyses. Because of the enormous volume of genetic data in the human race, it was necessary to develop statistical methods adapted to deal with high-dimensional data. Multifactor Dimensionality Reduction (MDR) is one of the leading nonparametric algorithms in this field. The algorithm reduces the dimensions of genetic data to obtain the most important interaction that has a direct impact on increasing the likelihood of genetic diseases appearing. In its composition, the algorithm relies on a set of nonparametric procedures to diagnose genetic interference with the highest impact exclusively on binary response variables. Like any statistical method, this algorithm is not devoid of weaknesses and application limitations, so the algorithm had to be developed to overcome the obstacles. One of the weaknesses of this algorithm is that the algorithm cannot handle data sets with ordinal response variable. Some researchers have developed a generalization of the multifactor dimensionality reduction algorithm to enable it to work with ordinal data. However, the generalized algorithm is more complex than the original algorithm. Therefore, we proposed developing the original algorithm in a simple way by employing ordinal logistic regression to classify individuals in the sample, while keeping all steps of the original algorithm unchanged. On the other hand, the MDR algorithm adopts a non-parametric method to verify the significance of the interferences nominated in the algorithm. This nonparametric procedure is based on the idea of permutational tests, and it consumes a very long time compared to parametric procedures that relies on theoretical approaches. Some researchers have suggested using the generalized extreme value distribution to verify the statistical significance of candidate interactions, but this method has only been used with continuous and binary dependent variables. In this research, the theoretical method based on the generalized extreme value distribution was employed instead of the permutational tests adopted in the algorithm when the response variable is of the ordinal type. | ||
653 | |a الأمراض الوراثية |a العوامل الجينية |a الخوارزميات الإحصائية | ||
692 | |a خوارزمية تخفيض الأبعاد |a الانحدار اللوجستي الترتيبي |a التداخلات الجينية |a الأنماط الظاهرية |b Dimensionality Reduction Algorithm |b Ordinal Logistic Regression |b Genetic Interactions |b Phenotypes | ||
700 | |9 100854 |a الخالدى، زيد طارق صالح عباوى |e م. مشارك |g Al-Khaledi, Zaid Tariq Saleh | ||
773 | |4 الاقتصاد |6 Economics |c 017 |e Iraqi Journal of Statistical Science |f Al-maǧallaẗ al-ʻirāqiyyaẗ li-l-ʻulūm al-iḥsāʼiyyaẗ |l 002 |m مج20, ع2 |o 1147 |s المجلة العراقية للعلوم الإحصائية |v 020 |x 1680-855X | ||
856 | |u 1147-020-002-017.pdf | ||
930 | |d n |p y |q n | ||
995 | |a EcoLink | ||
999 | |c 1445537 |d 1445537 |