ارسل ملاحظاتك

ارسل ملاحظاتك لنا







مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الأبعاد باستعمال المحاكاة

العنوان بلغة أخرى: A Comparison between some Methods of Estimating the Sample Size to Estimate the Parameters of the Classification Model in the Case of High-Dimensional Data Using Simulations
المصدر: مجلة تكريت للعلوم الإدارية والاقتصادية
الناشر: جامعة تكريت - كلية الإدارة والاقتصاد
المؤلف الرئيسي: جاسم، بلاسم سعدون (مؤلف)
مؤلفين آخرين: العزاوى، دجلة إبراهيم مهدى (م. مشارك)
المجلد/العدد: مج16, ع50
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2020
الصفحات: 316 - 328
ISSN: 1813-1719
رقم MD: 1204789
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: EcoLink
مواضيع:
كلمات المؤلف المفتاحية:
متباينة بونفروني | الشبكة العصبية الاصطناعية | متباينة بيرشتاين | متوسط أكبر خطأ مطلق | Bonferroni Inequality | Artificial Neural Network | Bernstein's Inequality | Mean Maximum Absolute Error
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: In this research, several methods were used to determine the optimum sample size to estimate the parameters of high-dimensional data (HDD). Where the number of explanatory variables is greater than the sample size (P> n). These methods are the Bonferroni inequality method a special case of normal approximation and the Bernstein’s inequality method. The non-linear logistic regression model is estimated in the sample size of each method in the case of high-dimensional data using the artificial intelligence method, which is the artificial neural network method (ANN), as it gives a high-precision estimate commensurate with the data type and type of medical study. The probabilistic values obtained from the artificial neural network are used in the calculation of the net reclassification index. A program was written for this purpose using the statistical programming language (R) where the mean maximum absolute error criterion (MME) of the net reclassification network index (NRI) was used to compare the methods of specifying the sample size and the presence of a number of different default parameters under the given margin of error value (ε). To verify the performance of the methods using the comparison criteria above where the most important conclusions were that the Bernstein’s inequality method is the better in determining the optimal sample size according to the number of default parameters and the error margin value.

تم في هذا البحث استعمال عدة طرائق لتحديد حجم العينة الأمثل لتقدير معالم البيانات ذات الأبعاد العالية (High dimensional: HDD) التي يكون فيها عدد المتغيرات التوضيحية أكبر من حجم العينة (p>n) وهذه الطرائق هي طريقة متباينة بونفروني وهي حالة خاصة من التقريب الطبيعي وطريقة متباينة بيرشتاين. يتم تقدير أنموذج الانحدار اللوجستي الثنائي اللاخطي بحجم عينة كل طريقة في حالة بيانات عالية الأبعاد باستعمال طريقة الذكاء الاصطناعي وهي طريقة الشبكة العصبية الاصطناعية (ANN) كونها تعطي تقدير عالي الدقة بما يتناسب مع نوع البيانات ونوع الدراسة الطبية. يتم توظيف القيم الاحتمالية التي تم الحصول عليها من الشبكة العصبية الاصطناعية في حساب مؤشر إعادة التصنيف الصافي (NRI)، تم كتابة برنامج لهذا الغرض باستعماله لغة البرمجة الإحصائية (R) حيث تم الاعتماد على معيار متوسط أكبر خطا مطلق (MME) لمؤشر شبكة إعادة التصنيف الصافي (NRI) للمقارنة بين طرائق تحديد حجم العينة وبوجود عدد المعلمات الافتراضية مختلفة في ظل قيمة هامش خطا معين (ε). للتحقق من أداء الطرائق باستعمال معايير المقارنة أعلاه حيث كانت اهم الاستنتاجات هي أن طريقة متباينة بيرشتاين هي الأفضل في تحديد حجم العينة الأمثل باختلاف عدد المعلمات الافتراضية وقيمة هامش الخطأ.

ISSN: 1813-1719