المستخلص: |
هدفت هذه الدراسة إلى الكشف عن أثر أداء الفقرات التفاضلي للجنس على دقة المعادلة العمودية للاختبار، ولهذه الغاية تم استخدام اختبار اوتيس لينون للقدرة العقلية بمستوييه المتوسط والمتقدم الصورة "K" والمعدلتين للبيئة الأردنية. وقد بلغ عدد أفراد مجتمع الدراسة (9298) طالباً وطالبة. وتألفت عينة الدراسة من (1001) طالب وطالبة مقسمين إلى (500) في مستوى القدرة المتوسط و(501) في مستوى القدرة المتقدم للعام الدراسي 2010/ 2011. تم استخدام تصميم الفقرات المشتركة والمجموعات غير المتكافئة لجميع البيانات، وتضمن كل من الاختبارين فقرات مشتركة بينهما بلغ عدد (23) فقرة مشتركة، تم استخدام طريقة مانتل هانزل للكشف عن الفقرات ذات الأداء التفاضلي تبعاً لمتغير الجنس في كل مستوى من مستويات الاختبار بشكل منفصل، وبعد ذلك تم إجراء المعادلة العمودية باستخدام برمجية BILOG- MG وفقاً للنموذج أحادي المعلمة في نماذج نظرية استجابة الفقرة بعد التحقق من افتراضات هذا النموذج ومطابقة البيانات له، وأجريت المعادلة العمودية بين مستويي الاختبار المتوسط والمتقدم مرتين: المرة الأولى في ظل الاحتفاظ بالفقرات ذات الأداء التفاضلي للجنس، والمرة الثانية في ظل حذف الفقرات ذات الأداء التفاضلي للجنس. ولتحقيق المقارنة بين عمليتي المعادلة تم استخدام معامل الصدق التقاطعي (Cross- Validation) معياراً لمدى استقرار النتائج لدرجات القدرة المعادلة ومؤشراً على فعّالية المعادلة. أشارت النتائج إلى وجود أثر للأداء التفاضلي على دقة المعادلة العمودية، فإجراء المعادلة في ظل حذف الفقرات ذات الأداء التفاضلي زاد من دقة المعادلة العمودية بالاستناد إلى قيم معاملات الصدق التقاطعي.
This study aimed to investigate the effect of differential items functioning (DIF) du to gender on the accuracy of Test Vertical Equating. The Population of the study consisted of the students of (9298) students, the sample consisted of (1001 students (500) of intermediate level and (501) of advance level of ability. Mantel – Haenzel procedure used for determined the DIF items vertical equating of two test levels conducted using common items — non equivalent groups design by using BILOG- MG Program according to item response one parameter model. Vertical equating of two test level conducted in two cases; first: when the DIF items included in two test levels and second when DIF items excluded from two test levels. Ability scores used for equating. For the purpose of comparing the two equating cases cross — validation coefficient was used as a criterion for studying the extent of stability of the results for equated scores and as the accuracy index of vertical equating. The results indicated that the DIF items affect the accuracy of equating, so that, when DIF items excluded from two test forms to be equated, the accuracy of equating increased depending on cross — validation coefficient
|