المستخلص: |
تهدف هذه الدراسة التحقق من درجة توافق دلالات صدق وثبات الاختبارات المقننة المستخدمة في رسائل الماجستير مع دلالات صورها في البيئة الأصلية، ولتحقيق غرض الدراسة تمت مراجعة (27)رسالة ماجستير أجريت في الفترة 1980- 2006م. أظهرت النتائج وجود اتفاق بين الباحثين في الإجراءات المتبعة لتقنين الاختبارات للبيئة الجديدة بلغت (97%). كما تبين أن أكثر دلالات الصدق استخداماً في البيئتين: صدق المحك التلازمي، والارتباطات بين الفقرات أو الأبعاد. في حين كانت أكثر دلالات الثبات استخداماً في البيئتين: معادلة كرونباخ ألفا (α)، وطريقة الإعادة على الترتيب. وأظهرت النتائج وجود فرق ذو دلالة إحصائية عند (α 0.05 ≥) في تكرار استخدام صدق المحكمين بين البيئتين ولصالح البيئة الجديدة، وفي تكرار استخدام صدق المحك التنبؤي واستخدام صدق المحتوى بين البيئتين، ولصالح البيئة الأصلية. أما فيما يتعلق بالثبات فلم تظهر النتائج فروق ذات دلالة إحصائية في تكرار استخدام جميع دلالات الثبات بين البيئتين. كذلك أظهرت نتائج مربع كاي (2χ) وجود توافق في استخدام دلالات الصدق والثبات في البيئتين؛ إلا أن هذا التوافق كان ضعيفاً حسب معيار كوهن. وفي ضوء ذلك أوصت الدراسة ضرورة إجراء الترجمة العكسية من قبل متخصصين بمجال الاختبار واللغة التي كُتب فيها الاختبار في بيئته الأصلية ولغة البيئة الجديدة، وذكر قيم وأنواع دلالات ثبات وصدق الاختبارات عند تقنينها لبيئات أو ثقافات جديدة.
This study aims at verifying the degree of agreement validity and reliability Indices of standardized tests used in the theses with Indices of the original Versions. To achieve the purpose of the study, (27) theses were reviewed conducted in the period 1980-2006 AD and. The results showed an agreement between the researchers in the procedures to standardize the tests to a new environment amounted (97%). The findings also revealed that most indications of validity used in both environments were concurrent validity and correlations between items or dimensions, whereas most indications of reliability used were: cronbach's Alpha (a) and test-retest, respectively. Farther Findings revealed that there is significant difference at (a < 0.05) in using frequency judges' validity in both environments in favor of the original environment, and in using frequency concurrent validity and content validity in both environments in favor for original environment. In the contrast, the significance of reliability did not show statistically significant differences in the repeated use of all the indications of reliability in both environments. Finally, the findings of (/2) indicated that are consensus in the use of indications of validity and reliability in both environments, but it was weak as standard Cohen's. The study recommended the need for a back translation by specialists in area testing and language of the test in their environment of origin and the language of the new environment, and stated values of indications of reliability and validity tests when standardize to new environments or cultures.
|