Main Article Content
Abstract
The study aimed to investigate the differential item functioning (DIF) for verbal ability test items in the Gulf Multiple Mental Ability Scale for female students in general and Omani Female students in particular in using Mantel-Haenszel (MH) and the Transformed Item Difficulty (TID) methods. The test consisted of 30 multiple-choice items with four distactors. The study sample consisted of the archive data for 4280 students of the third and fourth grades in GCC countries. The results revealed that Sixty Pecent of the items showed DIF related to gender using MH. Similarly, Sixty Pecent of the items showed DIF related to country using MH. DIF values were small indicating weak DIF in most items. Results also indicated that DIF using TID was found for Thirty percent of the items related to gender, and 33.33% related to country. Furthermore, Kappa coefficient 0.524 was moderate between MH method and TID for gender and the agreement ratio was 70%. Kappa coefficient 0.158 was weak between MH method and TID for country and the agreement ratio was 46.67%. Based on the study results the reseachers recommend invistigating the reasons behind the detected differential functioning of some items in the verbal ability test at the second level of the GMMAS scale to avoid and address it.
Keywords
Article Details
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
References
- أرشيدات، بسام كامل (2007). تحري التحيّز في اختبار مادة التربية الوطنية لدى طلبة جامعة مؤته. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
- البرصان، إسماعيل سلامه (2013). الأداء التفاضلي لمتغير الجنس لفقرات الاختبار الوطني الأردني لضبط نوعية التعليم لمادة الرياضيات للصف العاشر. مجلة كلية التربية بالزقازيق، 79، 229-270.
- البستنجي، محمود محمد (2004). مقارنة أربع طرق للكشف عن الأداء التفاضلي لمتغير الجنس في فقرات اختبار قدرات عقلية خاصة للفئة العمرية 15-16 سنة في الأردن. رسالة دكتوراه غير منشورة. جامعة عمّان العربية، الأردن.
- البشابشة، خالده محمود (2016). الكشف عن الأداء التفاضلي لمتغير الجنس في اختبار PISA الدولي لعام 2012. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
- الجرادات، عبدالله بخيت (2003). مقارنة بين طريقة مانتل هانزل وطريقة الصعوبة المحوّلة في الكشف عن تحيّز الفقرات. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
- حمادنة، إياد محمد (2007). الأداء التفاضلي لمفردات اختبار تحديد الكفاءة اللغوية في اللغة الإنجليزية في الجامعات الأردنية: دراسة مقارنة. رسالة دكتوراه غير منشورة. جامعة اليرموك، الأردن.
- الزيات، فتحي؛ والمحرزي، راشد (2011). مقياس الخليج للقدرات العقلية المتعدد (جماس): التقرير الفني. الرياض: مكتب التربية العربي لدول الخليج.
- الطراونة، محمود زعل (2011). تحري التحيّز في فقرات الاختبار الوطني لطلبة الصف الثامن الأساسي في مادتي العلوم والرياضيات لعام 2010. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
- ظاظا، حيدر إبراهيم (2006). فاعلية طريقة الكشف عن التحيّز في الفقرة المبنية على الإجراءات التحكيمية مقارنة بالطرق التجريبية المبنية على إجراءات النظرية الكلاسيكية في القياس ونظرية الاستجابة للفقرة. رسالة دكتوراه غير منشورة. الجامعة الأردنية، الأردن.
- العجلوني، جهاد؛ والسوالمة، يوسف (2016). فحص الأداء التفاضلي لمموهات فقرات اختبار الرياضيات في التقييم الوطني الأردني لاقتصاد المعرفة وفقًا لجنس الطالب وموقع المدرسة. مجلة العلوم الإنسانية، جامعة النجاح للأبحاث، 30 (11)، 2266-2286.
- عمارة، إيهاب محمد (2008). طرق الكشف عن تحيّز مفردات الاختبار: دراسة سيكومترية مقارنة. رسالة ماجستير غير منشورة. جامعة عين شمس، مصر.
- كروكر، ليندا؛ والجينا، جيمز (2009). مدخل إلى نظرية القياس التقليدية والمعاصرة. ترجمة زينات يوسف دعنا. عمّان: دار الفكر ناشرون وموزعون.
- الكسباني، محمد (2012). البحث التربوي بين النظرية والتطبيق. القاهرة: دار الفكر العربي.
- مبارك، مأمون؛ ومبارك، وائل (2013). الأداء التفاضلي لاختبار الرياضيات في الدراسة الدولية بيزا 2006. مجلة العلوم التربوية، جامعة الملك سعود، 25(2)، 241- 261.
- مبارك، وائل محمد (2010). الأداء التفاضلي لفقرات اختبار العلوم في الدراسة الدولية بيزا 2006. رسالة دكتوراه غير منشورة. جامعة اليرموك. إربد، الأردن.
- الهريشات، محمد (2004). تحري التحيّز في فقرات ACER للتفكير الاستدلالي. رسالة ماجستير غير منشورة. جامعة مؤته. الكرك، الأردن.
- Angoff, W. H. & Ford, S. H. (1971). Item-race interaction on a test of scholastic aptitude. Journal of Educational Measurement, 10 (2), 95-106.
- Camilli, G., & Shepard, L. (1994). Methods for identifying bias test item. Sage publication, USA.
- Dorans, N. J., & Holland, P.W. (1994). DIF detection and description: Mantel-Haenszel and standardization. In P. Holland and H. Wainer (Eds.), Differential item functioning. Hillsdale, NJ: Lawrence erlbaum associates.
- Driana, E. (2007). Gender differential item functioning on aninth – grade Mathematics proficiency test in application OHIO. Unpublished Doctoral Thesis, Ohio University, Proquest information and Learning Company, UM: 3280034.
- Hambleton, R., & Rogers, J. (1995). Item bias review practical assessment, research and evaluation. Retrieved July 31, 2003 from http://edresearch.org/pare/getvn. ASP= 4&n=6.
- Hambleton, R., Swaminithan, H., & Rogers, J. (1991). Fundamentals of item response theory. Sage publications, Newbury perk.
- Kim, S. H. (2000). An investigation of the likelihood ratio test, the mantel test, and the generalized Mantel-Haensel test of DIF. Paper presented at the annual meeting of the American educational research association, New Orleans, Louisiana.
- Mikyung, K. (2001). Detecting DIF across the different language groups in a speaking test. Language Testing, 18 (1), 89-114.
- Nandakumer, R. (1993). A fortran 77 program for detecting DIF through the Mantel-Haensel statistics. Educational and Psychological Measurement, 53 (3), 679-685.
- Osterlind, S. (1983). Test item bias. Beverly Hills: Sage publications.
- Raju, N. S. Drasgow, F. & Slind, J. (1993). An empirical comparison of the area methods, Lord's chi-square test, and the Mental-Haenszel technique for assessing differential item function. Educational and Psychological Measurement, 53 (1), 301-314.
- Stage, C. (2000). Predicting gender differences in word items. A comparison of item response theory and classical test theory. Swedish Council for Research in the Humanities and Social Sciences (HSFR). Retrieved from: https://bit.ly/3eqxJhe.
- Uiterwijk, H., & Vallen, T. (2005). Linguistic sources of item bias for second generation immigrants in Dutch tests. Language Testing, 22 (2), 211-234.
- Wedman, J. (2018). Reasons for gender-related differential item functioning in a college admissions test. Scandinavian Journal of Educational Research, 62 (6), 959-970.
References
أرشيدات، بسام كامل (2007). تحري التحيّز في اختبار مادة التربية الوطنية لدى طلبة جامعة مؤته. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
البرصان، إسماعيل سلامه (2013). الأداء التفاضلي لمتغير الجنس لفقرات الاختبار الوطني الأردني لضبط نوعية التعليم لمادة الرياضيات للصف العاشر. مجلة كلية التربية بالزقازيق، 79، 229-270.
البستنجي، محمود محمد (2004). مقارنة أربع طرق للكشف عن الأداء التفاضلي لمتغير الجنس في فقرات اختبار قدرات عقلية خاصة للفئة العمرية 15-16 سنة في الأردن. رسالة دكتوراه غير منشورة. جامعة عمّان العربية، الأردن.
البشابشة، خالده محمود (2016). الكشف عن الأداء التفاضلي لمتغير الجنس في اختبار PISA الدولي لعام 2012. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
الجرادات، عبدالله بخيت (2003). مقارنة بين طريقة مانتل هانزل وطريقة الصعوبة المحوّلة في الكشف عن تحيّز الفقرات. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
حمادنة، إياد محمد (2007). الأداء التفاضلي لمفردات اختبار تحديد الكفاءة اللغوية في اللغة الإنجليزية في الجامعات الأردنية: دراسة مقارنة. رسالة دكتوراه غير منشورة. جامعة اليرموك، الأردن.
الزيات، فتحي؛ والمحرزي، راشد (2011). مقياس الخليج للقدرات العقلية المتعدد (جماس): التقرير الفني. الرياض: مكتب التربية العربي لدول الخليج.
الطراونة، محمود زعل (2011). تحري التحيّز في فقرات الاختبار الوطني لطلبة الصف الثامن الأساسي في مادتي العلوم والرياضيات لعام 2010. رسالة ماجستير غير منشورة. جامعة مؤته، الأردن.
ظاظا، حيدر إبراهيم (2006). فاعلية طريقة الكشف عن التحيّز في الفقرة المبنية على الإجراءات التحكيمية مقارنة بالطرق التجريبية المبنية على إجراءات النظرية الكلاسيكية في القياس ونظرية الاستجابة للفقرة. رسالة دكتوراه غير منشورة. الجامعة الأردنية، الأردن.
العجلوني، جهاد؛ والسوالمة، يوسف (2016). فحص الأداء التفاضلي لمموهات فقرات اختبار الرياضيات في التقييم الوطني الأردني لاقتصاد المعرفة وفقًا لجنس الطالب وموقع المدرسة. مجلة العلوم الإنسانية، جامعة النجاح للأبحاث، 30 (11)، 2266-2286.
عمارة، إيهاب محمد (2008). طرق الكشف عن تحيّز مفردات الاختبار: دراسة سيكومترية مقارنة. رسالة ماجستير غير منشورة. جامعة عين شمس، مصر.
كروكر، ليندا؛ والجينا، جيمز (2009). مدخل إلى نظرية القياس التقليدية والمعاصرة. ترجمة زينات يوسف دعنا. عمّان: دار الفكر ناشرون وموزعون.
الكسباني، محمد (2012). البحث التربوي بين النظرية والتطبيق. القاهرة: دار الفكر العربي.
مبارك، مأمون؛ ومبارك، وائل (2013). الأداء التفاضلي لاختبار الرياضيات في الدراسة الدولية بيزا 2006. مجلة العلوم التربوية، جامعة الملك سعود، 25(2)، 241- 261.
مبارك، وائل محمد (2010). الأداء التفاضلي لفقرات اختبار العلوم في الدراسة الدولية بيزا 2006. رسالة دكتوراه غير منشورة. جامعة اليرموك. إربد، الأردن.
الهريشات، محمد (2004). تحري التحيّز في فقرات ACER للتفكير الاستدلالي. رسالة ماجستير غير منشورة. جامعة مؤته. الكرك، الأردن.
Angoff, W. H. & Ford, S. H. (1971). Item-race interaction on a test of scholastic aptitude. Journal of Educational Measurement, 10 (2), 95-106.
Camilli, G., & Shepard, L. (1994). Methods for identifying bias test item. Sage publication, USA.
Dorans, N. J., & Holland, P.W. (1994). DIF detection and description: Mantel-Haenszel and standardization. In P. Holland and H. Wainer (Eds.), Differential item functioning. Hillsdale, NJ: Lawrence erlbaum associates.
Driana, E. (2007). Gender differential item functioning on aninth – grade Mathematics proficiency test in application OHIO. Unpublished Doctoral Thesis, Ohio University, Proquest information and Learning Company, UM: 3280034.
Hambleton, R., & Rogers, J. (1995). Item bias review practical assessment, research and evaluation. Retrieved July 31, 2003 from http://edresearch.org/pare/getvn. ASP= 4&n=6.
Hambleton, R., Swaminithan, H., & Rogers, J. (1991). Fundamentals of item response theory. Sage publications, Newbury perk.
Kim, S. H. (2000). An investigation of the likelihood ratio test, the mantel test, and the generalized Mantel-Haensel test of DIF. Paper presented at the annual meeting of the American educational research association, New Orleans, Louisiana.
Mikyung, K. (2001). Detecting DIF across the different language groups in a speaking test. Language Testing, 18 (1), 89-114.
Nandakumer, R. (1993). A fortran 77 program for detecting DIF through the Mantel-Haensel statistics. Educational and Psychological Measurement, 53 (3), 679-685.
Osterlind, S. (1983). Test item bias. Beverly Hills: Sage publications.
Raju, N. S. Drasgow, F. & Slind, J. (1993). An empirical comparison of the area methods, Lord's chi-square test, and the Mental-Haenszel technique for assessing differential item function. Educational and Psychological Measurement, 53 (1), 301-314.
Stage, C. (2000). Predicting gender differences in word items. A comparison of item response theory and classical test theory. Swedish Council for Research in the Humanities and Social Sciences (HSFR). Retrieved from: https://bit.ly/3eqxJhe.
Uiterwijk, H., & Vallen, T. (2005). Linguistic sources of item bias for second generation immigrants in Dutch tests. Language Testing, 22 (2), 211-234.
Wedman, J. (2018). Reasons for gender-related differential item functioning in a college admissions test. Scandinavian Journal of Educational Research, 62 (6), 959-970.