


An Empirical Analysis of DIF on Basic Competence Test: A Case Example of 2002 BCT




余民寧(Min-Ning Yu);謝進昌(Jin-Chang Hsieh)


ETS DIF分類系統 ; M-H法 ; 差異試題功能 ; 國中基本學力測驗 ; Basic Competence Test ; differential item functioning ; ETS DIF classification rules ; Mantel-Haenszel method




26期(2006 / 06 / 01)


241 - 275




本研究主要目的為探討國中基本學力測驗不同考區間存在的DIF現況,以91年度兩次測驗之實徵資料為例,採M-H法進行試題的檢定,同時搭配ETS DIF分類系統,針對DIF試題進行分類,欲呈現一客觀及多角度的DIF檢定報告。 研究結果如下: 一、不同考區間DIF檢定情況,大致可獲得滿意的結果,其中以第二比較組(基隆與嘉義)DIF情況較嚴重;科目間,以社會科第一次測驗DIF整體現象最高。 二、91年國中基測中仍存有少數偏高DIF比率的科目,且多數存在著一致性的有利或不利於某考區的現象。 三、採M-H法進行DIF檢定時,同時搭配ETS DIF分類系統,較不受樣本因素影響,可得到一客觀、可信的DIF指標。 最後根據研究結果,於文後提出相關建議與省思供讀者參考。


The purpose of this study is to investigate the phenomena of DIF on Basic Competence Test (BCT) among different exam-areas. We tried to use Mante-Haenszel method and ETS DIF classification rules to analyze the actual data of 2002 BCT two tests to present an objective and multidimensional DIF report. The conclusions are as follows: 1. The condition of DIF among different exam-areas may come to a satisfying result. Among exam-areas, the second comparison group (Keelung vs. Chiayi) exhibits the highest level of DIF; among exam-courses, the first social exam-course test exhibits the highest level of DIF. 2. There are still a few exam-courses having higher DIF ratio on 2002 BCT and mostly tending to favor or disfavor some exam-areas. 3. The use of M-H method along with ETS DIF classification rules may efficiently exclude the impact of sample sizes and obtain an objective-and-trustworthy DIF evidence. Finally, some suggestions and reflections for future studies are proposed.

主题分类 社會科學 > 教育學
  1. 盧雪梅(2000)。Mantel-Haenszel DIF程序之第一類型錯誤率和DIF嚴重度分類結果研究。測驗年刊,47(1),57-71。
  2. Birch, M. W.(1964).The detection of partial association: The 2*2 case.Journal of the Royal Statistical Society,Ser. B(26),313-324.
  3. Camilli, G.,Shepard, L. A.(1994).Methods for identifying biased test items.Thousand Oaks, CA:Sage.
  4. Cardall, C.,Coffman, W. E.(1964).A method for comparing the performance of different groups on the item in a test (College Entrance Examination Board Research and Development Report 64-5, No.9; ETS Research Bulletin 64-61).Princeton, NJ:Educational Testing Service.
  5. Clauser, B.,Mazor, K.,Hambleton, R. K.(1994).The effects of score group width on the Mantel-Haenszel procedure.Journal of Educational Measurement,31(1),67-78.
  6. Cox, D. R.(1970).Analysis of binary data.London:Mdthuen and Co.
  7. Dorans, N. J.,Holland, P. W.,H. Wainer (Eds.)(1993).Differential item functioning.Hillsdale, NJ:Lawrence Erlbaum Associates.
  8. Dorans, N. J.,Kulick, E.(1986).Demonstrating the utility of the standardization approach to assessing unexpected differential item performance on the Scholastic Aptitude Test.Journal of Educational Measurement,23,355-368.
  9. Fidalgo, A. M.,Mellenbergh, G. J.,Muniz, J.(2000).Effects of amount of DIF, test length, and purification type on robustness and power of Mantel-Haenszel procedures.Methods of Psychological Research,5(3),43-53.
  10. Holland, P. W.,Thayer, D. T.,H. Wainer,H. I. Braun (Eds.)(1988).Test Validity.Hillsdale NJ:Lawrence Erlbaum Associates.
  11. Landis, R. J.,Heyman, E. R.,Kock, G. G.(1978).Average partial association in three-way contingency tables: A review and discussion of alternative tests.International Statistical Review,46,237-254.
  12. Lehman, J. D.(1986).Los Angles,University of California.
  13. Linn, R. L.,Harnisch, D. L.(1981).Interaction between item content and group membership on achievement test items.Journal of Educational Measurement,18(2),109-118.
  14. Lord, F. M.(1980).Application of item response theory to practical testing problems.Hillsdale, NJ:Lawrence Erlbaum Associates.
  15. Mantel, N.,Haenszel, W. M.(1959).Statistical aspects of the analysis of data from respective studies of disease.Journal of the National Cancer Institute,22,719-748.
  16. Narayanan, P.,Swaminathan, H.(1994).Performance of the Mantel-Haenszel and simultaneous item bias procedures for detecting differential item functioning.Applied Psychological Measurement,18,315-328.
  17. Narayanan, P.,Swaminathan, H.(1996).Identification of items that show nonuniform DIF.Applied Psychological Measurement,20,257-274.
  18. Raju, N. S.(1990).Determining the significance of estimated sign and unsigned areas between two item response functions.Applied Psychological Measurement,14,197-207.
  19. Roussos, L.,Stout, W.(1996).Simulation studies of effects of small sample size and studied item parameters on SIBTEST and Mantel-Haenszel Type Ⅰ error performance.Journal of Educational Measurement,33,215-230.
  20. Schmitt, A. P.,Dorans, N. J.(1990).Differential item functioning for minority examinees on the SAT.Journal of Educational Measurement,27(1),67-81.
  21. Shealy, R.,Stout, W.(1993).A model-based standardization approach that separates true bias/DIF from group ability differences and detects test bias/DTF as well as bias/DIF.Psychometrika,58,159-194.
  22. Swaminathan, H.,Rogers, H. J.(1990).Detecting differential functioning using logistic regression procedures.Journal of Educational Measurement,27,361-370.
  23. Zenisky, A. L.,Hambleton, R. K.(2003).Detection of differential item functioning in large-scale state assessments: A study evaluating a two-stage approach.Educational and Psychological Measurement,63(1),51-64.
  24. 王振世(1997)。不同計分方式對DIF呈現的影響。第三屆兩岸心理與教育測驗學術研討會
  25. 行政院主計處(1983)。中華民國統計地區標準分類。台北市:行政院主計處。
  26. 余民寧(1993)。試題反應理論的介紹(13)-試題偏差的診斷。研習資訊,10(6),7-11。
  27. 林坤昌(1998)。台中市,國立台中教育大學國民教育研究所。
  28. 張麗麗(1995)。行政院國家科學委員會報告。屏東市:國立屏東教育大學。
  29. 陳明終(1996)。台北市,國立台灣師範大學教育心理與輔導研究所。
  30. 葉雅俐(2000)。嘉義縣,國立中正大學心理學研究所。
  31. 戴麗紅(1994)。台北市,國立台灣師範大學教育心理與輔導研究所。
  32. 簡茂發、劉湘川、許天維、郭伯臣、殷志文(1995)。以Mantel-Haenszel法檢定試題區別功能之相關因素探討。測驗年刊,42,85-102。
  33. 蘇雅蕙(2001)。嘉義縣,國立中正大學心理學研究所。
  34. 蘇雅蕙、王文中(2001)。三種Mantel-Haenszel DIF檢驗程序的效果。第五屆華人社會心理與教育測驗學術研討會
  1. 鄧鈞文,陳俊瑋,林仁傑(2019)。數學成就測驗的性別差異試題功能(DIF)現象:以臺灣學生學習成就評量資料為例。教育科學期刊,18(1),71-91。
  2. 侯雅齡(2013)。高級中學自然科學術性向測驗編製。科學教育學刊,21(2),189-213。
  3. 賴姿伶、余民寧(2015)。應徵者與在職者在多分題人格測驗的作答差異之研究:試題層次與試題組合層次的分析。人力資源管理學報,15(4),91-120。
  4. 廖彥棻(2015)。英文學科能力測驗選擇題之性別差異與差異試題功能分析。東吳外語學報,41,21-59。
  5. 盧雪梅(2009)。國中基本學力測驗社會科之性別差異和差別試題功能(DIF)分析。臺東大學教育學報,20(2),31-61。
  6. 盧雪梅、毛國楠(2008)。國中基本學力測驗數學科之性別差異與差別試題功能(DIF)分析。教育實踐與研究,21(2),95-125。
  7. 盧雪梅、毛國楠(2008)。國中基本學力測驗自然科之性別差異和差別試題功能(DIF)分析。測驗學刊,55(4),725-759。
  8. 蕭偉智、傅家珍(2012)。國中八年級自然科定期評量之性別差別試題功能(DIF)分析。新竹教育大學教育學報,29(2),35-64。
  9. 謝進昌、餘民寧(2005)。以最大測驗訊息量決定通過分數之研究。測驗學刊,52(2),149-175。
  10. 張萬烽、吳裕益(2012)。學習障礙學生在國中基測數學科上表現與試題差異功能分析。特殊教育與復健學報,26,45-70。
  11. (2007)。國民中學學生基本學力測驗國文科和英語科成就性別差異和性別差別試題功能(DIF)分析。教育研究與發展期刊,3(4),79-111。