


Gender Differential Item Functioning in a Science Periodical Test of Eighth Graders




蕭偉智(Wei-Chih Hsiao);傅家珍(Chia-Chen Fu)


自然科成就性別差異 ; 自然科性別DIF ; 學校定期評量 ; gender differences in science achievement ; science gender DIF ; science periodical test




29卷2期(2012 / 12 / 01)


35 - 64




本研究旨在探究國中八年級學生學校自然科定期評量之性別成就差異和差別試題功能(Differential Item Functioning, DIF)。研究資料係新北市某公立國中八年級382名學生(男性191名、女性191名)之答題反應,研究先以性別效果量、女/男標準差比值與女/男人數比值三項指標分析性別成就差異,再用IRT Rasch Model與Mantel-Haenszel法分析性別DIF現象。研究發現如下:1. 未配組的性別成就差異部分,全體受試並無顯著性別成就差異現象,而在高成就組(前10%)和低成就組(後10%)中,男性表現略高於女性;2. 將男女能力配組後,取IRT Rasch與Mantel-Haenszel結果交集,顯示自然科定期評量嚴重DIF的出現率為4%且皆有利女性。筆者對DIF試題的內容進行進一步審視,試題特徵似乎與性別DIF有關聯,初步推論試題的試題附圖的提供是否可能影響DIF方向,但仍需更多實徵資料驗證。整體而論,本研究並未發現和測驗目標無關的因素,尚不構成試題偏誤。最後,本研究依據研究結果,對自然科測驗命題與未來研究提出建議。


This study investigates gender differences and differential item functioning (DIF) in a science periodical test of eighth graders. we selected 382 students (191 boys and 191 girls) from a junior high school in New Taipei City. we calculated and compared the effect size, female/male standard deviation ratio, and female/male ratio. In addition, we used the IRT Rasch model and the Mantel-Haenszel procedure for gender DIF. The results of this study are as follows: (a) in unmatched analysis, no gender differences were observed among all groups; however, boys exhibited slightly better performance to girls among both high-achieving groups (top 10%) and low-achieving groups (bottom 10%); (b) in matched analysis, the intersection of the results using the IRT Rasch model and the Mantel-Haenszel procedure showed that the average percentage of items displaying gender DIF across administrations was low, at approximately 4% (in favor of girls). The follow-up review of these DIF items indicated associations of gender DIF with item characteristics. Furthermore, charts may affect the DIF direction. Finally, this study provides suggestions for items construction and future studies on science.

主题分类 社會科學 > 教育學
  1. 余民寧、謝進昌(2006)。國中基本學力測驗之DIF的實徵分析:以91年度兩次測驗為例。教育學刊,26,241-276。
  2. 盧雪梅、毛國楠(2008)。國中基本學力測驗自然科之性別差異和差別試題功能(DIF)分析。教育實踐與研究,21(2),95-126。
  3. 盧雪梅、毛國楠(2008)。國中基本學力測驗自然科之性別差異和差別試題功能(DIF)分析。測驗學刊,55(4),725-759。
  4. Chien (2006)。以Rasch分析協助測驗同分時之測量研究。取自http://raschsmile.blogspot.com/2006_09_01_archive.html
  5. 擴大高中職及五專免試入學實施方案 (2009年9月4日)。
  6. 建北至少400分全國基測龍頭校最低404分 (2011年5月23日)。中國時報電子報。取自 http://life.chinatimes.com/life/100316/112011052300069.html
  7. 基北區100學年度高中職免試入學簡章彙編 (2011年2月8日)。
  8. Cohen, J.(1988).Statistical power analysis for the behavioral science.Hillsdale, NJ:Lawrence Erlbaum.
  9. Holland, P. W.(Ed.),Wainer, H.(Ed.)(1993).Differential item functioning.Hillsdale, NJ:Lawrence Erlbaum.
  10. Linacre, J. M.,Wright, B. D.(1994).Reasonable mean-square fit values.Rasch Measurement Transactions,8(3),370.
  11. Lord, F. M.(1980).Applications of Item Response Theory to Practical of Testing Problems.Hillsdale, NJ:Lawrence Erlbaum.
  12. Rasch, G.(1960).Probabilistic Models for Some Intelligence and Attainment Tests.Copenhagen, Denmark:Danish Institute for Educational Research.
  13. Reckase, M. D.(1979).Unifactor Latent Trait Models Applied to Multifactor Tests: Results and Implications.Journal of Educational Statistics,4,207-230.
  14. Simpson, E. H.(1951).The interpretation of interaction in contingency tables.Journal of the Royal Statistical Society,13(2),238-241.
  15. Wainer, H.(Ed.),Braun, H. I.(Ed.)(1988).Test validity.Hillsdale, NJ:Lawrence Erlbaum Associates.
  16. Wang, C.(1995).University of Illinois at Urbana-Champaign.
  17. Willingham, W. W.(Ed.),Cole, N. S.(Ed.)(1997).Gender and fair assessment.Hillsdale, NJ:Lawrence Erlbaum.
  18. Wu, M. L.,Adams, R. J.,Wilson, M.(1998).ACER ConQuest user guide.Hawthorn, Australia:ACER Press.
  19. 王文中(2004)。Rasch測量理論與其在教育和心理之應用。教育與心理研究,27(4),637-694。
  20. 王文中、陳雪珠(1999)。教學觀點量表之發展與試題反應分析。應用心理研究,2,181-207。
  21. 吳裕益、洪碧霞、徐綺穗、葉千綺(1993)。臺灣省教育廳專案研究報告臺灣省教育廳專案研究報告,未出版
  22. 林奕宏、林世華(2004)。國小高年級數學科成就測驗中與性別有關的DIF現象。臺東大學教育學報,15(1),67-96。
  23. 國中生基本學力測驗工作推動小組(2002)。國中基本學力測驗自然科試題之設計理念。飛揚,13
  24. 國立臺灣師範大學心理與教育測驗研究發展中心(2008)。「二○○八年國中基測研發成果」媒體交流茶會。飛揚,55,2-8。
  25. 康軒文教(2011)。自然與生活科技二下。新北:康軒出版社。
  26. 張秋男編(2005)。國際數學與科學教育成就趨勢調查2003。臺北:國立臺灣師範大學科學教育中心。
  27. 陳怡琴(2009)。碩士論文(碩士論文)。屏東,國立屏東教育大學。
  1. 陳承德、孫國瑋、施慶麟(2018)。DIF成因之初探:試題特徵與差異試題功能之關聯。教育心理學報,50(2),167-188。
  2. 鄧鈞文,陳俊瑋,林仁傑(2019)。數學成就測驗的性別差異試題功能(DIF)現象:以臺灣學生學習成就評量資料為例。教育科學期刊,18(1),71-91。
  3. 廖彥棻(2015)。英文學科能力測驗選擇題之性別差異與差異試題功能分析。東吳外語學報,41,21-59。