


An Alternative Method for Representing Scaled Scores of the Basic Competency Test for Junior High School Students




汪慧瑜(Hui-Yu Wang);余民寧(Min-Ning Yu)


基本學力測驗 ; 試題反應理論 ; 量尺分數 ; basic competency test ; item response theory ; scaled scores




53卷2期(2006 / 12 / 01)


205 - 237




本研究的目的在以試題反應理論為基礎,建立另一種量尺分數的計算和呈現方式,希望能夠兼顧學理的嚴謹性和使用上的方便和易懂,使基本學力測驗結果的表達方式更為合理和公平。 本研究採用BILOG-MG軟體程式的3-Parameter Logistic Model為依據,使用貝氏估計法來估算考生的能力估計值θ,再將能力估計值轉換為以平均值30,標準差為7.75的量尺化能力值。分析結果顯示,答對相同題數的考生,其量尺化能力值有差異,此差異的大小會隨著答對題數的多寡不同,而呈現不同的分佈情況。一般而言,答對相同題數的數量約在中間至偏低比例的考生,其所對應的量尺化能力值高低差距較大,而答對相同題數的數量約在兩極端的考生,其所對應的量尺化能力值高低差距較小;在不同科目中,量尺化能力值差距的最大值分別為:國文科差距10.37分、英語科差距10.72分、數學科差距11.30分、社會科差距13.00分、而自然科差距11.61分。當五個科目的量尺化能力值(或量尺分數)加總成為考生的得分時,這樣的量尺化能力值差距將更為明顯,這對考生在選擇申請入學或分發入學高中職校上,將產生相當大的影響,這亦顯示出現行量尺分數計分方式的公平性問題頗值得重視。最後,本研究根據結論提出具體建議,以供實務應用之參考。


This study aimed to develop an alternative scaled score method, based on Item Response Theory, to report the results of the student basic competence tests in a more reasonable way. The scaled score method designed by the present study is characterized not only by its theoretical basis but also by the ease of use and understanding. This study employed the BILOG-MG software system with 3-ParmeterLogistic Model and Bayesian EAP method to estimate student ability value θ s. The value θ s were in turn transformed into scaled scores with a mean of 30 and standard deviation of 7.75. Different scaled scores were found among the students who had the same number of correct items on the tests. The range of the scaled score difference was related to the number of correct items on the tests. In general, in the cases that the students' numbers of correct items were between medium and slightly below medium, the differences of the corresponding scaled scores tended to span a wider range. The scaled scores also differed in subject areas. The widest range of the difference shown within each subject area is presented respectively as follows: Chinese with 10.37 points, English with 10.72 points, math with 11.30 points, social science with 13.00 points, and science with 11.61 points. Subsequently, totaling the scaled scores of the five subjects made the differences even greater among the students who had the same number of correct items, which has a profound influence on students' chance of entering high schools. It is therefore justified that the fairness of the scaled score system currently used should be taken into serious consideration. Finally, some suggestions were proposed on the basis of the discussions provided in this study for future applications.

主题分类 社會科學 > 心理學
社會科學 > 教育學
  1. 徐柏原(2005)。如何將原始分數轉換成量尺分數-以國中基本測驗為例。測驗學刊,52(2),1-28。
  2. 謝進昌、余民寧(2005)。以最大測驗訊息量決定通過分數之研究。測驗學刊,52(2),149-176。
  3. Andersen, E. B.(1972).The numerical solution of a set of conditional estimation equations.The Journal of the Royal Statistical Society, Series B,34,42-54.
  4. Birnbaum, A.,F. M. Lord,M. R. Novick(1968).Statistical theories of mental test scores.Reading MA:Addison-Wesley.
  5. Bock, R. D.,Aitkin, M.(1981).Marginal maximum lidelihood estimation of item parameters: An application of an EM algorithm.Psychometrika,46,443-459.
  6. Guion, R. M.,Ironson, G. H.(1983).Latent trait theory for organizational research.Organizational Behavior and Human Performance,31,54-87.
  7. Hambleton, R. K.,Cook, L. L.(1977).Latent trait models and their use in the analysis of educational test data.Journal of Educational Measurement,14,75-96.
  8. Hambleton, R. K.,R. L. Linn (Ed.)(1989).Educational measurement.New York:Macmillan.
  9. Hambleton, R. K.,Swaminathan, H.(1985).Item response theory: Principles and applications.Boston, MA:Kluwer-Nijhoff.
  10. Hambleton, R. K.,Swaminathan, H.,Rogers, H. J.(1991).Fundamentals of item response theory.Newbury Park, CA:Sage.
  11. Hambleton, R. K.,Traub, R. E.(1973).Analysis of empirical data using two logistic latent trait modesl.British Journal of Mathematical and Statistical Psychology,26,195-211.
  12. Lord, F. M.(1968).An analysis of the verbal Scholastic Aptitude Test using Birnbaum`s three-parameter logistic model.Educational and Psychological Measurement,28,989-1020.
  13. Lord, F. M.(1980).Application of item response theory to practical testing problems.Hillsdale, NJ:Lawrence Erlbaum Associates.
  14. Rasch, G.(1960).Probabilistic models for sonic intelligence and attainment tests.Copenhagen:Danish Institute for Educational Research.
  15. Ross, J.(1966).An empirical study of a logistic mental test model.Psychoemtrika,31,325-340.
  16. Traub, R. E.,R. K. Hambleton (Ed.)(1983).Applications of item response theory.Vancouver, BC:Educational Research Institute of British Columbia.
  17. Weiss, D. J.(1982).Improving measurement quality and efficiency with adaptive testing.Applied Psychological Measurement,6,379-396.
  18. Wright, B. D.,Stone, M. H.(1979).Best test design.Chicago:MESA.
  19. Zimowski, M. F.,Muraki, E.,Mislevy, R. J.,Bock, R. D.(2003).BILOG-MG for Windows (version 3).Chicago, IL:Scientific Software International, Inc.
  20. 人本教育札記(2001)。基本學力測驗會不會太簡單,考不出程度。人本教育札記,144
  21. 王逸慧(2001)。基本學力測驗之時師:問題與展望。教育研究資訊,9(1),15-31。
  22. 何文慶(2001)。從基本學力測驗談起。師友,405,34-36。
  23. 何雅娟(2000)。多元入學多元思維-談台北市高中多元入學方案。教師天地,109,33-44。
  24. 余民寧、賴姿伶、劉育如(2005)。國中基本學力測驗實施成效之初步調查:學校的觀點。教育與心理研究,28(2),193-217。
  25. 余民寧、賴姿伶、劉育如(2004)。國中基本學力測驗實施成效之初步調查:學生的觀點。教育與心理研究,27(3),457-481。
  26. 余霖(2000)。對國民中學學生基本學力測驗之評論與期望。教師天地,109,30-32。
  27. 吳伯林、謝名娟(2001)。從國中基本學力測驗看九年一貫數學科教材教法。教育研究雙月刊,86,77-89。
  28. 宋曼雯(1998)。縮短城鄉教育資源差距的基本學力測驗。中央月刊,31(6),26-30。
  29. 李春生(1999)。以美國經驗為例淺談國民中學基本學力測驗。高中教育,6,18-27。
  30. 沈育美、陳惠珠、劉佳玲(2001)。九十學年度國中基本學力測驗-社會科中的歷史試題評析。歷史月刊,161,108-117。
  31. 沈玟君(2003)。碩士論文(碩士論文)。台南市,國立台南大學資訊教育研究所。
  32. 周麗玉(2001)。多元入學方案不等於基本學力測驗。師友,404,15-19。
  33. 林世華(2000)。跨世紀的測驗發展計畫-國民中學學生基本學力測驗發展研究。教師天地,109,4-8。
  34. 林英毅(2003)。碩士論文(碩士論文)。台南市,國立台南大學/資訊教育研究所。
  35. 林繼生(2000)。是開始也是結束-台北區公立高中八十九學年度聯招國文試題分析,兼論基本學力測驗。國文天地,16(4),60-64。
  36. 林繼生(2001)。新的開始,新的震撼-國中基本學力測驗第一次測驗國文科試題分析。國文天地,16(12),97-103。
  37. 飛揚期刊
  38. 飛揚期刊
  39. 量尺分數問與答:Q3、換算出來的結果大概會是什麼樣子?
  40. 九十三年國民中學學生基本學力測驗問與答-百勝篇
  41. 飛揚期刊
  42. 基本學力分數的建立
  43. 國中基本學力測驗分數的建立意義與使用
  44. 許綺婷(2002)。碩士論文(碩士論文)。國立台灣師範大學科學教育研究所。
  45. 楊慧美(2002)。碩士論文(碩士論文)。台北市,國立台灣師範大學科學教育研究所。
  46. 溫美玲(2003)。碩士論文(碩士論文)。桃園縣,中原大學應用數學研究所。
  47. 廖萬清(2002)。碩士論文(碩士論文)。南投縣,暨南國際大學教育政策與行政研究所。
  48. 蔡雅瑩(2004)。碩士論文(碩士論文)。台北市,國立政治大學統計研究所。
  49. 鄭圓鈴(2001)。國中國文科基本學力測驗試題分析。中國語文,88(5),527。
  50. 羅曉雯(2002)。碩士論文(碩士論文)。台北市,國立政治大學教育學系。
  1. (2006)。網路化檔案評量應用於電腦專題學習及其成效。教學科技與媒體,78,4-27。
  2. (2007)。國中生基本學力測驗量尺分數轉換之寶徵研究。教育研究學報,41(1),61-77。
  3. (2008)。國中基測量尺分數轉換議題探討。教育研究學報,42(2),67-82。