簡易檢索 / 詳目顯示

研究生: 劉宏二
論文名稱: 初探國際地球科學奧林匹亞(IESO)選拔方式之研究
指導教授: 張俊彥
學位類別: 碩士
系所名稱: 地球科學系
Department of Earth Sciences
論文出版年: 2008
畢業學年度: 96
語文別: 中文
論文頁數: 101
中文關鍵詞: 國際地球科學奧林匹亞試題反應理論古典測驗理論
英文關鍵詞: International Earth Science Olympiad, Item response theory, Classical test theory
論文種類: 學術論文
相關次數: 點閱:475下載:35
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報

本研究為探討2007年第1屆國際地球科學奧林匹亞台灣區選拔試題之研究,研究對象為參加2007年國際地球科學奧林匹亞台灣區選拔選手共390人。期望能從測驗試題分析及選手成績表現的差異,探討選拔試題及評量方式的合適性,以提供未來選拔方式的參考。本研究以古典測驗理論及試題反應理論為基礎,使用Microsoft EXCEL 2003、SPSS for Windows 10及WINSTEPS軟體處理資料,包括試題難度、試題鑑別度、試題參數、選手能力參數及成績描述統計,進行交叉比對分析結果並討論。研究結果顯示: (1)選擇題成績及問答題成績兩者相較之下,選擇題成績較能代表選手能力。 (2)選擇題和問答題兩者得分表現在高分群向度不一致,可能和所測驗的概念不同有關。問答題的設計與成績的採計似乎仍有可以改善的空間,若能針對此改進,未來的初選結果將可能更臻完美。 (3)複選測驗成績具有良好的模式適合度及一致性,能準確的估計選手能力。

第一章 緒論 1 第一節 研究背景 1 第二節 研究動機及目的 2 第三節 基本假設與限制 2 第四節 名詞釋義 3 第二章 文獻探討 4 第一節 測驗分析理論 4 第二節 測驗題本分析 12 第三節 試題題型分析 21 第三章 研究方法 25 第一節 研究對象 25 第二節 研究流程 25 第三節 研究工具 28 第四節 資料處理 33 第四章 結果與討論 35 第一節 初選測驗CTT分析結果 35 第二節 初選測驗IRT分析結果 45 第三節 複選測驗分析結果 83 第四節 對照組能力比對分析 93 第五章 結論與建議 98 第一節 結論 98 第二節 未來建議 98 參考文獻 99

一、 中文部分
簡茂發(民80)。命題方法與試題分析。國教輔導,第31 卷第1 期,2-13。
錢才瑋、王文中、陳承德、張文信、林宏榮、劉歐(2006)。Rasch 分析在醫療界之應用。台南:聞道出版社。

二、 英文部分
Armstrong, D.G., Henson, K.T., & Savage, T.V.(1989). Education:An introduction(3rd, ed.). New York:Macmillan.
Birnbaum, A. (1968). Some latent trait models and their use in inferring an examinee’sability. In F. M. Lord & M. R. Novick, Statistical theories of mental testscores(pp395-479). Reading, Mass.:Addirson - Wesley Publishing.
Baker,F.B. (2001).The basics of item response theory. Portsmouth, N.H. : Heinemann.
Crocker,L.&Algina,J.(1986).Interduction to classical and modern test theory.NY:CBS.
Cronbach,L. J.(1990). Essentials of psychological testing(5th ed.).New York:Harper&Row.
Crocker,L.&Algina,J.(1986).Interduction to classical and modern test theory.NY:CBS.
Chase,C.I.(1978).Measurement for educational evaluation(2nd ed.)Reading,MA:Addison-Wesley.
Ebel, R. L.,& Frisbie, D. A.(1991).Essentials of educational measurement(5th ed.).Englewood Cliffs, NJ: Prentice-Hall.
Ebel, R. L. (1979). Essentials of Educational Measurement. (3rd ed.). Englewood Cliffs, NJ: Prentice-Hall.
Green, D. R., Yen, W. M., & Burket, G. R. (1989).Experiences in the application of item response theory in test construction. Applied Measurement in Education, 2(4),297-312.
Gronlund, N. E. (1993). How to make achievement tests and assessments (5th ed.).Boston: Allyn & Bacon.
Hopkins, K. D., Stanley, J. C., & Hopkins, B. K. (1990). Educational and psychological measurement and evaluation (7th ed.). Englewood Cliffs, NJ:Prentice- Hall.
Hambleton, R. K., & de-Gruijter, D. N. M. (1983). Application of item response models to criterion-referenced test item selection. Journal of Educational Measurement, 20, 355-367.
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles and applications. Boston: Kluwer.
Hambleton, R.K., Swaminathan,H., & Rogers,H.J.(1991). Fundamentals of Item response theory.Newbury Park,CA:Sage.
Lord, F. M. (1980). Applications of item response theory to practice testing problems.Hillsdale, N. J.:Erlbaum Publishers.
Lord, F. M., & Novick, M. R. (1968). Statistical theories of mental test scores. NewYork:Addison-Wesley.
Linacre, J. M. (2006). WINSTEPS Rasch measurement computer program. Chicago: Winsteps.com. Availabe:http://www.winsteps.com. Accessed:July 9 , 2007.
Noll, V. H., Scannell, D. P., & Craig, R. C. (1979). Introduction to Educational Measurement. (4th ed.). Boston: Houghton Mifflin.
Prieto L, Lamarca R, Santed R, McFarlane D, Sanzo JM, Alonso J. Reducing the items of the Nottingham Health Profile. Qual Life Res. 1997;6:703.
Rasch , G.(1980).Probobility models for some intelligence and affainment test Chicago : The University of Chicago Press ( Original edition published in 1960).
Reckase, M.D.(1979). Unifactor latent trait models applied to multi-factor test : Results and implications .Journal of Educational Statistics, 4,207- 230.
Samejima, F. (1977). A use of the information function in tailored testing. Applied Psychological Measurement, 1, 233-247.
T. Vacha-Haase, R. K. Henson, and J. C. Caruso Reliability Generalization : Moving toward Improved Understanding and Use of Score Reliability Educational and Psychological Measurement, August 1, 2002; 62(4): 562 - 569.
Trevor Bond & Christine Fox (2001) “Applying the Rasch Model: Fundamental Measurement in the Human Science”,Mahwah NJ : Lawrence Erlbaum Associates.
Wright, B.D. & Stone,M.H.(1979).Best test design.Chicago,IL : MESA Press.
Wright, B.D. & Masters,G.N.(1982).Rating scale analysis. Chicago ,IL:MESA Press.