簡易檢索 / 詳目顯示

研究生: 徐意雯
Yi-Wen Hsu
論文名稱: 國中地球科學實作評量研發與初探-以地層與化石為例
指導教授: 張俊彥
Chang, Chun-Yen
學位類別: 碩士
Master
系所名稱: 地球科學系
Department of Earth Sciences
論文出版年: 2008
畢業學年度: 96
語文別: 中文
論文頁數: 150
中文關鍵詞: 地球科學實作評量過程技能
論文種類: 學術論文
相關次數: 點閱:185下載:30
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本研究旨在研發以地球科學「地層與化石」為主題的「過程技能題本」,用以了解國三學生地球科學「地層與化石」實作評量之成就,與其在「地層與化石」知識概念上的表現,及第一次基本學力測驗自然科成績三者之相關,並初步探討學生在科學過程技能方面的表現與家庭環境及個人態度之關係。研究結果期能提供教師未來發展實作評量模式之參考。研究工具「過程技能題本」包含:「施測指導說明」、「過程技能題本(含基本概念測驗和實作題)」、「非選擇題評分標準」和「非選擇題評分表」等四部分(「基本概念測驗」KR20 = .65,「實作題」之評分者信度約為.66)。本研究以國中三年級之在學學生為研究母群,以分層叢集取樣方式在臺灣省本島北、中、南三區隨機選取兩所國民中學,每校隨機抽出一班國三學生,共有六個班級進行施測。施測樣本人數為202人,與基測成績及「個人態度問卷題本」(劉嘉茹,2002)資料合併後,有效樣本為168人(男生67人,女生101人)。本研究所使用量的統計方法主要有描述性統計(Descriptive statistics)、皮爾遜積差相關(Pearson product-moment correlation)、變異數分析(One-way analysis of variance)、多元迴歸之逐步分析法(Stepwise multiple regression)以及列聯相關分析(Contingency)。研究結果可分為下列四方面:(一)學生在「過程技能題本」的整體表現上,在「基本概念測驗」成績的平均分數較「實作題」成績高,且「基本概念測驗」成績有滿分出現。「過程技能題本」中各項能力間之相關係數介於.058~.643之間。各項能力間大多達中度以上正相關且具中度以上的效果量。(二)「基本概念測驗成績」之量尺分數與「實作題成績」之量尺分數對「第一次基本學力測驗自然科成績」皆有顯著的預測力,且對「第一次基本學力測驗自然科成績」預測力的貢獻依序為:「『基本概念測驗成績』之量尺分數及『實作題成績』之量尺分數」(R2=.345)、「『基本概念測驗成績』之量尺分數」(R2=.306)以及「『實作題成績』之量尺分數」(R2=.186)。(三)學生背景資料中,「基本概念測驗成績」之量尺分數、「實作題成績」之量尺分數以及「過程技能題本」總分之量尺分數在「區域」上有顯著差異存在,且「南部」學生的表現較不如「北部」學生和「中部」學生。而「實作題成績」之量尺分數以及「過程技能題本」總分之量尺分數在「性別」上有顯著差異存在,且女生的成績皆優於男生。另外,家長教育程度越高的學生在「第一次基本學力測驗自然科成績」的表現越好;而喜歡「理科」的學生在「第一次基本學力測驗自然科成績」上表現優於喜歡「文科」的學生。(四)在「實作題表達方式」的呈現,168個有效樣本中,只有6人以「表格式」呈現答案,154人以「條列式」呈現答案,而有8人是以「其他」方式呈現。此外,本研究參考TIMSS之評量模式研擬出一套標準化的「評分標準」,可供未來進行相關試題研發者之參考。實作評量與我國平常使用之評量模式差異很大,尤其現今教師的教學和學生的學習多數針對入學考試,因此答題時常忽略答題說明,又不習慣解題過程均須運用其所學過的概念及技能來觀察、測量、操作器材,並記錄或解釋所得的數據,正好可透過實作評量來彌補入學考試之不足,以改進教學法及提升學生的基本能力,所以值得推廣。

    謝誌 I 摘要 II 目次 IV 附錄目次 V 表次 VI 圖次 VIII 第一章 緒論 1 第一節 研究背景與動機 1 第二節 研究目的 3 第三節 待答問題 4 第四節 研究的重要性 5 第五節 名詞釋義 5 第二章 文獻探討 8 第一節 實作評量的定義 8 第二節 實作評量與其他評量的比較 9 第三節 實作評量的應用 13 第四節 大規模實作評量的設計與實施 15 第五節 我國大規模實作評量的實施情形 18 第三章 研究方法 19 第一節 研究對象 19 第二節 研究設計 23 第三節 研究流程 23 第四節 研究工具 29 第五節 資料分析 45 第四章 研究結果與討論 50 第一節 學生在「過程技能題本」中各項能力之相關 51 第二節 「過程技能題本」中各項成績與「第一次基本學力測驗自然科成績」之迴歸分析 57 第三節 學生個人背景資料對其「過程技能題本」中各項成績和第一次基本學力測驗自然科成績之影響 63 第四節 學生個人背景資料與學生各項成績表現對其「實作題表達方式」之相關性 91 第五章 結論與建議 96 第一節 研究發現與討論 96 第二節 研究限制 99 第三節 建議與展望 99 參考文獻 101 附錄目次 附錄一 過程技能題本施測指導說明 105 附錄二 過程技能題本 107 附錄三 過程技能題本評分標準 113 附錄四 過程技能題本非選擇題評分表 127 附錄五 個人態度問卷題本 129 附錄六 過程技能題本專家審查版 135 附錄七 基本統計考驗分析(一) 149 附錄八 基本統計考驗分析(二) 151 表次 表2-1 Stiggins(1987)各種類型評量方式的比較 11 表2-2 陳文典(民87)各種評量方式及其特殊作用 12 表2-3 陳文典(民85)實作、文字描述與判斷之間的差異 13 表2-4 實作評量於實施過程之注意事項 17 表3-1 受測學生之區域分布與第一次基測自然科平均分數之關係 19 表3-2 受測學生之家長教育程度與家庭收入 20 表3-3 受測學生最喜歡的學科 21 表3-4 受測學生之第一次基本學力測驗各科成績 21 表3-5 受測學生喜歡的上課方式 22 表3-6 自我學習科學的習慣 22 表3-7 父母親鼓勵參與科學活動 23 表3-8 試驗性研究之「基本概念測驗」試題鑑別率與困難度 25 表4-1 「過程技能題本」測驗之平均分數 52 表4-2 「過程技能題本」中各項能力之平均分數 52 表4-3 「第一次基本學力測驗自然科成績」平均分數 53 表4-4 「過程技能題本」中各項能力之相關分析 53 表4-5 「過程技能題本」中量尺分數轉換之分組 58 表4-6 「過程技能題本」測驗之量尺分數 58 表4-7 「基本概念IRT」、「實作題IRT」與「第一次基本學力測驗自然科成績」之相關 61 表4-8 「基本概念IRT」、「實作題IRT」與「第一次基本學力測驗自然科成績」之迴歸分析 62 表4-9 「基本概念IRT」 One-way ANOVA分析結果及效果量 65 表4-10 「基本概念IRT」在「區域」上之差異分析 66 表4-11 「基本概念IRT」在「區域」上做Games-Howell method事後比較 66 表4-12 「實作題IRT」 One-way ANOVA分析結果及效果量 71 表4-13 「實作題IRT」在「區域」上做Tukey-Kramer法事後比較 72 表4-14 「實作題IRT」在「性別」上之差異分析 73 表4-15 「實作題IRT」在「有固定閱讀自然科學讀物的習慣」上之差異分析 75 表4-16 「實作題IRT」在「父母親鼓勵參與科學活動」上之差異分析 76 表4-17 「總分IRT」 One-way ANOVA分析結果及效果量 78 表4-18 「總分IRT」在「區域」上之差異分析 79 表4-19 「總分IRT」在「區域」上做Games-Howell method事後比較 79 表4-20 「總分IRT」在「性別」上之差異分析 80 表4-21 「總分IRT」在「有固定閱讀自然科學讀物的習慣」上之差異分析 82 表4-22 「總分IRT」在「父母親鼓勵參與科學活動」上之差異分析 83 表4-23 「第一次基本學力測驗自然科成績」One-way ANOVA分析結果及效果量 85 表4-24 「第一次基本學力測驗自然科成績」在「區域」上做Tukey-Kramer法事後比較 86 表4-25 「第一次基本學力測驗自然科成績」在「家長最高教育程度」上做Tukey-Kramer法事後比較 87 表4-26 學生個人背景資料與「傳達C」之相關 91 表4-27 「傳達C」與「區域」之交叉表 92 表4-28 「傳達C」與「最喜歡的上課方式」之交叉表 93 表4-29 學生各項成績與「傳達C」之相關 94 表5-1 不同背景學生在各項成績上達顯著差異者 98 圖次 圖2-1 陳文典(民84)實作評量設計流程 16 圖3-1 研究流程圖 28 圖4-1 標準化殘差次數分配表(基本概念IRT及實作題IRT VS基測自然) 59 圖4-2 標準化殘差常態機率分配P-P圖(基本概念IRT及實作題IRT VS基測自然) 60

    王保進(2005)。視窗版SPSS與行為科學研究(第二版)。台北,心理。
    甘漢銧、陳文典(2005)。科學過程技能。科學素養的內涵與解析(再版)。
    曲慧娟(2005)。實作評量在國中學術性向優異班招生鑑定之效度研究~以臺灣北區為例。國立臺灣師範大學特殊教育學系碩士論文。
    余民寧(2005)。心理與教育統計學(修訂二版)。台北,三民。
    呂金燮(2000)。實作評量-理論。載於王文中、呂金燮、吳毓瑩、張郁雯、張淑慧(合著)。教育測驗與評量。教室學習觀點。台北,五南。173-207。
    李虎雄、黃長司(1995)。美國馬里蘭州學校實作評量工具在臺灣施測的可行性。科學教育月刊,179,41-49。
    李虎雄、張敏雪(1998)。由學力評量觀點談實作評量之特性。測驗與輔導,3104-3108。
    邱美虹(2000)。評介美國評量新標準:科學實作部分。科學教育月刊,228,2-15。
    邱美虹、洪振方、張俊彥、黃芳裕、黃福坤、許瑛玿、楊芳瑩、劉嘉茹(2002)。國科會與教育部合作目標導向計畫─國民中小學九年一貫課程中國中階段自然科學學習評量系統之研究成果報告(1/2)(89-2515-S-003-012-X3)((2000-2001)與 國民中小學九年一貫課程中國中階段自然科學學習評量系統之研究成果報告(2/2)(90-2511-S-003-101-X3)(2001-2002)。
    林清山(1995)。心理與教育統計學。台北。東華。
    教育部(2003)。國民中小學九年一貫課程總綱綱要。台北,教育部。
    桂怡芬、吳毓瑩(1998)。自然科實作評量的效度探討。測驗年刊,45(2),19-36。
    陳文典(1992)。我國國中、國小學生科學知能學習成就評量之研究。國教研習會「國教學報」,4。
    陳文典(1994)。實作評量在學力測驗之應用。測驗與輔導雙月刊,150。
    陳文典(1996)。「數理學科實作評量工具研發之技術報告」。教育部研究計劃成果報告。
    陳文典(1998)。實作評量在學力測驗之應用。測驗與輔導,150,3109-3110。
    陳文典(2000)。實作評量的理念與實施。科學教育,231,64-66。
    陳英豪、吳裕益(1992)。測驗與評量 (二版)。高雄,復文。188-189。
    張蓓莉主編(1999)。身心障礙及資賦優異學生鑑定原則鑑定基準說明手冊。國立臺灣師範學特殊教育學系印行,1-10。
    張敏雪(1998)。教室內的實作評量。教育資料與研究,20,24-27。
    國立編譯館(1996)。高級中學基礎地球科學(全一冊),第13版。台北,國立編譯館。
    國立編譯館(2000)。國民中學地球科學教科書(全一冊),正式本初版。台北,國立編譯館。
    彭森明(1996)。實作評量(performance assessment)理論與實際。教育資料與研究,9。
    傅粹馨(1995)。變異數異質之探討。教育學刊,11,1-25。
    傅粹馨(1996)。事後比較的方法。教育學刊,12,149-174。
    鄒慧英(1997)。實作評量型評量的品管議題—兼談檔案評量之應用。教育測驗新近發展趨勢學術研討會論文集,73-84。國立臺南師範學院。
    蔡宛芸(2000)。地球科學戶外教學模組之研究。國立臺灣師範大學地球科學系碩士論文。
    盧雪梅(1998)。實作評量的應許、難題和挑戰。教育資料與研究,20,1-5。
    歐滄和(2002)。教育測驗與評量。台北,心理。
    簡茂發、陳文典、陳義勳、李虎雄(1995)。由馬里蘭州的學習成就評量與其在臺灣的施測結果看--實作評量的功能與運用。科學教育月刊,185,2-10。
    Brown, M. B., & Forsythe, A. B. (1974). Robust tests for equality of variances. Journal of the American Statistical Association, 69, 364-367.
    Cohen, J. (1988). Statistical power analysis for the behavioral sciences, (2nd ed.). Hillsdale, New Jersey: Lawrence Erlbaum Associate, Inc.
    Cohen, J. (1994). The earth is round (p< .05). American Psychologist, 49(12), 997-1003
    Dunbar, S. B., Koretz, D. M. & Hoover. H. D. (1991). Quality control in the development and use performance assessment. Applied Measurement in Educational, 4(4), 289-303.
    Garcia, G. E. & Pearson, P. D. (1994). Assessment and diversity. In L. Darling-Hammand (Ed.). Review of Research in Education, 20, 337-391.
    Gardner, H. (1983). Frames of mind: The theory of multiple intelligence. New York: Basic Books.
    Gardner, H. (1993). Multiple intelligence: the theory in practice . New York: Basic Books.
    Gardner, H. (1999). Intelligence reframed: Multiple intelligence for th 21st century. New York: Basic Books.
    Glass, G. V., & Hopkins, K. D. (1996).Statistical methods in education and psychology (3rd ed.). Needham Heights, MA: Allyn &Bacon.
    Glass, G. V., McGaw, B., & Smith, W. (1981).Meta-analysis in social research. Beverly Hills,CA: Sage.
    Herman, J.L., Aschbacher, P.R., & Winters, L.(1990, November). Issues in developing alternative assessments. Paper presented at the annual meeting of the California Educational Research Association, Chicago.
    Nix, T. W., & Barnette, J. J. (1998). The data analysis dilemma: Ban or abandon. A review of null hypothesis significance testing. Research in the Schools, 5(2), 3-14.
    Parkes,J.(2003).Effect of classroom assessment on student motivation in fifth-grade science. The Journal of Educational Research, 96(3), 152-162.
    Popham, W. J. (1995). Classroom assessment-What teachers need to know. Needham Heights, MA:Allyn & Bacon.
    Rindermann, H. (2007) The g-Factor of International Cognitive Ability Comparisons: The Homogeneity of Results in PISA, TIMSS, PIRLS and IQ-Tests Across Nations. European Journal of Personality , 21, 667–706
    Ruiz-Primo, M. A., Baxter, G. P., & Shavelson, R. J. (1993). On the stability of performance assessments. Journal of Educational Measurement, 30(1), 41-53.
    Spalding, E. (2000). Performance assessment and the new standards projects : A story of serendipitous success. Phi Delta Kappan, 81(10), 758-764.
    Stiggins, R. J. (1987). Design and development of performance assessment. Educational Measurement: Issues and Practice, 6(3), 33-42.
    Stiggins, R.J. (1991b) Relevant classroom assessment training for teachers, Educational easurement:Issues and Practice, 10, 7-12.
    Stiggins, R. J. (1994). Student-centered classroom assessment. New York : Macmillan College Publishing Company.
    Sternberg, R. J. (1985). Beyond IQ . Cambridge: Cambridge University Press.
    Welch, B. L. (1951). On the comparison of several mean values: An alternative approach. Biometrika, 38, 330-336.
    Wiggins, G. (1989). A true test: Toward authentic and equitable assessment. Phi Delta Kappan, 70(9), 703-713
    Wiggins, G. (1993). Assessment authenticity, context, and validity. Phi Delta Kappan, 75(3), 200-214.
    Willson, V. L. (1991). Performance assessment,psychometric theory and cognitive learning theory:Ships crossing in the night. Contemporary Education, 62, 4, 250-254.

    下載圖示
    QR CODE