簡易檢索 / 詳目顯示

研究生: 林佳怡
Lim, Ka-I
論文名稱: 以電腦輔助出題的台語詞彙測驗研究佮語法接觸調查
Computer-Assisted Development of Taiwanese Vocabulary Tests and An Investigation of Language Contact in Taiwanese
指導教授: 許慧如
Khoo, Hui-lu
陳柏熹
Chen, Po-Hsi
口試委員: 曾金金 施慶麟 程俊源 劉承賢
口試日期: 2021/06/30
學位類別: 博士
Doctor
系所名稱: 臺灣語文學系
Department of Taiwan Culture, Languages and Literature
論文出版年: 2021
畢業學年度: 109
語文別: 臺文
論文頁數: 141
中文關鍵詞: 台語測驗自動命題難度特徵語言接觸語法變化
英文關鍵詞: Taiwanese language fluency test, computer-assisted item generation, item difficulty, language contact, grammar change
研究方法: 準實驗設計法調查研究
DOI URL: http://doi.org/10.6345/NTNU202100831
論文種類: 學術論文
相關次數: 點閱:160下載:46
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 因為歷史佮政治因素,多數台灣人以華語做第一語言。台灣各語言的發展無平等,親像其他的本土語言,台語的資源相對較欠缺,而且受著強勢華語的影響,台語當咧發生變化,沓沓仔倚向華語,甚至可能會影響台語測驗的標準。為著拓展台語測驗的發展面向,以及了解語法變化對台語標準化可能產生的影響,本文進行三項研究。
    第一,建立一套自動出題的方法佮程序,產出選項是漢字佮羅馬字兩種題型的詞彙測驗。以台語現有的資料庫做基礎,利用電腦程式自動產生詞彙測驗選擇題的題身佮選項,產出的題目由人工略仔修改了,以線頂的方式實際施測。第二,驗證出題方法的可用性,閣分析試題的難度特徵。收集作答反應以後,以古典測驗理論(CTT)佮試題反應理論(IRT)的Rasch model方法分析,來驗證試題可用性,才閣進一步共兩種題型中會影響難度的試題特徵揣出來。結果發現,本研究設計的出題方法佮程序,確實會當產出有鑑別度、也符合測驗單向度要求的可用試題。難度特徵方面,漢字選項題型的各種客觀特徵,攏較輸專家主觀判斷的結果;羅馬字選項題型有「題目台語特色詞的數量」、「誘答選項佮正答選項的聲調差異數量」兩項客觀特徵會當預測難度,專家判斷顛倒無準確。
    第三項研究轉向關注可能影響測驗標準的語法變化。整理受華語影響的台語語法,設計做語法接受度量表,kap入去研究一的線頂測驗,利用測驗的形式做語言調查的替代方案,來評估台語語法受華語影響的情形。結果發現,台語語序佮華語無仝的語法特色,受影響的程度較低,語序仝款、語法詞無仝的語法特色,受影響的程度較懸,甚至有錯誤語法的接受度比正確語法的接受度較懸的例。
    本研究的成果,開創台語測驗自動命題的研究,會當以較低的成本增加台語語言能力認證考試的題目數量,也會當予一般大眾初步判斷家己的程度適合報佗一个等級的考卷;另外,因應中學階段本土語納入必修課,研究成果也會當發展做教師判斷學生台語程度的工具。

    Due to historical and political reasons, the vast majority of population in Taiwan speak Mandarin as their first language. Taiwanese, like many other "native languages" in Taiwan, lack resources to maintain their native-speaking population size. As Taiwanese has been highly influenced by Mandarin, the standards for Taiwanese proficiency tests may need to be adjusted accordingly. To support the ongoing language revitalization efforts, this dissertation is devoted to the testing and understanding of Taiwanese proficiency in Taiwan, taking into account the fact that most test takers may be fluent in Mandarin, a language closely related to and partially sharing the writing system with Taiwanese.

    In this study, I developed two Taiwanese vocabulary tests using computer programs and Taiwanese databases. The two tests consisted of multiple-choice questions that were written in Chinese characters and Lomaji (a Latin-based orthography), respectively. Participants were recruited through social media and took the tests online. Participants' responses were analyzed with Classical Test Theory (CTT) and Rasch model from Item Response Theory (IRT).

    Results of the vocabulary tests show that the processes and procedures used to create the vocabulary tests are satisfactory in terms of both discrimination and unidimensionality. Item difficulty analysis reveals that the objective attributes of an item are not good predictors of its difficulty, but expert opinions are, when the item is written in Chinese characters. In contrast, when the item is written in Lomaji, its objective attributes - in particular, the number of words that are not present in Mandarin, and the number of tonal differences between the target and distractors - are good predictors of the item's difficulty, while expert opinions are not.

    Additionally, I created a Taiwanese grammar questionnaire that was administered along with the vocabulary tests. The questionnaire consisted of sentences with function words and sentence order that were either native sounding (traditionally grammatical) or highly influenced by Mandarin (traditionally ungrammatical). Participants were asked to judge the acceptability of each sentence with their gut instinct. I analyzed the correlation between a participant's performance on the vocabulary tests and their performance on the grammar questionnaire.

    Results of the grammar questionnaire shows that an ungrammatical sentence is relatively more acceptable if its sentence order is the same as how it would be in Mandarin, but its function words are not present in Mandarin. In contrast, an ungrammatical sentence is relatively less acceptable if its sentence order is different from how it would be in Mandarin, but its function words are present in Mandarin. Overall, the grammatical version of a sentence is more acceptable than the ungrammatical version of the sentence, although this is not true for every sentence in the questionnaire.

    This study is one of the first to programmatically generate items for Taiwanese proficiency tests. The test development method introduced by this study considerably lowers the cost to create new items for existing tests. An abundance of items will also enable test takers to estimate their proficiency beforehand and register for the appropriate difficulty levels. Furthermore, as mother tongue education is becoming mandatory in high schools, this study provides a convenient way for teachers to create Taiwanese exams for students at different proficiency levels.

    第一章 研究背景佮研究目的 1 一、 台語的衰微佮復振 1 二、 本土語言進入教育體制 1 三、 台語語言基礎工程的進展 3 四、 台語認證的現況 5 五、 現時台語測驗需要好實施的題目形態 8 六、 是按怎需要羅馬字詞彙測驗 11 七、 語言接觸對台語的影響 12 八、 研究目的 14 第二章 文獻回顧 15 第一節 測驗設計 15 第二節 測驗分析 19 第三節 語言接觸 21 第三章 研究方法佮研究程序 27 第一節 設計以資料庫佮電腦程式輔助出題的方法 28 一、 收集可用的資料庫 28 二、 設計題殼、結合資料庫以產生試題 29 三、 預試佮分析 30 四、 正式卷組卷 30 五、 建置線頂測驗系統 31 六、 施測佮收集作答反應 31 第二節 驗證出題方法的可用性佮分析試題難度的特徵 32 一、 以CCT、IRT驗證題目的可用性 32 二、 揣出可能影響難度的特徵 34 三、 專家難度 34 四、 以多元迴歸驗證難度特徵 34 第三節 分析台語語法受華語影響的變動程度 35 一、 整理變動中的語法 35 二、 設計語法接受度量表 36 三、 佮正式卷組卷施測 36 四、 以平均數檢驗變動程度 37 五、 以積差相關檢驗語法佮詞彙能力的關連性 37 第四章 電腦輔助命題及組卷、施測 38 第一節 收集可用的資料庫 38 一、 教育部《臺灣閩南語常用詞辭典》 38 二、 教育部臺灣閩南語詞彙分級研究案「詞頻表」 40 三、 台語文語詞檢索(Concordancer)系統資料庫 41 第二節 設計以資料庫佮電腦程式輔助出題的方法 42 一、 建立題殼 43 二、 建立考點 45 三、 產生題身 46 四、 產生誘答選項 47 五、 組成題目 53 六、 難度特徵 54 第三節 預試 56 一、 漢字分測驗 56 二、 羅馬字分測驗 60 第四節 整理變動中的語法 62 一、 變動中的台語 63 二、 台語受華語影響的語法 64 三、 設計語法接受度量表 69 第五節 組合正式卷 70 一、 兩个詞彙測驗揀題 71 二、 組卷 79 第六節 設計線頂施測介面 81 第七節 整理作答反應 83 一、 資料清理 83 二、 資料相kap 84 第八節 專家難度 87 第五章 資料分析佮結果討論 90 第一節 驗證出題方法的可用性 90 一、 古典測驗理論(CTT)分析 90 二、 試題反應理論(IRT)分析 95 第二節 分析試題難度特徵 100 一、 專家難度分析 101 二、 漢字分測驗分析 103 三、 羅馬字分測驗分析 109 第三節 語法接受度量表分析 116 一、 語法變動程度 117 二、 語法佮詞彙能力的相關性 121 第六章 結論佮後續研究建議 123 第一節 結論 123 一、 設計以資料庫佮電腦程式輔助出題的方法 123 二、 驗證出題方法的可用性佮分析影響試題難度的特徵 123 三、 分析台語語法受華語影響的變動程度 125 第二節 後續研究建議佮應用 126 一、 命題方式 126 二、 分析方面 127 三、 研究成果應用 128 參考文獻 130 附錄 135 一、 a卷完整內容 135 二、 b卷完整內容 138 三、 詞彙註解 141

    小川尚義,《臺日大辭典》(臺灣總督府,1932)。
    王文中等,《教育測驗與評量 : 教室學習觀點》(臺北市:五南,1999)。
    北京语言学院汉语水平考试中心编,《汉语水平考试研究论文选》(北京市:現代出版社,1995)。
    邓思颖,《形式汉语句法学》(上海市:上海教育,2010)。
    吉田真悟,〈Uì語詞區別ê角度來探討台語文內底漢字kap羅馬字ê用法〉(台語研究,10(1),2018),頁50-71。
    余民寧,《試題反應理論(IRT)及其應用》(臺北市:心理,2009)。
    张兴权,《接触语言学》(北京市:商務印書館,2012)。
    张伯江、方梅,《汉语功能语法研究》(南昌市:江西教育,1996)。
    张凯,《语言测验理论与实践》(北京市:北京語言文化大學,2002)。
    张凯主编,《漢語水平考試(HSK)研究》(北京市:商務印書館,2006)。
    张林林,《对外汉语教学的语言测试》(廣州市:廣州高等教育出版社,2013)。
    林佳怡,《淺論臺灣閩南語網路辭典的編輯脈絡》(第八屆臺灣語言及其教學國際學術研討會,臺北市:台灣語文學會,2010)。
    林佳怡,《從教育部台語認證之能力指標談台語語言能力》(第九屆台灣文化國際學術研討會,臺北市:國立臺灣師範大學台灣語文學系,2015)。
    林佳怡,〈臺灣閩南語俗音的類型〉(臺中教育大學學報:人文藝術類,35(1),2021),頁45-61。
    林慶勳,《臺灣閩南語概論》(臺北市:心理,2001)。
    林麗黎,〈羅馬字在幼稚園母語教學的運用〉(海翁台語文學教學季刊,(1),2008),頁34-43。
    邹嘉彦、游汝杰主編,《语言接触论集》(上海市:上海教育,2004)。
    姚榮松,〈閩南話書面語的漢字規範〉(教學與研究,12,1990),頁77-94。
    姚榮松,〈閩南語書面語使用漢字類型分析〉(第一屆台灣本土文化學術研討會論文集,1994),頁177-192。
    姚榮松,〈台灣閩南語歌仔冊的用字分析與詞彙解讀:以最新落陰相褒歌為例〉(國文學報,第29期,2000),頁193-230。
    姚榮松,〈台灣閩南語的正字與俗字〉(國文天地,21卷第2期,2005),頁10-21。
    施正鋒編,《各國語言政策 : 多元文化與族群平等》(臺北市:前衛,2002)。
    柯華葳主編,《華語文能力測驗編製—研究與實務》(臺北市:遠流,2004)。
    洪惟仁,《台灣方言之旅》(臺北市:前衛,1992)。
    洪惟仁,《漳泉競爭與台灣優勢腔的形成》(博士論文,國立清華大學語言所,2003)。
    洪惟仁,〈閩南語書寫法的理想與現實〉(臺灣語文研究,5(1),2010),頁81-108。
    洪惟仁,〈語言分布發展的擴散論與類型論〉(語言暨語言學,16(5),2015),頁639-661。
    洪惟仁,《臺灣語言的分類與分區:理論與方法,臺灣社會語言地理學研究第一冊》(臺北市:前衛,2019)。
    胡韧奋,〈汉语词汇测试自动命题研究〉(中文信息学报,31(1),2017),頁41-49。
    國立成功大學台灣語文測驗中心,《全民台語認證導論》(臺南市:亞細亞國際傳播社,2010)。
    張郁雯,〈詞彙分級研究〉(載於《華語文能力測驗編製—研究與實務》,柯華葳(主編),臺北市:遠流,2004),頁83-102。
    張莉萍,〈對應於歐洲共同架構的華語詞彙量〉(華語文教學研究,9(2),2012),頁77-96。
    張裕宏,《白話字基本論 : 台語文對應&相關的議題淺說》(臺北市:文鶴,2001)。
    陳柏熹,《心理與教育測驗:測驗編製理論與實務》(新北市:精策教育,2011)。
    陳淑嬌,〈台灣語言活力研究〉(載於《語言政策的多元文化思考》鄭錦全(主編),臺北市:中央研究院語言研究所,2007),頁19-39。
    陳慕真,《白話字的起源與在台灣的發展》(博士論文,國立臺灣師範大學臺灣語文學系,2015)。
    曾文璇,〈華語八千詞詞彙分級研究〉(華語學刊,16期,2014),頁22-33。
    游汝杰、邹嘉彦,《社會語言學教程》(上海市:復旦大學,2004)。
    湯廷池,《閩南語語法研究試論》(臺北市:臺灣學生,1999)。
    黃宣範,《語言社會與族群意識 : 臺灣語言社會學的研究》(臺北市:文鶴,1995)。
    楊允言,《台語文語料處理kah線頂資源研究》(臺南市:亞細亞國際傳播,2014)。
    楊秀芳,《臺灣閩南語語法稿》(臺北市:大安,1991)。
    楊秀芳,〈閩南語書寫問題平議〉(大陸雜誌,90(1),1995),頁15-24。
    楊秀芳,〈方言本字研究的觀念與方法〉(漢學研究,第18卷特刊,2000),頁111-146。
    董忠司,《福爾摩沙的烙印:臺灣閩南語概要》(臺北市:文建會,2001)。
    臺灣總督府,《臺灣戶口調查集計原表》(臺灣總督府,明治三十八年,1905)。
    蔣為文,《語言、文學kap台灣國家再想像》(臺南市:國立成功大學出版中心,2007)。
    鄭良偉,《從國語看臺語的發音》(臺北市:臺灣學生,1987)。
    鄭良偉,《走向標準化的台灣語文》(臺北市:自立晚報,1989)。
    鄭良偉,《演變中的臺灣社會語文 : 多語社會及雙語教育》(臺北市:自立晚報,1990)。
    鄭良偉,《台、華語的接觸與同義語的互動》(臺北市:遠流,1997)。
    鄭良偉,《台語的語音與詞法》(臺北市:遠流,1997)。
    鄭錦全等編,《語言政策的多元文化思考》(臺北市:中央研究院語言研究所,2007)。
    盧廣誠,《台灣閩南語詞彙研究》(臺北市:南天,1999)。
    盧廣誠,《台灣閩南語概要》(臺北市:南天,2003)。
    謝石譯,《句法結構(原作者:Noam Chomsky)》(臺北市:結構群(原出版年1957),1989)。
    謝妙玲、李臻儀,〈台灣閩南語「都」與「攏」的分工與合併〉(台灣語言學期刊,Vol.17.1,2019),頁131-182 。
    謝國平,《語言學概論》(臺北市:三民,1998)。
    謝國平,〈語言流失與RLS在台灣〉(載於《語言政策的多元文化思考》鄭錦全(主編),臺北市:中央研究院語言研究所,2007),頁7-18。
    蘇宜青譯,《語言、社會和同一性(原作者:John Edwards)》(臺北市:桂冠,1994)。

    Bachman, Lyle F. & Palmer, Adrian S.. Language Testing in Practice: Designing and Developing Useful Language Tests. (NewYork: Oxford University Press,1996).
    Capel, A.. “A1-B2 vocabulary: insights and issues arising from the English Profile Wordlists project” (English Profile Journal, 1, e3,(2010).
    Embretson, S. E. & Reise, S. P.. Item Response Theory for Psychologist. (Mahwah, N. J. : L. Erlbaum Associates, 2000).
    Gierl, Mark J., Zhou, Jiawen & Alves, Cecilia. ”Developing a Taxonomy of Item Model Types to Promote Assessment Engineering. Journal of Technology.” (Learning, and Assessment, 7(2). , 2008) Retrieved[date]from http://www.jtla.org
    Nation, I. S. P.. Learning Vocabulary in Another Language. (Cambridge University, 2001).
    O'Sullivan, Barry(Ed). Language Testing: Theories and Practices. (New York: Palgrave Macmillan, 2011).
    Thomason, Sarah G.. Language Contact: An Introduction. (Washington, D. C.: Georgetown University Press, 2001).
    Winford, Donald. An Introduction to Contact Linguistics. (Malden, MA: Blackwell Pub, 2003).

    網路資料:
    周盈成,〈想學寫台語羅馬字但不知要選「白話字」或「臺羅」?那你知道早就撨好了嗎?〉(2016),關鍵評論,2016年5月5日,取自https://www.thenewslens.com/article/28741。
    教育部,臺灣閩南語羅馬字拼音方案使用手冊(2006) https://ws.moe.edu.tw/001/Upload/FileUpload/3677-15601/Documents/tshiutsheh.pdf
    教育部,十二年國民基本教育課程綱要國民中小學語文領域-本土語文(閩南語文)(2016)https://www.naer.edu.tw/PageSyllabus?fid=52
    教育部,《臺灣閩南語常用詞辭典》,2019年7月版 https://twblg.dict.edu.tw/
    教育部,教育部臺灣閩南語羅馬字拼音教學網(2019)https://tailo.moe.edu.tw/。
    Common European Framework of Reference for Languages: Learning, teaching, assessment (CEFR)https://www.coe.int/en/web/language-policy/cefr

    下載圖示
    QR CODE