研究生: 陳于佳
Yu-Chia Chen
論文名稱: 中文文本可讀性特徵選取與模型建立 - 以華語為第二語言教材為例
Feature Selection and Model Construction for Classification of Chinese Text Readability: A Case Study of Teaching Materials for Chinese as Second Language
指導教授: 張國恩
Chang, Kuo-En
Sung, Yao-Ting
Chang, Tao-Hsing
學位類別: 碩士
系所名稱: 資訊教育研究所
Graduate Institute of Information and Computer Education
論文出版年: 2012
畢業學年度: 100
語文別: 中文
論文頁數: 85
中文關鍵詞: 可讀性特徵選取支援向量機
英文關鍵詞: Readability, Feature Selection, Support Vector Machine
論文種類: 學術論文
相關次數: 點閱:339下載:35
  • 由於全球學習華語熱潮的興起,學習華語的人數年年增加。不論是母語學習,或者是第二語言學習,閱讀在語言學習中都扮演了重要的角色。但如何選擇適當難易度的文本是在閱讀過程中常面臨到的問題。教師在教學時必須選擇符合學習者程度的教材,來提高華語文教學的效率。

    In recent years, the number of people in the world learning Chinese is growing rapidly. Reading plays an important role in language learning. But how to select reading text which is suitable for learners is one of problem in reading. Teachers have to choose reading materials at right reading level for learners to improve efficiency. Readability assessment is a method to quantify reading difficulty for learners.
    In this study we combined support vector machine with feature selection methods to construct a model to predict the CEFR level of the six most popular Chinese teaching materials : Practical Audio-Visual Chinese, Far East everyday Chinese, New Practical Chinese Reader, Integrated Chinese, Learning Chinese with Newspaper, and Practical Business Conversation. We also compared the predicting performance by different combination of features.
    The experimental results have shown the effectiveness of the feature selection method. Choosing important features can reach the best performance, the accuracy is about 85.47%. We hope our study can promote more effective teaching and learning in Chinese learning.

    附表目錄 vi 附圖目錄 viii 第一章 緒論 1 第一節 研究背景與動機 1 第二節 研究目的 5 第二章 文獻探討 6 第一節 華語為第二語言教材發展現況與能力指標 7 第二節 可讀性 12 第三節 特徵選取 19 第四節 支援向量機 23 第三章 研究方法 26 第一節 中文文本可讀性指標分析系統 28 第二節 挑選影響第二語言習得之中文可讀性指標 30 第三節 特徵選取方法 35 第四節 支援向量機的訓練與測試 37 第四章 實驗設計 39 第一節 實驗一 40 壹、 實驗資料 40 貳、 實驗流程 42 參、 實驗結果 43 第二節 實驗二 45 壹、 實驗資料與工具 45 貳、 實驗流程 45 參、 實驗結果 47 第三節 實驗三 54 壹、 實驗資料與工具 54 貳、 實驗流程 54 參、 實驗結果 57 第五章 結果與討論 70 第一節 SVM與GLM預測結果之差異 70 第二節 Feature Selection效果 70 第三節 SVM各等級預測嚴重錯誤分析 71 第四節 SVM分類嚴重錯誤文章分析 71 第六章 結論與未來發展 74 第一節 結論 74 第二節 未來發展 76 參考文獻 78


