研究生: 陳彥霖
Chen, Yan-Lin
論文名稱: 應用潛在語意分析於試題相似度比較之可行性
The feasibility of applying Latent Semantic Analysis to analyze Item similarity
指導教授: 何榮桂
學位類別: 碩士
系所名稱: 資訊教育研究所
Graduate Institute of Information and Computer Education
論文出版年: 2006
畢業學年度: 94
語文別: 中文
論文頁數: 76
中文關鍵詞: 潛在語意分析試題相似評分函式LSA
英文關鍵詞: latent semantic analysis, Item similarity, score function, LSA
論文種類: 學術論文
  • 本研究旨在應用潛在語意分析(Latent semantic analysis,LSA)模型於試題相似度之判斷,並探討不同的評分函式對於結果的影響,同時根據試題關鍵字的特性,與LSA模型處理詞彙共現(Lexically Co-occur)的特性,提出訓練文件可採用相關文件來提高判斷的精確率。研究結果使用dice或內積為評分函式較接近專家評鑑結果,對於專家相似度評鑑比較一致的試題,有高達0.9的相關程度,而平均相關值也有0.7以上的相關程度,因此潛在語意分析應用於試題相似度是可行的技術。

    The purpose of this study is to apply latent semantic analysis (LSA) to analyze item similarity , and discuss the result of using different score function. The feature of LSA model is “Lexically Co-occur” detection , in other words, LSA model can analyze many documents, and find synonyms , but synonyms rarely exist in the same item , so LSA model needs to be trained by documents which are related to this item . This study revealed that the result using dice measure or inner product measure correlates more closely with expert’s scores. For the items which is more agreeable of expert’s scores than others , the maximum correlation is up to 0.9, and the mean of correlation is up to 0.7, so applying latent semantic analysis to analyze item similarity is a feasible technology.

    中文摘要 i 英文摘要 ii 表目錄 v 圖目錄 vi 第一章 緒論 1 第一節 研究動機與目的 1 第二節 研究目的 2 第二章 文獻探討 4 第一節 命題技巧與原則 4 第二節 潛在語意分析 6 第三節 關鍵字的選取 15 第四節 關鍵字的權重 15 第五節 中研院-中文斷詞系統 17 第三章 研究方法與步驟 19 第一節 研究步驟 19 第二節 研究工具 20 第三節 實驗設計 21 第四章 結果與討論 27 第一節 外在效標建立 27 第二節 評分函式在判斷不同相似度之分析 29 第三節 關鍵字選取之分析 37 第四節 使用相關文件訓練有無之分析 43 第五節 研究結果 48 第五章 結論與建議 51 第一節 結論 51 第二節 建議 52 參考文獻 53 附錄一、中研院平衡語料庫詞類標記集 58 附錄二、高中歷史題庫概況表 60 附錄三、潛在語意分析系統介面 61 附錄四、評鑑所使用的試題範例 62 附錄五、相似度評鑑系統介面 65 附錄六、評鑑系統說明手冊 66 附錄七、專家評鑑資料 68

