研究生: 陳冠宇
Kuan-Yu Chen
論文名稱: 主題模型於語音辨識使用之改進
Improved Topic Modeling Techniques for Speech Recognition
指導教授: 陳柏琳
Chen, Berlin
學位類別: 碩士
系所名稱: 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2010
畢業學年度: 98
語文別: 中文
論文頁數: 175
中文關鍵詞: 中文大詞彙連續語音辨識共同出現關係語言模型
英文關鍵詞: large vocabulary continuous speech recognition, co-occurrence relationships, language model
論文種類: 學術論文
  • 本論文探討自然語言中詞與詞之間在各種不同條件下的共同出現關係,並推導出許多不同的語言模型來描述之,進而運用於中文大詞彙連續語音辨識。當我們想要探索語言中兩個詞彼此間的共同出現關係(Co-occurrence Relationships),傳統的做法是由整個訓練語料中統計這兩個詞在一個固定長度的移動窗(Fixed-size Moving Window)內的共同出現頻數(Frequency),據此以估測出兩個詞之間的聯合機率分布。有別於僅從整個訓練語料中的共同出現頻數來推測任兩個詞之間的關係,本論文嘗試分析兩個詞在不同條件下共同出現的情形,進而推導出多種描述詞與詞關係的語言模型以及其估測方式;像是在不同的主題、文件或文件群的情況下,它們是否皆經常共同出現。本論文的實驗語料收錄自台灣的中文廣播新聞,由一系列的大詞彙連續語音辨識實驗結果顯示,我們所提出的各式語言模型皆可以明顯地提昇基礎語音辨識系統的效能。

    This thesis investigates word-word co-occurrence relationships embedded in a natural language. A variety of language models deduced from such relationships are leveraged for Mandarin large vocabulary continuous speech recognition (LVCSR). When measuring the co-occurrence relationship between a given pair of words in a language, the most common approach is to estimate the joint probability of these two words by simply computing how many times the two words occur within some fixed-size window of each other that moves along the entire training corpus. Apart from doing this, in this study, we discuss the co-occurrence relationships between any pair of words under various conditions such as topics, documents, document clusters, to name a few, and hence derive several language models used to characterize such relationships. All experiments are conducted on a Mandarin broadcast news corpus compiled in Taiwan, and the associated results seem to demonstrate the feasibility of the proposed approaches.

    第1章 緒論 1 1.1. 統計式語音辨識(STATISTICAL SPEECH RECOGNITION) 1 1.1.1. 特徵向量擷取(Feature Extraction) 3 1.1.2. 聲學模型(Acoustic Modeling) 4 1.1.3. 語言模型(Language Modeling) 8 1.1.4. 語言解碼(Linguistic Decoding) 11 1.2. 統計式語言模型 12 1.2.1. 語言模型研究 12 1.2.2. 語言模型演進 15 1.2.3. 語言模型調適 19 1.2.4. 語言模型平滑化 22 1.3. 本論文研究內容、貢獻與成果 25 1.4. 論文架構 27 第2章 各式常見語言模型介紹 29 2.1. 詞彙規則模型(WORD-REGULARITY MODELS) 29 2.1.1. N連(N-gram)語言模型 29 2.1.2. 略詞模型(Skip Model) 30 2.1.3. 快取模型(Cache Model) 31 2.1.4. 類別N連模型(Class-based N-gram Model) 32 2.1.5. 聚合式馬可夫模型(Aggregate Markov Model, AMM) 34 2.1.6. 觸發詞對模型(Trigger-pair Model) 35 2.1.7. 混合式語言模型(Mixture-based Language Model) 36 2.2. 主題模型(TOPIC MODELS) 38 2.2.1. 潛藏語意分析(Latent Semantic Analysis, LSA) 39 2.2.2. 機率式潛藏語意分析(Probabilistic Latent Semantic Analysis, PLSA) 41 2.2.3. 潛藏狄利克里分配(Latent Dirichlet Allocation, LDA) 44 2.2.4. 詞主題模型(Word Topic Model, WTM) 47 2.3. 連續型語言模型(CONTINUOUS LANGUAGE MODELS) 49 2.3.1. 類神經機率語言模型(Neural Probabilistic Language Model) 49 2.3.2. 高斯混合語言模型(Gaussian Mixture Language Model, GMLM) 51 2.4. 鑑別式語言模型(DISCRIMINATIVE LANGUAGE MODELS) 54 2.4.1. 機率式鑑別模型調適法(Probabilistic Discriminative Model Adaptation Methods) 55 2.4.2. 鑑別式分數法(Discriminative Score Methods) 56 第3章 使用相鄰詞資訊之語言模型 63 3.1. 研究緒論 63 3.2. 相鄰詞彙資訊之語言模型於大詞彙語音辨識 64 3.2.1. 詞關聯模型(Word Association Model, WAM) 64 3.2.2. 詞關聯混合模型(Word Association Mixture Model, WAMM) 66 3.2.3. 詞相鄰模型(Word Vicinity Model, WVM) 67 3.2.4. 鄰近特徵語言模型(Vicinity Feature Language Model, VFLM) 70 3.2.5. 狄利克里相鄰模型(Dirichlet Vicinity Model, DVM) 72 3.2.6. 各式模型之比較 75 3.3. 鄰近資訊於語音辨識 (PROXIMITY INFORMATION FOR SPEECH RECOGNITION) 79 3.4. 混合主題模型(HYBRID TOPIC MODEL, HTM) 82 第4章 大詞彙連續語音辨識之實驗架構與結果 85 4.1. 實驗架構 85 4.1.1. 大詞彙連續語音辨識系統 85 前端處理與聲學模型 85 詞典建立 86 詞彙樹複製與搜尋 87 詞圖搜尋 88 4.1.2. 語言模型評估方式 89 語言複雜度 89 辨識錯誤率 90 4.1.3. 實驗語料 91 4.2. 基礎實驗結果 93 4.2.1. N連語言模型 93 4.2.2. 略詞模型 98 4.2.3. 快取模型 100 4.2.4. 類別N連語言模型 103 4.2.5. 混合式模型 106 4.2.6. 潛藏語意分析 109 4.2.7. 機率式潛藏語意分析 114 4.2.8. 潛藏狄利克里分配 117 4.2.9. 詞主題模型 120 4.3. 本論文所提出之各式語言模型實驗結果與分析 123 4.3.1. 詞關聯模型(Word Association Model, WAM) 123 4.3.2. 詞關聯混合模型(Word Association Mixture Model, WAMM) 127 4.3.3. 詞相鄰模型(Word Vicinity Model, WVM) 131 4.3.4. 鄰近特徵語言模型(Vicinity Feature Language Model, VFLM) 142 4.3.5. 狄利克里相鄰模型(Dirichlet Vicinity Model, DVM) 145 4.3.6. 混合主題模型(Hybrid Topic Model, HTM) 148 第5章 結論與未來展望 155 參考文獻 159 作者相關學術著作 175

