研究生: 施凱文
Shih, Kai-Wun
論文名稱: 表示法學習技術於節錄式語音文件摘要之研究
A Study on Representation Learning Techniques for Extractive Spoken Document Summarization
指導教授: 陳柏琳
Chen, Berlin
學位類別: 碩士
系所名稱: 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2015
畢業學年度: 103
語文別: 中文
論文頁數: 84
中文關鍵詞: 語音文件節錄式摘要詞表示法語句表示法韻律特徵
英文關鍵詞: spoken documents, extractive summarization, word representation, sentence representation, prosodic features
論文種類: 學術論文
  • 在現今日常生活裡,大量的多媒體內容與日俱增促使自動語音文件摘要成為一項重要的研究議題。當中最為廣泛地被探究的是節錄式語音文件摘要(Extractive Spoken Document Summarization):其目的是根據事先定義的摘要比例,從語音文件中選取一些重要的語句,用以代表原始語音文件的主旨或主題。另一方面,表示法學習(Representation Learning)是近期相當熱門的一個研究議題,多數的研究成果也證明了這項技術在許多自然語言處理(Natural Language Proceeding, NLP)的相關任務上,可以獲得優良的成效。有鑑於此,本論文主要探討使用詞表示法(Word Representations)及語句表示法(Sentence Representations)於節錄式語音文件摘要任務上。基於詞表示法及語句表示法,本論文提出三種新穎且有效的排序模型(Ranking Models)。除了文件中的文字資訊外,本論文更進一步地結合語音文件上的各式聲學特徵,如韻律特徵(Prosodic Features)等,以期望可獲得更好的摘要成效。本論文的語音文件摘要實驗語料是採用公視廣播新聞(MATBN);實驗結果顯示,相較於其它現有的摘要方法,我們所發展的新穎式摘要方法能夠提供顯著的效能改善。

    The rapidly increasing availability of multimedia associated spoken documents on the Internet has prompted automatic spoken document summarization to be an important research subject. Thus far, the majority of existing work has focused on extractive spoken document summarization, which selects salient sentences from an original spoken document according to a target summarization ratio and concatenates them to form a summary concisely, in order to convey the most important theme of the document. On the other hand, there has been a surge of interest in developing representation learning techniques for a wide variety of natural language processing (NLP)-related tasks. However, to our knowledge, they are largely unexplored in the context of extractive spoken document summarization. With the above background, this thesis explores a novel use of both word and sentence representation techniques for extractive spoken document summarization. In addition, three variants of sentence ranking models built on top of such representation techniques are proposed. Furthermore, extra information cues like the prosodic features extracted from spoken documents, apart from the lexical features, are also employed for boosting the summarization performance. A series of experiments conducted on the MATBN broadcast news corpus indeed reveal the performance merits of our proposed summarization methods in relation to several state-of-the-art baselines.

    圖目錄 iv 表目錄 v 第1章 緒論 1 1.1 研究背景 1 1.2 研究內容與目的 2 1.3 研究貢獻 4 1.4 論文架構 5 第2章 背景知識介紹 6 2.1 語音文件摘要背景介紹與相關研究 6 2.1.1 摘要之種類 6 2.1.2 摘要語言之種類 8 2.1.3 摘要生成方式之種類 8 2.1.4 語音文件摘要與文字文件摘要之差異 8 2.1.5 摘要語句的精簡與壓縮 9 2.2 文件自動摘要之方法 10 2.2.1 以文件結構為基礎之摘要方法 10 2.2.2 以統計值為基礎之摘要方法 11 2.2.3以機率生成模型為基礎之摘要方法 16 2.2.4 以圖論為基礎之摘要方法 20 2.3 文件自動摘要評估方式 24 2.3.1 主觀評估方式 24 2.3.2 客觀評估方式 25 第3章 基礎實驗與設置 27 3.1 實驗語料 27 3.2 基礎實驗結果 28 第4章 表示法學習 31 4.1 詞表示 31 4.1.1 連續型詞袋模型 32 4.1.2 跳躍式模型 40 4.2 語句表示 45 4.2.1 分散式儲存模型 46 4.2.2 分散式詞袋模型 47 4.3 運用表示法學習於語音文件摘要 48 4.3.1 餘弦相似度 48 4.3.2 文件相似度量值 49 4.3.3 實驗結果 50 第5章 利用主要特徵結合支持向量機於文件摘要 54 5.1 特徵簡介 54 5.1.1 結構特徵 54 5.1.2 詞彙特徵 55 5.1.3 韻律特徵 56 5.1.4 關聯特徵 57 5.2 機器學習-支持向量機 57 5.3 實驗結果 60 第6章 圖論方式之摘要壓縮 64 6.1 簡介 64 6.2 架構與流程 64 6.3 候選語句生成 65 6.3.1 建圖 65 6.3.2 深度搜尋 66 6.4 壓縮摘要之生成 67 6.4.1 訓練模型 67 6.4.2 候選語句評估 68 6.5 實驗結果 68 第7章 結論與未來展望 71 參考文獻 72

