簡易檢索 / 詳目顯示

研究生: 林俊卿
Juin Ching Lin
論文名稱: 全球資訊網語音解說模式之研究
Research on World Wide Web Voice Rendition Model
指導教授: 葉耀明
Yeh, Yao-Ming
學位類別: 碩士
Master
系所名稱: 資訊教育研究所
Graduate Institute of Information and Computer Education
論文出版年: 2004
畢業學年度: 92
語文別: 中文
論文頁數: 93
中文關鍵詞: 全球資訊網應用可擴展標籤語言應用語音瀏覽器網路可及性語音呈現模式
英文關鍵詞: WWW Application, XML Application, Voice Browser, Web Accessibility, Aural Rendering Model
論文種類: 學術論文
相關次數: 點閱:176下載:2
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 近年來,全球資訊網以其優異的多媒體呈現能力,生動活潑的互動方式,一躍成為網際網路上最主要的服務,政府部門、各級學校、企業及機構等皆建立起各單位的資訊網站,使得人們利用全球資訊網來獲取資訊的需求與日俱增。然而傳統瀏覽器利用視覺呈現網頁資訊的方式漸顯其限制,除了無法加惠視覺障礙者外,亦無法滿足行動通訊族以電話上網的需求。為此,Universal Web Access 的概念於是被提出,目的是希望不論一般人或身心障礙者,都能夠非常方便地透過全球資訊網取得完整的資訊服務。另外,讓使用者透過語音與網站互動的語音瀏覽器(Voice Browser)也逐漸受到重視。
    本研究將針對具有Universal Web Access設計概念的網站,發展語音瀏覽器所需要的網頁語音解說模式及相關系統。在此我們提出具備滑鼠、鍵盤操作雙模式,視覺、語音呈現雙模式,並引進知識樹概念,成為具有知識結構的「雙模式知識網站」。在語音呈現方面,我們為此網站提出兩種網頁解說模式,包括了「跨網頁解說模式」及「網頁內容解說模式」。在跨網頁解說模式方面,透過網站地圖解說模式、索引式解說模式、知識樹分類解說模式及多維度知識樹檢索解說模式等,可以讓使用者更有組織的存取網站資源。而在網頁內容解說模式方面,透過主題式解說模式及多語調解說模式等,可以提供使用者更彈性、更人性化的方式以存取網頁內的資訊。另外,本研究也發展兩種編輯工具,包括雙模式網頁編輯器及知識樹編輯器,以協助網頁開發者快速的建立雙模式知識網站。

    目錄 附圖目錄 iv 附表目錄 vii 第一章 緒論 1 1.1 研究背景 1 1.2 研究動機 2 1.3 論文架構 3 第二章 相關研究 4 2.1 語音合成技術 4 2.1.1 IQTTS系統架構 5 2.1.2 IQTTS功能規格 6 2.1.3 IQ-TTS API 6 2.2 語音壓縮技術 7 2.2.1壓縮比(Compression ratios)、位元率(bitrate)與音訊品質 8 2.2.2 MPEG-1音頻壓縮標準 9 2.2.3 LAME Encoder 10 2.3 Ontology 10 2.3.1 特殊知識領域(Domain Ontology) 11 2.3.2 Ontology的應用 12 2.4 無障礙網頁設計規範 13 2.4.1 無障礙網頁內容可及性規範 13 2.4.2 無障礙網頁開發規範 14 第三章 語音解說雙模式知識網站 17 3.1 雙模式知識網站概念 17 3.2 網站架構與編輯器 21 3.2.1雙模式網站架構 21 3.2.2 雙模式網頁編輯器 28 3.2.3 知識樹架構 29 3.2.4 知識樹編輯器 32 3.3 跨網頁解說模式 33 3.3.1 網站地圖式解說模式 33 3.3.2 關鍵字索引解說模式 38 3.3.3 知識樹分類解說模式 40 3.3.4 多維度知識樹檢索解說模式 43 3.4 網頁內容解說模式 46 3.4.1 主題式解說模式 46 3.4.2 多語調解說模式 49 第四章 系統架構與軟體環境介紹 52 4.1 使用案例 52 4.2 DMPB系統流程架構 55 4.2.1 DMPB系統架構 55 4.2.2 DMPB軟體環境 64 4.3 OTB系統流程架構 67 4.3.1 OTB系統架構 67 4.2.2 OTB軟體環境 73 4.4 跨網頁解說模式系統流程架構 75 4.4.1網站地圖式解說模式 75 4.4.2關鍵字索引式解說模式 77 4.4.3知識樹分類解說模式 79 4.4.4多維度知識樹檢索解說模式 80 4.5 網頁內容解說模式系統流程架構 83 4.5.1 主題式解說模式 83 4.5.2 多語調解說模式 85 第五章 結論與未來發展 87 5.1 研究比較 87 5.1.1 雙模式知識網站與傳統網站之比較 87 5.1.2 雙模式知識網站與無障礙網頁開發規範之比較 88 5.2 應用與未來發展 90 5.2.1系統應用 90 5.2.2未來發展 90 參考文獻 92

    參考文獻
    【1】 AT&T Corporation, The AT&T Labs Natural Voices. http://www.research.att.com/projects/tts/
    【2】 B. Chandrasekaran , J.R. Josephson, and V.R. Benjamins, “What are Ontologies,and why do we need them ?” IEEE Intelligent System, vol. 14, 1999, pp. 20-26.
    【3】 C.A. Lanciani, “Audio Perception and the MPEG Audio Standard – A Qualifying Examination Report,” Georgia Institute of Technology School of Electrical and Computer Engineering, August 11, 1995.
    【4】 Gruber, T.R., “A translation approach to portable ontologies”, Knowledge Acquisition 5, 1993, pp.199-220
    【5】 Gruninger, M. and Lee, J., “Ontology applications and design”,Communications of the ACM, Volume 45, Issue 2, Feb. 2002, pp.39-41
    【6】 H. Borko and M. Bernick, “Automatic Document Classification,” Journal of the ACM, vol. 10, no. 1, 1963, pp. 151-162.
    【7】 Heflin, J.D., “Towards the Semantic Web: Knowledge Representation in a Dynamic, Distributed Environment”, 2001
    【8】 Hendler, J., “Agents and the Semantic Web”, IEEE Intelligent Systems, 2001, pp. 30-37
    【9】 IBM Corporation, ViaVoice System, http://www-4.ibm.com/software/speech/
    【10】 IQTTS訓練手冊,網際智慧公司2002
    【11】 James, F. “AHA: Audio HTML Access”, The Six International World Wide Web Conference. Ed, by Michael R. Genesereth and Anna Patterson, Santa Clara, CA, 7-11 April 1997. IW3C2, pp. 129-139.
    【12】 James, F. “Lessons from Developing Audio HTML Interfaces”, ASSETS 98,April 1998, pp. 15-17.
    【13】 James, F. “Presenting HTML Structure in Audio: User Satisfaction with Audio Hypertext”, ICAD 96 Proceedings, Xerox PARC, 4-6 Nov. 1996, pp. 97-103.
    【14】 N. Guarino and P. Giaretta, “Ontologies and Knowledge Bases: Towards a Terminological Clarification,” Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing 1995, N.J.I Mars, ed., p.25-32, Amsterdam: IOS press, 1995.
    【15】 R. Navigli, P. Velardi, and A. Gangemi, “Ontology Learning and Its Application to Automated Terminology Translation,” IEEE Intelligent Systems, vol.18, Jan/Feb 2003, pp. 22-31
    【16】 R. Navigli, P. Velardi, and A. Gangemi, “Ontology Learning and Its Application to Automated Terminology Translation,” IEEE Intelligent Systems, vol.18, Jan/Feb 2003, pp. 22-31
    【17】 Rollins, S. and N. Sundaresan, “AVoN calling: AXL for voice-enabled Web navigation”, Elsevier Science, Computer Networks, Vol: 33, Issue: 1-6, pp.533-551, June 2000.
    【18】 T. Painter and A. Spanias, “Perceptual Coding of Digital Audio,” Processing of the IEEE, Vol. 88, No. 4, April 2000.
    【19】 The Centre for Speech Technology Research, Festiva Speech Synthesis System, http://www.cstr.ed.ac.uk/projects/ festival/
    【20】 The LAME Project, http://lame.sourceforge.net/
    【21】 Waters, C. “Universal Web Design”, New Riders Co., 1997.
    【22】 WWW Consortium, “Web Accessibility Initiative”. http://www.w3.org/WAI/
    【23】 語音合成Speech synthesize note , http://www2.cyut.edu.tw/~s9154610/speech.html
    【24】 研考會,”無障礙空間服務網”,http://www.enable.nat.gov.tw/index.jsp

    QR CODE