Basic Search / Detailed Display

Author: 林榆真
LIN, YU-CHEN
Thesis Title: 運用專利分析探討自然語言處理技術之發展
UNDERSTANDING THE DEVELOPMENT TRENDS OF NATURAL LANGUAGE PROCESSING TECHNOLOGY:A PATENT ANALYSIS
Advisor: 曾元顯
Tseng, Yuen-Hsien
Committee: 林雯瑤 董蕙茹
Approval Date: 2021/07/08
Degree: 碩士
Master
Department: 圖書資訊學研究所
Graduate Institute of Library and Information Studies
Thesis Publication Year: 2021
Academic Year: 109
Language: 中文
Number of pages: 129
Keywords (in Chinese): 自然語言處理專利分析資訊計量學主題歸類
Keywords (in English): natural language processing, patent analysis, informetrics, text clustering
Research Methods: 內容分析法資訊計量分析
DOI URL: http://doi.org/10.6345/NTNU202101031
Thesis Type: Academic thesis/ dissertation
Reference times: Clicks: 304Downloads: 31
Share:
School Collection Retrieve National Library Collection Retrieve Error Report
  • 在當今知識經濟的背景底下,隨著時代背景的轉變以及深度學習的興起,促使神經網路架構在自然語言處理(Natural Language Processing)技術中獲得突破性的成果,也再度燃起人們對於實現人機通訊的興趣。目前,NLP技術已廣泛應用於文句的情緒分析、詞類標示、機器翻譯、文法錯誤更正及語音辨識等各種使用情境,因此可將該技術視為是語言學與AI領域中備受矚目的技術,為此追蹤NLP技術之投入量變化、相關研發單位的專利布局,已是研發人員最需熱切探究與關心的議題。
    專利為各國企業的無形資產,不僅可以進行新技術的保護外,它同時也是一份完整描述專利技術內涵的紀錄文件。專利分析除了可以用來窺視整體趨勢的動向,以獲得確切的情報來保障企業組織的研發計畫方向及成果的價值性外,也可以通過時刻關注競爭對手和全球的技術研發動向,達到具備經濟效益的專利布局。
    為此本研究通過分析USPTO專利資料庫,窺視1976至2020年期間NLP技術之專利數量變化以及相關單位的投入狀況。經分析後發現NLP技術的專利申請數量成長快速,且該領域最常被引用之文獻主題以智能助理、語音識別居多,所以相關研究者可優先閱覽這類文獻來瞭解NLP技術的現況。Partnership on AI的董事會成員皆為該領域主要的專利權人,其中又以IBM(19.05%)位居首位,相較之下,臺灣專利權人雖以工研院、資策會為主,但歷年專利件數皆少於3件,顯示相關單位並未在美國專利市場上有重大的技術布局。反觀中國雖然在申請美國專利的腳步上比其他境外國家晚,但自2011年起便急起直追,並於2018年超越美國主要之境外申請國日本,凸顯中國對於技術布局與智慧財產的重視。

    In the knowledge-based economy, with the change of the times and the rise of deep learning, the neural network architecture has made a breakthrough in natural language processing technology, which has rekindled people's interest in realizing man-machine communication. At present, NLP technology has been widely used in emotion analysis, part-of-speech tagging, machine translation, grammar error correction and speech recognition, so NLP technology can be regarded as an attractive technology in linguistics and artificial intelligence. Therefore, tracking the change of NLP technology investment and the patent layout of relevant R&D units has become the most urgent problem that R&D personnel explore and care about.
    Patents are intangible assets of enterprises in various countries, which can not only protect new technologies, but also provide a complete record document describing the connotation of patented technologies. Patent analysis can not only be used to peek into the overall trend, so as to obtain accurate information and ensure the direction of R&D plans and the value of each enterprises's achievements, but also pay close attention to the technological R&D trends of competitors and the world at any times, so as to realize the economically favorable patent layout.
    Therefore, by analyzing the USPTO patent database, this study looks at the changes in the number of patents of NLP technology and the investment status of relevant units from 1976 to 2020. After patent analysis, it is found that the number of patent applications for NLP technology is increasing rapidly, and the most frequently cited literature topics in this field are intelligent assistants and speech recognition. Therefore, relevant researchers can read this kind of literature first to understand the current situation of NLP technology. The members of the board of directors of Partnership on AI are the main patentees in this field, with IBM (19.05%) ranking first. In contrast, although the patentees in Taiwan Province Province are mainly Industrial Technology Research Institute and the Institute for Information Industry, the number of patents over the past years is less than 3, which indicates that the relevant units have not attached importance to the technical layout in the US patent market. On the other hand, although China lags behind other overseas countries in applying for US patents, it has been catching up since 2011 and surpassed Japan, the major overseas applicant of the United States in 2018, which highlights China's emphasis on technology layout and intellectual property rights.

    第一章 緒論... 1 第一節 研究背景... 1 第二節 研究動機... 2 第三節 研究目的與問題... 3 第四節 研究範圍與限制... 4 第五節 名詞解釋... 7 第二章 文獻探討... 9 第一節 自然語言處理技術... 9 第二節 專利資訊... 16 第三節 專利計量學與主題分析... 18 第四節 專利分析工具... 22 第三章 研究設計與實施... 27 第一節 研究流程... 27 第二節 研究對象與分析工具... 28 第三節 研究實施步驟... 31 第四章 研究結果... 51 第一節 自然語言處理技術之專利件數及趨勢分析... 51 第二節 自然語言處理技術之生產力概況... 55 第三節 專利主題... 79 第四節 專利引用分析... 96 第五章 結論與建議... 103 第一節 結論... 103 第二節 研究建議... 107 參考文獻... 109 附錄... 115 附錄一 專利權人的權威控制表... 115 附錄二 發明人的權威控制表... 123 附錄三 國別的權威控制表 125

    一、 中文部分
    中國科學院大資料挖掘與知識管理重點實驗室(2020)。2019年人工智能發展白皮書。中國科學院大資料挖掘與知識管理重點實驗室報告。中國:中國科學院。
    王知津、栗莉(2001)。情報科學再認識。情報資訊工作,3,5-8。
    全球信息安全標準化技術委員會(2019)。人工智能安全標準化白皮書(2019版)。全球信息安全標準化技術委員會大資料安全標準特別工作組之會議報告(編號:20191101115151443)。中國:中國電子技術標準化研究院。
    吳卓翰(2020)。專利審查實務分享-專利分類檢索與計量分析。經濟部智慧財產局,未出版。
    呂力之(2000)。應重視專利指標在科技政策制定中的作用。中國科技論壇,4,43-46。
    李建明(2020)。深度學習攝影機專利分析。輔仁大學科技管理學程碩士在職專班碩士論文,新北市。取自https://hdl.handle.net/11296/568bhb
    李清福、陳志銘、曾元顯(2013)。數位學習領域主題分析之研究。教育資料與圖書館學,50(3),319-354。
    李龍豪、簡佑達、張俊彥、李宗諺、曾元顯(2016)。短文回應的主題自動歸類在行動教育活動上之應用初探。圖書資訊學研究,11:1,47-84。
    阮明淑、梁峻齊(2009)。專利指標發展研究。圖書館學與資訊科學,35(2),88-106。
    邱昱雯(2019)。自然語言處理之專利分析研究。國立臺北科技大學智慧財產權研究所碩士論文,臺北市。取自https://hdl.handle.net/11296/3yz42u
    專利地圖(2021年5月4日)。取自維基百科,自由的百科全書:https://zh.wikipedia.org/w/index.php?title=%E5%B0%88%E5%88%A9%E5%9C%B0%E5%9C%96&oldid=39987542
    張郁蔚(2012年10月)。圖書館學與資訊科學大辭典-專利計量【國家教育研究院雙語詞彙、學術名詞暨辭書資訊網】。取自: https://terms.naer.edu.tw/detail/1678902/
    張晉源、管中徽(2018年11月)。IPC或CPC?美國專利分類號分析的比較與分析。「2018 中華民國科技管理學會年會暨論文研討會」發表之論文,義守大學。
    張瑞芬(2013)。專利分析與智慧財產管理:以資訊技術與知識管理方法為手段。臺北市:華泰文化。
    張曉珍、陳賜賢(2017)。華文自然語言處理中國專利趨勢分析。Market Intelligence & Consulting Institute (MIC)產業研究報告(編號:CDOC20170418001)。臺北市:資策會產業情報研究所。
    陳妍錦、呂新科、羅嘉惠、林芃君、簡志維(2013年6月)。專利地圖分析與檢索技術之探討。「第九屆知識社群研討會」發表之論文,中國文化大學。
    陳達仁(2010)。專利檢索與專利分析。臺北市:經濟部智慧局。
    陳達仁、黃慕萱(2018)。專利資訊檢索、分析與策略(二版)。臺北市:華泰文化出版。
    陳綺萱(2019)。深度學習之專利分析研究。國立臺灣師範大學圖書資訊學研究所碩士論文,臺北市。 取自https://hdl.handle.net/11296/85e732
    曾元顯(2011)。文獻內容探勘工具-CATAR-之發展和應用。圖書館學與資訊科學,37(1),31-49。
    曾元顯(2012年10月)。圖書館學與資訊科學大辭典-自然語言處理【國家教育研究院雙語詞彙、學術名詞暨辭書資訊網】。取自:http://terms.naer.edu.tw/detail/1678997/
    曾元顯、林瑜一(2011)。內容探勘技術在教育評鑑研究發展趨勢分析之應用。教育科學研究期刊,56(1),129-166。
    馮志偉(2008)。自然語言處理的歷史與現狀。中國外語,5(1),14-22。
    經濟部智慧財產局(2020)。專利分析與布局應用 Part3 專利分析與布局專利管理圖分析【YouTube 影片】。臺北市:經濟部智慧財產局。
    資訊與通信術語辭典(2003年6月)。資訊與通信術語辭典-自然語言【國家教育研究院雙語詞彙、學術名詞暨辭書資訊網】。取自:http://terms.naer.edu.tw/detail/1282937/
    管中徽(2021a)。專利分析介紹。國立臺灣科技大學專利所,未出版。
    管中徽(2021b)。共現網路分析-節點評價。國立臺灣科技大學專利所,未出版。
    趙化成(2013)。從國際法析論我國參與世界智慧財產權組織(WIPO)之可行性。智慧財產權月刊,176,5-35。
    劉國讚(2018)。國際專利分析與布局。臺北市:元照。
    羅思嘉(2007)。專利計量分析與應用。國立成功大學圖書館館刊,16,43-54。
    羅思嘉(2013)。專利計量研究發展趨勢初探。載於卜小蝶(主編),中華民國圖書館事業百年回顧與展望8:圖書資訊學學術研究(頁 135-147)。臺北市:五南。
    二、 日文部分
    特許廳(2020)。特許行政年次報告書2020年版。特許行政年次報告書。日本:経済産業省。
    黒橋禎夫(2003)。20世紀の名著名論:Pierce J. Caroll J. Hamp E. Hays D. Hockett C. Oettinger A. Perlis A.: Language and Machines : Computers in Translation and Linguistics。情報処理,44(12),1287。
    顧震宇、路焼、肖滬衛(2012)。科学技術のイノベーションに手を差し伸べる:上海図書館の特許情報サービスについて。図書館界,63(6),440-442。
    三、 英文部分
    Angelov, D. (2020). Top2Vec:Distributed Representations of Topics. ArXiv, abs/2008.09470.
    Chao, Min-Hua., Trappey, Amy J. C., & Wu, Chun-Ting. (2021). Emerging Technologies of Natural Language-Enabled Chatbots:A Review and Trend Forecast Using Intelligent Ontology Extraction and Patent Analytics. Complexity, vol. 2021, 1-26. Article ID : 5511866
    Computing Machinery and Intelligence. (2020, November 17). In Wikipedia, The Free Encyclopedia. Retrieved November 21, 2020, from https://en.wikipedia.org/w/index.php?title=Computing_Machinery_and_Intelligence&oldid=997750520
    Electronics and Telecommunications Research Institute. (2021). ETRI 2020 Brochure. Retrieved from https://www.etri.re.kr/engcon/sub3/sub3_0101.etri
    Fortune Business Insights. (2021). Natural Language Processing (NLP) Market Size, Share and Industry Analysis, By Deployment (On-Premises, Cloud, and Hybrid), By Technology (Interactive Voice Response (IVR), Text Analytics, Speech Analytics, Pattern and Image Recognition, and Others), By Industry Vertical (Healthcare, Retail, BFSI, Automotive and Transportation, Advertising and Media, Manufacturing, and Others) and Regional Forecast, 2021-2028 (Publication No. FBI101933). Retrieved from https://www.fortunebusinessinsights.com/industry-reports/natural-language-processing-nlp-market-101933
    Hearst, M. A. (1999). Untangling text data mining. Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics, 3-10.
    Hutchins, J. (2005). The history of machine translation in a nutshell. Retrieved from http://www.hutchinsweb.me.uk/Nutshell-2005.pdf
    LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521, 436-444.
    Narin, F. (1994). Patent bibliometrics. Scientometrics, 30(1), 147–155.
    Natural language processing. (2021, June 12). In Wikipedia, The Free Encyclopedia. Retrieved November 21, 2020, from https://en.wikipedia.org/w/index.php?title=Natural_language_processing&oldid=1030186679
    Sharma, P., & Tripathi, R. (2017). Patent citation: A technique for measuring the knowledge flow of information and innovation. World Patent Information, 51, 31-42.
    Tseng, C. Y., & Ting, P. H. (2013). Patent analysis for technology development of artificial intelligence:A country-level comparative study. Innovation, 15(4), 463-475.
    Tseng, Y. H., Lin, C. J., & Lin, Y. I. (2007). Text mining techniques for patent analysis. Information Processing and Management, 43(5), 1216–1247.
    United States Patent and Trademark Office. (2020, Aug 31). Search for patents [Web blog message]. Retrieved from https://www.uspto.gov/patents-application-process/search-patents
    World Intellectual Property Organization. (2007). Intellectual Property Panorama-MODULE 06 Patent Information. Retrieved from https://www.wipo.int/export/sites/www/sme/en/documents/pdf/ip_panorama_6_learning_points.pdf
    World Intellectual Property Organization. (2018). Data collection method and clustering scheme. Background paper for. WIPO Technology Trends. 2019: Artificial Intelligence. Retrieved from https://www.wipo.int/export/sites/www/tech_trends/en/artificial_intelligence/docs/techtrends_ai_methodology.pdf
    World Intellectual Property Organization. (2019). WIPO Technology Trends 2019:Artificial Intelligence. (ISBN:978-92-805-3007-0). Retrieved from https://www.wipo.int/edocs/pubdocs/en/wipo_pub_1055.pdf
    World Intellectual Property Organization. (2020a,Aug 31). NATIONAL COLLECTIONS - DATA COVERAGE [Web blog message]. Retrieved from https://patentscope.wipo.int/search/en/help/data_coverage.jsf
    World Intellectual Property Organization. (2020b,Aug 31). PATENTSCOPE Artificial Intelligence Index [Web blog message]. Retrieved from https://www.wipo.int/tech_trends/en/artificial_intelligence/patentscope.html

    下載圖示
    QR CODE