國立臺灣師範大學博碩士論文全文系統

簡易檢索 / 詳目顯示

回結果列表

研究生：	李兆珩 Li, Zhao-Heng
論文名稱：	協助動態節目導覽推薦系統訓練資料增量之研究 Data Augmentation for the Training of Smart Electronic Program Guide Systems
指導教授：	黃文吉 Hwang, Wen-Jyi
學位類別：	碩士 Master
系所名稱：	資訊工程學系 Department of Computer Science and Information Engineering
論文出版年：	2020
畢業學年度：	108
語文別：	中文
論文頁數：	38
中文關鍵詞：	推薦系統、強化式學習、主動學習
DOI URL：	http://doi.org/10.6345/NTNU202001211
論文種類：	學術論文
相關次數：	點閱：386 下載：5
分享至:	分享至facebook 分享至twitter

查詢本校圖書館目錄查詢臺灣博碩士論文知識加值系統勘誤回報

本研究為了解決使用主動式學習的推薦系統可能面臨到因為使用者使用系統的頻率不高，而造成資料收集困難的問題，我們希望透過使用者點選的歷史資料，進行資料增量，藉由多次的觀看紀錄，也就是使用者行為資料，產生相應且大量的模擬資料，來加速使用Active Learning的推薦系統收集資料的速度，減少時間資源的浪費。
本論文以強化式學習的Policy Gradient與主動式學習結合的動態節目導覽推薦系統為例來做資料增量。我們的推薦系統同時考慮使用者的觀看節目類別的喜好，工作日與例假日，觀看時間等，因此為了有效率的產生符合一般人習慣的模擬訓練資料，我們試圖產生情境式的模擬資料來訓練類神經網路。藉由對多種情境作情境增量，我們得以解決主動式學習所面臨到需要花費大量時間收集資料的問題。

第壹章 簡介   1
第壹節 研究背景   1
第貳節 研究動機   3
第參節 研究目的   4

第貳章 強化式學習與推薦系統紹   5
第壹節 類神經網路基礎介紹   5
第貳節 強化式學習介紹   7
第一項 Policy Gradient演算法介紹   8
第參節 主動式學習與推薦系統介紹   10
第肆節 推薦系統與資料增量之研究   11

第參章 情境式模擬資料增量之方法   12
第壹節 情境式模擬資料概述   12
第貳節 電視台節目種類與時間關聯   14
第參節 情境設定介面介紹   15
第肆節 使用者模擬資料訓練流程   16
第伍節 情境定義   18
第一項 條件定義   18
第二項 每筆資料定義   19
第三項 training data 定義   20
第陸節 情境範例定義   20

第肆章 實驗結果與分析   24
第壹節 實驗環境簡述   24
第一項 觀看節目來源說明   25
第貳節 情境比較   25
第參節 實驗結果   26
第一項 情境範例1實驗結果   27
第二項 情境範例2實驗結果   29
第三項 情境範例3實驗結果   31
第四項 情境範例4實驗結果   32
第肆節 實驗結果分析   34

第伍章 結論   36

參考文獻   37
                                

[1] Chang, N., Irvan, M., & Terano, T. (2013). A TV program recommender framework. Procedia Computer Science, 22, 561-570.

[2] N. Rubens, M. Elahi, M. Sugiyama, and D. Kaplan (2015). Active Learning in Recommender Systems, Chap. 24 of Recommender Systems Handbook, 2nd Ed., Editors: F. Ricci, L. Rokach, B. Shapira, Springer-Verlag, New York, USA.

[3] Elahi, M., Ricci, F., & Rubens, N. (2014, September). Active learning in collaborative filtering recommender systems. In International Conference on Electronic Commerce and Web Technologies (pp. 113-124). Springer, Cham.

[4] Felder, R. M., & Brent, R. (2009). Active learning: An introduction. ASQ higher education brief, 2(4), 1-5.

[5] 黃文吉,楊日鳳,徐雅盈”OTT/OTA模組開發合作研究”,資策會結案報告,2019.

[6] Kaelbling, L. P., Littman, M. L., & Moore, A. W. (1996). Reinforcement learning: A survey. Journal of artificial intelligence research, 4, 237-285.

[7] 楊日鳳, ”使用強化式學習於時間序列預測之應用”, 國立台灣師範大學,2019.

[8] Elahi, M., Ricci, F., & Rubens, N. (2014, September). Active learning in collaborative filtering recommender systems. In International Conference on Electronic Commerce and Web Technologies (pp. 113-124). Springer, Cham.

[9]PyQt:https://riverbankcomputing.com/software/pyqt/intro.

[10] xlwings: https://www.xlwings.org/.

[11] TitanTV: https://titantv.com/default.aspx.

[12] 爬蟲: https://www.selenium.dev/.

簡易檢索 / 詳目顯示

相關論文