研究生: 李欣芸
Lee, Hsin-Yun
論文名稱: 基於循環神經網路之注視區域分析
Gaze Tracking Based On Recurrent Neural Network
指導教授: 李忠謀
學位類別: 碩士
系所名稱: 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2020
畢業學年度: 108
語文別: 中文
論文頁數: 42
中文關鍵詞: 人眼偵測注視區域分析卷積神經網路循環神經網路
英文關鍵詞: Eye Detection, Gaze tracking, CNN, RNN
DOI URL: http://doi.org/10.6345/NTNU202001395
論文種類: 學術論文
  • 人類在認知學習的過程中,大部分的訊息是透過眼睛視覺所獲得,並且在視線範圍內若能找到感興趣之區域,會產生一系列的凝視與掃視反應,因此若能掌握眼球運動視覺軌跡,即能分析使用者之行為模式與認知學習歷程,而此模式已廣泛應用於各個領域之中。
    透過本研究所提出CNN+RNN之訓練模型,在不同注視區域劃分下為2x2準確率達 98%、3x3準確率達 97%、4x4準確率達 90%、5x5準確率達 85%、6x6準確率達 80%、7x7準確率達 74%、8x8準確率達 69%、9x9準確率達 62%,相較於單一採用CNN架構訓練模型分類準確率,CNN+RNN模型架構能有效提升整體注視區域分類準確率 7~15%。

    Eye trackers can accurately measure the user’s eye movement, trajectory, dilation, and constriction of the pupil. However, dedicated devices are expensive. This research looks at the use of web cameras to track and predict the gaze area. In particular, this study focuses on the accuracy of classification with some degree of freedom on head movement.

    In this research, we propose a training model that uses convolution neural network and recurrent neural network in succession to train gaze direction. The user’s head can deviate within +/-10°pitch angle and +/-20° yaw angle. Regarding the gaze area of Space-Time Series of one second before, predicting and analyzing the gaze point, then improve the accuracy of classification of the gaze area. Experimental results show that the accuracy of automatic gaze tracking ranges between 98% to 62% as the gaze area gradually decreases from 640×360 pixels to 142×80 pixels.

    摘要 i 目錄 iii 圖附錄 v 表附錄 iv 第一章 緒論 1 1.1 研究動機 1 1.2 研究目的 2 1.3 研究工具 2 1.4 研究範圍與限制 3 第二章 文獻探討 4 2.1 眼動追蹤型態 4 2.2 注視點分析方法 6 2.2.1 The 2D Regression Based Methods 6 2.2.2 3D Model Based Methods 7 2.2.3 Cross Ratio Based Methods 7 2.2.4 Appearance Model-Based Algorithms 8 2.3 頭部姿勢預估模型 9 第三章 研究方法 11 3.1 系統架構 11 3.2 資料前處理 12 3.2.1 人臉與雙眼偵測 12 3.2.2 瞳孔偵測 13 3.2.3 頭部姿勢預測 15 3.3 卷積神經網路(Convolutional Neural Network, CNN) 18 3.4 循環神經網路(Recurrent Neural Network, RNN) 20 第四章 實驗與結果討論 21 4.1 注視資料庫 21 4.2 注視區域劃分 23 4.3 實驗一:注視區域追蹤演算法設計 24 4.3.1 網路架構 24 4.3.2 臉部區域 26 4.3.3 CNN與CNN+RNN網路準確度 27 4.4 實驗二:配戴眼鏡與無配戴眼鏡成效 33 4.5 模型評估 37 第五章 結論與未來展望 39 參考文獻 40

