研究生: 高國瑋
Gao, Guo-Wei
論文名稱: 基於長短期記憶網路的疲勞檢測
Base on Long Short-term Memory Network for Fatigue Detection
指導教授: 陳美勇
Chen, Mei-Yung
口試委員: 蘇順豐
Su, Shun-Feng
Lin, Sian-Yi
Guo, Chong-Sian
Chen, Mei-Yung
口試日期: 2022/07/26
學位類別: 碩士
系所名稱: 機電工程學系
Department of Mechatronic Engineering
論文出版年: 2022
畢業學年度: 110
語文別: 中文
論文頁數: 73
中文關鍵詞: 疲勞檢測特徵提取長短期記憶網路可視化機器學習
英文關鍵詞: Fatigue Detection, Feature Extraction, Long Short-term Memory Networks, Visualization, Machine Learning
研究方法: 實驗設計法主題分析
DOI URL: http://doi.org/10.6345/NTNU202201337
論文種類: 學術論文
相關次數: 點閱:78下載:13
  • 本論文重點介紹即時疲勞檢測流程。該系統將在 Python 內部完成這一切,並逐步構建它,以便能夠檢測到不同的姿勢,特別是困倦的跡象。 為了做到這一點,我們使用一些關鍵模型並使用 MediaPipe Holistic 來提取關鍵點。 這將使我們能夠從臉部提取關鍵點。 該系統使用 Tensorflow 和 Keras,並建立了一個長短期記憶模型 long short-term memory(LSTM),能夠預測螢幕上顯示的動作。我們需要做的是收集關於我們所有不同關鍵點的一些數據,所以我們收集我們臉上的數據並將它們保存為 Numpy 數據,以便處理多維的陣列或矩陣。人臉檢測方法基於一個深度神經網絡,使用 Sklearn 進行評估和測試,並使用 Matplotlib 幫助進行圖像可視化。能夠從臉部檢測到 468個地標,提取臉部的重要特徵並對數據進行變換,以便將數據導入 LSTM 模型。使用 LSTM 層繼續並預測時間分量,它能夠從多個幀預測動作,而不僅僅是單個幀。使用 Opencv 進行集成,然後使用網路攝影機進行即時預測。本研究成功使用 MediaPipe 與 LSTM 模型相結合,提出一套疲勞檢測的系統。實驗結果顯示,經機器學習後其檢測平均準確率能達到 90%。

    This paper focuses on the instant fatigue detection process. The system will do all this inside python and build it incrementally to be able to detect different poses, especially signs of drowsiness. To do this, we use some key models and use MediaPipe Holistic to extract keypoints. This will allow us to extract keypoints from the face. The system uses Tensorflow and Keras and builds a long short-term memory (LSTM) model that is able to predict actions displayed on the screen. What we need to do is collect some data about all our different keypoints, so we collect data on our faces and save them as Numpy data in order to work with multidimensional arrays or matrices. The face detection method is based on a deep neural network, evaluated and tested using Sklearn and aided in image visualization using Matplotlib. Able to detect 468 landmarks from faces, extract important features of faces and transform the data so that it can be imported into an LSTM model. Continuing and predicting the temporal component using an LSTM layer, it is able to predict action from multiple frames, not just a single frame. Integrate with Opencv, then use a webcam for instant prediction. This study successfully uses MediaPipe combined with LSTM model to propose a fatigue detection system. The experimental results show that the detection accuracy can reach an average of 90% after machine learning.

    目錄 摘要 I Abstract II 誌謝 III 目錄 IV 表目錄 VI 圖目錄 VII 第一章 緒論 1 1.1前言 1 1.2文獻回顧 4 1.3研究動機與目的 10 1.4論文架構 11 第二章 理論基礎 12 2.1遞迴神經網路 12 2.1.1 RNN模型架構 14 2.1.2梯度爆炸 16 2.1.3解決梯度爆炸問題 17 2.1.4長短期記憶網路 18 2.2 MediaPipe 25 第三章 疲勞檢測系統設計 27 3.1系統架構 27 3.1.1色彩轉換 28 3.1.2臉部偵測 29 3.1.3收集特徵數據 30 3.1.4數據預處理 33 3.1.5 LSTM模型訓練 34 3.1.6疲勞預測&儲存權重 36 3.1.7混淆矩陣 37 3.2軟體配置 39 3.3硬體設備 41 第四章 實驗結果與討論 44 4.1實驗方法 44 4.1.1人臉偵測 46 4.1.2 MediaPipe模型距離偵測 47 4.1.3 LSTM網路訓練結果 50 4.1.4系統執行結果 55 4.2光線亮度測試 57 4.2.1光線亮度測試分析 60 4.3臉部部分遮擋之分析 62 4.4不同對象的疲勞檢測 64 4.5 Intel NUC模擬結果 65 4.6不同方法的疲勞偵測比較 67 第五章 結論與未來展望 70 參考文獻 71

