簡易檢索 / 詳目顯示

研究生: 曹少剛
Tsao, Shao-Kang
論文名稱: 深度學習用於愛因斯坦棋研發之初步探討
The Initial Research of EinStein würfelt nicht! with Deep Learning
指導教授: 林順喜
Lin, Shun-Shii
學位類別: 碩士
Master
系所名稱: 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2017
畢業學年度: 105
語文別: 中文
論文頁數: 44
中文關鍵詞: 電腦對局愛因斯坦棋蒙地卡羅法類神經網路深度學習
英文關鍵詞: computer games, EinStein würfelt nicht!, Monte Carlo method, neural network, deep learning
DOI URL: https://doi.org/10.6345/NTNU202202338
論文種類: 學術論文
相關次數: 點閱:160下載:41
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 愛因斯坦棋,是於西元2004年由德國中部耶拿(Jena)鎮的一位數學教授—Ingo Althöfer所發明的兩人骰棋類遊戲。
    在5x5的棋盤中放入雙方各六個棋子,雙方必須利用擲骰子的方式,來決定當前回合可以移動的棋子編號,透過各種不同的策略,減少我方或敵方的棋子,使我方比敵方優先達成勝利條件,以獲取勝利。雖然此遊戲的遊戲盤面尺寸、棋子數目較其他棋盤遊戲小、少,但是由於融入了骰子這個不確定的要素,大大地增加此遊戲的複雜度,同時也增加了耐玩性與挑戰性。
    本研究將嘗試利用蒙地卡羅演算法、卷積式類神經網路的方法,嘗試使用、尋找各種不同的特徵,將這些特徵互相搭配以形成不同的feature map,藉此訓練類神經網路各個節點的參數(權重),期望新的方法可以達到、擁有,甚至是超越目前其他強力的愛因斯坦棋下棋程式的棋力。

    EinStein würfelt nicht! is a dice board game for two players which was invented by a professor of applied mathematics, Ingo Althöfer, who lives in Jena, Germany.
    In this game, initially each player has six pieces, numbered 1 to 6, on a board with size 5x5. Each player needs to roll a dice in turns to move one of his/her pieces forward to the goal. Each player also needs to use different policies to reduce his/her own pieces or enemy’s pieces in order to win the game. Compared to other games, EinStein würfelt nicht! has smaller board size and fewer number of pieces. But it has a very important element, dice, that makes the game more complex, more fun and full of challenges and amazements.
    This research will try to apply Monte Carlo method and convolutional neural network to explore different features and use different methods to combine these features to form different feature maps. Then base on these feature maps to train the weights of the neural network and expect that the new method can make the new EinStein würfelt nicht! program more powerful than the traditional approach.

    第一章 緒論.................................................1 1.1 愛因斯坦棋與棋規 ...................................... 1 1.2 類神經網路的發展 ...................................... 3 1.3 TensorFlow ........................................... 5 1.4 監督式學習與增強式學習 ................................. 6 第二章 文獻探討 ........................................... 7 2.1愛因斯坦棋算法設計與分析 ................................ 7 2.2手寫辨識作法與TensorFlow ............................... 9 2.3愛因斯坦棋平台 ........................................ 12 2.4蒙地卡羅演算法 ........................................ 13 2.5 AlphaGo的網路結構與特徵擷取 .......................... 14 2.6 蒙地卡羅樹搜索演算法和Upper Confidence Bound .......... 16 2.7 矩形特徵擷取和時序差異學習 ............................ 18 第三章 程式設計方向 ...................................... 20 第四章 程式實作 .......................................... 21 4.1 棋譜的盤面提取 ....................................... 21 4.2 原始盤面的特徵擷取 ................................... 23 4.3 擷取特徵簡化轉換 ..................................... 25 4.4 類神經網路的輸出 ..................................... 27 4.5 卷積式類神經網路(convolutional neural network, CNN) .. 28 4.6 愛因斯坦棋下棋程式的架構 .............................. 31 第五章 實驗與結果 ........................................ 33 5.1 input feature組合方式 ............................... 33 5.2 feature表示方法 ..................................... 36 第六章 結論與未來工作 .................................... 38 6.1 結論 ................................................ 38 6.2 TAAI 2016比賽概況.................................... 40 6.3 ICGA 2017比賽概況 ................................... 41 6.4 未來工作 ............................................ 42 參考文獻 ................................................ 43

    [1] 李占宇、李淑琴、顧磊、史玉峰、周文敏,"愛恩斯坦棋演算法設計與分析",信息技術與信息化,第1期,2014。
    [2] 謝昌龍、林順喜,"電腦愛因斯坦棋自動對弈平台的設計與開發",Proceedings of TCGA 2016,pages 21–27,2016。 [3] 楊君亮、許庭嫣、林立秦,"愛因斯坦棋的電腦棋類程式設計",Proceedings of TCGA 2017,pages 96-106,2017。 [4] 朱詠嘉、陳源灝,"愛因斯坦棋人工智慧",Proceedings of TCGA 2017,pages 85-95,2017。
    [5] R. J. Lorentz. ,"An MCTS program to Play EinStein Würfelt!", In Proceedings of the 12th International Conference on Advances in Computer Games, pages 52–59, 2011.
    [6] David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser, Ioannis Antonoglou, Veda Panneershelvam, Marc Lanctot, Sander Dieleman, Dominik Grewe, John Nham, Nal Kalchbrenner, Ilya Sutskever, Timothy Lillicrap, Madeleine Leach, Koray Kavukcuoglu, Thore Graepel & Demis Hassabis, “Mastering the game of Go with deep neural network and tree search”, NATURE Vol.529, JAN 2016, pp. 484-503.
    [7] 愛因斯坦棋介紹,http://www.3-hirn-verlag.de/MasterGame/regel.html。
    [8] 維基百科:蒙地卡羅法,
    https://zh.wikipedia.org/wiki/%E8%92%99%E5%9C%B0%E5%8D%A1%E7%BE%85%E6%96%B9%E6%B3%95。
    [9] TensorFlow MNIST For ML Beginners,
    https://www.tensorflow.org/get_started/mnist/beginners。
    [10] 維基百科:TensorFlow,https://zh.wikipedia.org/wiki/TensorFlow。
    [11] TAAI 2016官方網站比賽成績,http://www.cs.nthu.edu.tw/~taai2016/。

    下載圖示
    QR CODE