書名: 強化式學習:打造最強 AlphaZero 通用演算法
作者: 布留川 英一
譯者: 王心薇
ISBN: 9789863126515
出版社: 旗標
書籍開數、尺寸: 17x23x2.6
頁數: 512
#資訊
#AI人工智慧與機器學習
定價: 780
售價: 702
庫存: 已售完
LINE US! 詢問這本書 團購優惠、書籍資訊 等
此書籍已售完,調書籍需2-5工作日。建議與有庫存書籍分開下單

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

詳細資訊

內容介紹 人工智慧的發展就是要讓電腦具備獨立思考的能力,而強化式學習(Reinforcement Learning)就是訓練 AI 如何決策的一套方法,是最具產業發展潛力的熱門技術,可以有效解決生活中許多難以突破的問題,包括產業自動化、自動駕駛、電玩競技遊戲以及機器人等。 Deepmind 將強化式學習應用於開發圍棋 AI 上,打造出 AlphaGo,並連續擊敗李世乭、柯潔等世界第一流的圍棋高手,這段情節想必你並不陌生。而接續發展出來的 AlphaZero 不僅實力更強大,而且不侷限於單一棋類,可以從零開始訓練、不需要人類棋譜,被視為是 AGI 通用式人工智慧,震撼了整個 AI 產業界。 以強化式學習為主幹的 AlphaZero 雖然備受矚目,但對於多數讀者而言,要讀懂 AlphaZero 的論文並不容易,而且論文中並未公開程式碼,紙上談兵就要了解相關細節實在難如登天,本書將透過實作帶您揭開 AlphaZero 神秘的面紗。不用棋譜 (訓練資料) 怎麼進行訓練?強化式學習在 AlphaZero 扮演甚麼角色?為甚麼一套演算法可以適用不同規則的棋類或遊戲?論文沒有講清楚的都在這裡! 在這本書中,你將學到: ● 從深度學習開始,打下紮實基礎,包括 Artificial Neural Network、CNN、ResNet。 ● 各類強化式學習演算法的精髓,包括:ϵ-Greedy、UCB1、Policy Gradient、Q-Learning、SARSA、Deep Q-Network (DQN)。 ● 理解人工智慧中做出最優決策的方法 - 賽局樹演算法,包括 Minimax Algorithm、Alpha-beta Pruning、Monte Carlo method、Monte Carlo tree search。 ● 用 Python 實作 AGI 通用演算法 - AlphaZero,只需修改規則就能稱霸井字遊戲、四子棋、黑白棋、動物棋等不同遊戲。 目錄 第1章 AlphaZero 與機器學習概要 1-0 AlphaGo、AlphaGo Zero 與 AlphaZero 1-1 深度學習基礎 1-2 強化式學習基 1-3 賽局樹演算法基礎 第2章 準備 Python 開發環境 2-0 Google Colab 之概要 2-1 Google Colab 的使用方法 2-2 建構本地端的 Python 開發環境 第3章 深度學習 3-0 利用神經網路進行手寫數字辨識 3-1 利用神經網路預測住宅價格 3-2 利用卷積神經網路(CNN)進行影像辨識 3-3 利用殘差網路 (ResNet) 進行影像辨識 第4章 強化式學習 4-0 多臂拉霸機範例 4-1 利用策略梯度法 (Policy Gradient) 進行迷宮遊戲 4-2 利用 Sarsa 與 Q - Learning 進行迷宮遊戲 4-3 利用 Deep Q-Network 遊玩木棒平衡台車 第5章 賽局樹演算法 5-0 利用 Minimax 演算法進行井字遊戲 5-1 利用 Alpha-beta 剪枝進行井字遊戲 5-2 利用蒙地卡羅法進行井字遊戲 5-3 利用蒙地卡羅樹搜尋法進行井字遊戲 第6章 AlphaZero 的機制 6-0 利用 Tic-tac-toe 進行井字遊戲 6-1 對偶網路 6-2 策略價值蒙地卡羅樹搜尋法 6-3 自我對弈模組 6-4 訓練模組 6-5 評估模組 6-6 評估最佳玩家 6-7 執行訓練循環 第7章 人類與 AI 的對戰 7-0 建立執行 UI 的本機端開發環境 7-1 利用 Tkinter 建立 GUI 7-2 人類與 AI 的對戰 第8章 將 AlphaZero 演算法套用到不同遊戲上 8-0 四子棋 8-1 黑白棋 8-2 動物棋

為您推薦

人工智慧:智慧型系統導論3/e (3版)

人工智慧:智慧型系統導論3/e (3版)

相關熱銷的書籍推薦給您

書名:人工智慧:智慧型系統導論(第三版) 作者:李聯旺 出版社:全華 ISBN:9789862800959

原價: 590 售價: 519 現省: 71元
立即查看
深度強化式學習

深度強化式學習

類似書籍推薦給您

內容簡介   深度強化式學習 (Deep Reinforcement Learning, DRL),就是將深度學習與強化式學習結合的技術。要讓 AI 應用落地,DRL 是必不可缺的技術。近期由兩位劍橋大學博士所帶領的 Wayve 團隊就利用了 DRL 技術,開發出可以自行從新環境中學習的自動駕駛技術,取代以往完全仰賴感測器的做法。除此之外,工廠內的自動化機器人, 或是打敗世界棋王的 AlphaGo 等,背後運作的演算法也都與 DRL 息息相關。   然而 DRL 的演算法五花八門,讓人看了眼花繚亂。事實上,它們都是為了應付各式各樣的任務而發展出來的改良版本,其核心概念的差異不大,都是立足於 DRL 最基本的 DQN (Deep Q-Network) 之上。因此本書會花費較多的篇幅,一步步帶您把 DQN 的架構完全摸透,並時時提點各個技術細節的重點,讓您可以因應不同的任務或問題,加入適當的技術或技巧來克服,再進一步實作出各種進階的演算法。   本書一共分成兩篇:基礎篇及進階篇。在基礎篇中,讀者將學習如何從無到有,建構出自己的第一個RL演算法,並用該演算法來解決多臂拉霸機問題。接著,讀者會認識RL中較為經典的演算法,如DQN、策略梯度法、A2C等。同時,各章節皆搭配數個專案,確保讀者可以在學習理論的過程中,培養實作出演算法的能力,不再只是紙上談兵。   在進階篇中,作者將會介紹較為新穎,也較為複雜的RL演算法。基本上,這些演算法都是以DQN為出發點,再加上特殊的技巧,便能處理現實中的難題。舉個例子,利用平均場DQN,學者們成功模擬出了電子的自旋狀況,進而解決了RL中的多代理人問題。同時,讀者們還將學到如何將attention機制與DQN做結合,進而實作出關聯性DQN(relational DQN),提高演算法的可解釋性。   本書提供了完整的學習架構,循序漸進地介紹各種演算法,包括:   ● Deep Q-Network (DQN)   ● 策略梯度法(Policy gradient methods)   ● 優勢值演員-評論家(Advantage Actor-Critic, A2C)   ● 分散式優勢值演員-評論家(Distributional Advantage Actor-Critic, DA2C)   ● 進化演算法(Evolutionary algorithm)   ● 分散式DQN(Distributional DQN)   ● 鄰近Q-Learning(Neighborhood Q-Learning)   ● 平均場Q-Learning(Mean field Q-Learning)   ● 關聯性DQN(Relational DQN)   除了 RL 相關演算法之外,書中也介紹了近期應用 RL 而發展出來的熱門模型,相信可以提升讀者的硬實力,其中包括:   ● 圖神經網路(Graph Neural Network, GNN)   ● Transformer模型   ● Attention模型(Attention model) 目錄 第一篇:基礎篇 第1章:強化式學習的基本觀念 1.1 深度強化式學習中的『深度』 12 強化式學習 1.3 動態規劃 vs. 蒙地卡羅法 1.4 強化式學習架構 1.5 強化式學習有什麼應用? 1.6 為什麼要使用『深度』強化式學習? 1.7 有用的說明工具 – 線圖(string diagram) 1.8 未來各章的內容安排 第2章:模型化強化式學習問題:馬可夫決策過程 2.1 多臂拉霸機問題 2.2 利用拉霸機問題的演算法來優化廣告推送策略 2.3 使用PyTorch建構神經網路 2.4 解決廣告推送問題 2.5 馬可夫性質與MDP(馬可夫決策過程) 2.6 策略與價值函數 第3章:Deep Q-Network 3.1 狀態價值函數及動作價值函數 3.2 利用Q-Learning進行探索 3.3 避免災難性失憶的發生:經驗回放 3.4 使用目標網路來提升學習穩定性 3.5 回顧 第4章:利用『策略梯度法』選擇最佳策略 4.1 利用神經網路實現策略函數的功能 4.2 策略梯度演算法:強化高價值動作 4.3 使用OpenAI Gym 4.4 REINFORCE演算法 第5章:演員-評論家模型與分散式訓練 5.1 結合『價值函數』與『策略函數』 5.2 分散式訓練 5.3 分散式優勢演員-評論家模型 5.4 N步演員-評論家 第二篇:進階篇 第6章:進化演算法 6.1 梯度下降演算法的缺點 6.2 利用進化策略實現強化式學習 6.3 用基因演算法來玩Cartpole 6.4 進化演算法的好處與壞處 6.5 進化演算法是可『調整規模』的 第7章:分散式DQN 7.1 期望值Q-Learning的不足 7.2 機率與統計學 7.3 Bellman方程式 7.4 分散式Q-Learning 7.5 比較機率分佈 7.6 利用Dist-DQN處理模擬資料 7.7 進行Freeway遊戲 第8章:培養代理人的好奇心 8.1 預測編碼器模型 8.2 反向動態預測 8.3 設定瑪利歐遊戲 8.4 處理原始的遊戲狀態資料 8.5 建立Q網路與策略函數 8.6 內在好奇心模組(ICM) 8.7 另一種內在回饋值機制 第9章:多代理人的環境 9.1 多個代理人之間的互動 9.2 鄰近Q-Learning 9.3 1D Ising模型 9.4 平均場Q-Learning 9.5 包含『競爭』與『合作』關係的遊戲 第10章:具解釋性的模型:attention與關聯性模型 10.1 圖神經網路 10.2 以attention為基礎的關聯性推理 10.3 利用self-attention處理MNIST資料集 10.4 多端口的attention和關聯性DQN 10.5 雙重Q-Learning 10.6 訓練與視覺化結果 第11章:回顧與學習規劃 11.1 回顧學習歷程 11.2 有待探索的深度強化式學習問題 11.3 結語 第A章:數學、深度學習及PyTorch之額外知識補充 A.1 線性代數 A.2 微積分 A.3 深度學習 A.4 PyTorch

原價: 1000 售價: 900 現省: 100元
立即查看
強化動機 承諾改變:動機式晤談實務工作手冊

強化動機 承諾改變:動機式晤談實務工作手冊

類似書籍推薦給您

原價: 350 售價: 315 現省: 35元
立即查看
運動員增強式訓練解剖精解:強化爆發力、敏捷性、整體運動表現

運動員增強式訓練解剖精解:強化爆發力、敏捷性、整體運動表現

類似書籍推薦給您

書名:運動員增強式訓練解剖精解:強化爆發力、敏捷性、整體運動表現 作者:Derek Hansen、Steve Kennelly著 出版社:旗標 出版日期:2/11/2019 條碼:9789863125877 內容簡介 喜愛運動的人或是運動員常常希望自己的運動表現能比現在更好,比如說跳得更高一點,起跑速度更快一點,轉換方向更靈活一點... 這些實際運動表現的需求,想靠勤練肌肉或勤練體能根本做不到,唯有採用增強式訓練才能幫助你達成願望。 現階段在各個運動領域的運動科學與技術發展,多把重心放在鼓勵運動員、教練以及運動醫學專家去追求更有效的訓練與監控方式。運動員不只要持續變得更快、更壯並且更有力,還需要能夠同時預防運動傷害。對高層級運動員而言,保持韌性與健康是變強的關鍵,因為一旦錯失任何一次的訓練課表,都會讓運動員很難維持高水準的表現與進步。所以你在選擇、安排與整合訓練動作元素時更要特別注意,才能讓訓練有最好的反應與適應效果。 要讓運動表現進步依賴的並不是什麼神奇的特效藥,而是透過一個完整的訓練計畫,並在適當的時機安排適當的動作與對應的訓練量來達成。就實際生理機轉來說,增強式的動作主要是應用肌肉快速伸展的生理反應,這個生理反應也稱作「伸展收縮循環」或「牽張反射」。研究顯示肌肉在收縮前的快速預伸展,會讓接下來的收縮更快更有力,對肌力、爆發力與速度產生正向加成效果。 舉例來說,籃球員在搶籃板的時候,會先降低身體重心下蹲後再全力跳起搶球。同樣地,排球員在阻止對方殺球時,也會先做一個深蹲後全力跳起攔網。人在做出爆發力動作之前都會有許多類似的蓄力與準備的反射動作。在高爾夫球的揮桿中,一定會先有一個向後延展作用肌群的動作,來增加向前揮擊的力量;棒球投手在本壘強傳之前也少不了先有手臂向後伸展的準備動作。顯然在許多運動項目中都可以看到增強式動作的存在。 作者在本書中分享他們過去針對各種不同專項、不同層級選手所使用的增強式訓練動作,一共包含 94 種,並針對各個動作延伸出 78 個進階變化動作,內容包含雙側訓練、單側訓練、核心訓練以及各種複合式訓練方法,一應俱全。除此之外,所有動作均附詳細的解剖構造圖示,你可了解不同動作下各個肌群與關節之間的相互關係,學習各種變化動作、進階動作與一系列會影響訓練適應、恢復與運動表現的相關因子。本書內容完整涵蓋增強式訓練各個細節,能幫助你找到強化肌力與爆發力最好的訓練方式。精闢圖解讓你更了解動作原理,並進一步增進整體運動表現。 本書特色 ・市面上唯一一本訓練爆發力的增強式訓練專書,能增進各體育項目的運動表現。 ・包含 94 種增強式訓練動作,並延伸出 78 種進階變化動作。 ・以顏色深淺標示每個增強式訓練動作的主要肌群與輔助肌群。 作者介紹 作者簡介 Derek Hansen Derek Hansen MASc及CSCS認證。於 1988 年開始從事力量、速度與爆發力相關的運動科學研究。最早是一名田徑教練,希望可以幫助各個項目的選手,主要以改善選手動作速度為主。Hansen 做為教練與運動顧問,曾經與許多頂尖運動員如奧運獎牌得主、世界紀錄保持人、加拿大國家隊運動員與專業運動團隊,和不同專項的頂級運動員有合作經驗。曾經在英國哥倫比亞培育出許多短跑選手,現在也仍然和許多世界數一數二快的運動員合作。 Hansen 同時也是美式足球聯盟 NFL、美國職業籃球聯盟 NBA、美國冰上曲棍球聯盟 NHL、美國職棒大聯盟 MLB、美國足球聯盟 MLS、美國大學運動一級聯盟 NCAA Division 1 等機構的運動表現顧問與復健專家。在 2003-2016 年間任職西門菲莎大學的肌力與體能教練。Hansen 在各個工作職位都曾協助非賽季增強式訓練的介入方式與時間點、賽季中肌力維持與傷後回場評估的任務。 Steve Kennelly Steve Kennelly MEd, ATC, CSCS 認證。曾在紐約美式足球巨人隊醫療團隊服務超過 25 個賽季,現在則擔任該隊的首席助理防護員,在專業領域的表現受到美國美式足球聯盟 2012 年年度最佳防護員的肯定。從 1999 年開始就是巨人隊的防護團隊一員為選手服務。 Kennelly 身兼防護員以及肌力與體能教練,曾經主持過國家美式足球聯盟、職業足球運動聯盟、美國運動傷害防護協會與紐澤西運動防護員工會的醫療專題講座與擔任顧問。2013 年 Kennelly 整合傷害預防、運動表現、傷後復健與生理訓練的專業,成立 Kennelly 運動防護醫學團隊,期許可以教育教練、運動員與家長正確訓練適應由基礎到進階的進程。 譯者簡介 林晉利 國立體育大學運動保健學系/研究所專任副教授 柔道黑帶四段 台灣拳擊武術有氧體適能協會理事長 台灣運動保健協會理事長 台灣合格運動傷害防護師檢定官 美國運動醫學會體適能教練檢定官 美國肌力與體能訓練協會 CSCS 及 CPT 大中華區培訓講師 中華職籃戰神隊體能訓練師 曼谷亞運武術隊體能訓練師 萬明岳 清華大學學士及體大碩士 肌力與體能訓練師 運動傷害防護師 武術專長 目錄 動作索引 第 1 章 增強式訓練的生理機轉 第 2 章 訓練進度、環境與器材 第 3 章 基礎訓練動作 第 4 章 雙側下肢增強式訓練動作 第 5 章 單側下肢增強式訓練動作 第 6 章 上肢增強式訓練動作 第 7 章 核心肌群增強式訓練動作 第 8 章 增強式複合訓練動作 第 9 章 防傷訓練與復健 參考資料 收回

原價: 500 售價: 450 現省: 50元
立即查看
強化肌力訓練全書:東大肌力學教授、骨科醫師及福岡軟銀鷹教練,寫給訓練者的科學化鍛鍊指南 (1版)

強化肌力訓練全書:東大肌力學教授、骨科醫師及福岡軟銀鷹教練,寫給訓練者的科學化鍛鍊指南 (1版)

類似書籍推薦給您

原價: 380 售價: 342 現省: 38元
立即查看
後中西醫英文考前衝刺:核心字彙&文法句型(MP3音檔 + 寫作強化加值包線上下載) (1版)

後中西醫英文考前衝刺:核心字彙&文法句型(MP3音檔 + 寫作強化加值包線上下載) (1版)

類似書籍推薦給您

學士後中西醫英文備考寶典 一本掌握必考核心字 + 必通文法句型 考前衝刺最有效率! 加強複習有讀就有分! ■ 備考後醫英文,核心單字很重要 單字是英文聽說讀寫的基礎,無論準備何種考試,想要衝高英文分數,累積單字量是首要條件。以後醫近幾年考試的命題趨勢看來,英文科在單字題方面的比重越來越高,尤其是後西醫,單字難度深、考題都偏長,連帶也考驗考生的閱讀能力,而且不僅是單字題,連文法題、閱讀題裡面都有很多直接考單字代換的題目。所以說備考後醫英文,除了平時就必須厚實文法、閱讀能力外,「背好單字的投報率非常高」,真的是一點也不誇張! 本書考量後醫考生之備考需求,精選無論英文程度如何,都應該反覆記背的「專業領域核心字彙」,只要熟習這些必考字就能拿分!另輔以歷年來相關考古題,考生可以在答題中順便熟悉各校命題的方向及試題難易度。 ■ 文法:閱讀力的基石 英語是溝通工具,而理解是溝通的前提,英文科的出題方向即是測驗考生的英文理解能力。於是,我們看到英文試題之題幹明顯比過去長,變長的句子意味著每句都是複雜句,不再是一眼就能看懂或猜得出來的簡單句。每句都加長,段落就加長,各段落都加長,文章篇幅就增加了。由此可以預見:提升英文閱讀理解能力是應考的重中之重。而文法既然是一個語言造句所依據的規則,也就能用來破解、正確理解句意,所以學習文法對提升理解力是十分重要的。 本書也精選了許多重要的英文句型及文法觀念,並輔以考古題配合學習。對於文法基礎不錯的考生,它是一本非常適切的重點複習口袋書;對於文法差的考生,它會有效填補文法觀念的不足,在應考時不至於盲目猜答案。 【本書特色】 ★ 從後醫歷屆考古題中精選 530 組考生必備專業領域字及其相關衍生字,只要熟習這些必考字就能拿分! ★ 彙整 65 個重要句型和文法觀念,考前重點複習,有效補強文法弱點。 ★ 字彙及文法句型皆搭配考古題應證,考生可在答題過程中熟悉各校命題方向及試題難易度。 ★ 雲端專屬加碼送!寫作加值資源協助改正文法錯誤、中式英文等寫作痛點,優化句子強化寫作力。 ★ 口袋書設計,方便攜帶、隨時隨地聽學,輕鬆為後醫考試做足準備。

原價: 420 售價: 332 現省: 88元
立即查看