人工智慧:智慧型系統導論3/e (3版)
相關熱銷的書籍推薦給您
書名:人工智慧:智慧型系統導論(第三版)
作者:李聯旺
出版社:全華
ISBN:9789862800959
立即查看
內容簡介
深度強化式學習 (Deep Reinforcement Learning, DRL),就是將深度學習與強化式學習結合的技術。要讓 AI 應用落地,DRL 是必不可缺的技術。近期由兩位劍橋大學博士所帶領的 Wayve 團隊就利用了 DRL 技術,開發出可以自行從新環境中學習的自動駕駛技術,取代以往完全仰賴感測器的做法。除此之外,工廠內的自動化機器人, 或是打敗世界棋王的 AlphaGo 等,背後運作的演算法也都與 DRL 息息相關。
然而 DRL 的演算法五花八門,讓人看了眼花繚亂。事實上,它們都是為了應付各式各樣的任務而發展出來的改良版本,其核心概念的差異不大,都是立足於 DRL 最基本的 DQN (Deep Q-Network) 之上。因此本書會花費較多的篇幅,一步步帶您把 DQN 的架構完全摸透,並時時提點各個技術細節的重點,讓您可以因應不同的任務或問題,加入適當的技術或技巧來克服,再進一步實作出各種進階的演算法。
本書一共分成兩篇:基礎篇及進階篇。在基礎篇中,讀者將學習如何從無到有,建構出自己的第一個RL演算法,並用該演算法來解決多臂拉霸機問題。接著,讀者會認識RL中較為經典的演算法,如DQN、策略梯度法、A2C等。同時,各章節皆搭配數個專案,確保讀者可以在學習理論的過程中,培養實作出演算法的能力,不再只是紙上談兵。
在進階篇中,作者將會介紹較為新穎,也較為複雜的RL演算法。基本上,這些演算法都是以DQN為出發點,再加上特殊的技巧,便能處理現實中的難題。舉個例子,利用平均場DQN,學者們成功模擬出了電子的自旋狀況,進而解決了RL中的多代理人問題。同時,讀者們還將學到如何將attention機制與DQN做結合,進而實作出關聯性DQN(relational DQN),提高演算法的可解釋性。
本書提供了完整的學習架構,循序漸進地介紹各種演算法,包括:
● Deep Q-Network (DQN)
● 策略梯度法(Policy gradient methods)
● 優勢值演員-評論家(Advantage Actor-Critic, A2C)
● 分散式優勢值演員-評論家(Distributional Advantage Actor-Critic, DA2C)
● 進化演算法(Evolutionary algorithm)
● 分散式DQN(Distributional DQN)
● 鄰近Q-Learning(Neighborhood Q-Learning)
● 平均場Q-Learning(Mean field Q-Learning)
● 關聯性DQN(Relational DQN)
除了 RL 相關演算法之外,書中也介紹了近期應用 RL 而發展出來的熱門模型,相信可以提升讀者的硬實力,其中包括:
● 圖神經網路(Graph Neural Network, GNN)
● Transformer模型
● Attention模型(Attention model)
目錄
第一篇:基礎篇
第1章:強化式學習的基本觀念
1.1 深度強化式學習中的『深度』
12 強化式學習
1.3 動態規劃 vs. 蒙地卡羅法
1.4 強化式學習架構
1.5 強化式學習有什麼應用?
1.6 為什麼要使用『深度』強化式學習?
1.7 有用的說明工具 – 線圖(string diagram)
1.8 未來各章的內容安排
第2章:模型化強化式學習問題:馬可夫決策過程
2.1 多臂拉霸機問題
2.2 利用拉霸機問題的演算法來優化廣告推送策略
2.3 使用PyTorch建構神經網路
2.4 解決廣告推送問題
2.5 馬可夫性質與MDP(馬可夫決策過程)
2.6 策略與價值函數
第3章:Deep Q-Network
3.1 狀態價值函數及動作價值函數
3.2 利用Q-Learning進行探索
3.3 避免災難性失憶的發生:經驗回放
3.4 使用目標網路來提升學習穩定性
3.5 回顧
第4章:利用『策略梯度法』選擇最佳策略
4.1 利用神經網路實現策略函數的功能
4.2 策略梯度演算法:強化高價值動作
4.3 使用OpenAI Gym
4.4 REINFORCE演算法
第5章:演員-評論家模型與分散式訓練
5.1 結合『價值函數』與『策略函數』
5.2 分散式訓練
5.3 分散式優勢演員-評論家模型
5.4 N步演員-評論家
第二篇:進階篇
第6章:進化演算法
6.1 梯度下降演算法的缺點
6.2 利用進化策略實現強化式學習
6.3 用基因演算法來玩Cartpole
6.4 進化演算法的好處與壞處
6.5 進化演算法是可『調整規模』的
第7章:分散式DQN
7.1 期望值Q-Learning的不足
7.2 機率與統計學
7.3 Bellman方程式
7.4 分散式Q-Learning
7.5 比較機率分佈
7.6 利用Dist-DQN處理模擬資料
7.7 進行Freeway遊戲
第8章:培養代理人的好奇心
8.1 預測編碼器模型
8.2 反向動態預測
8.3 設定瑪利歐遊戲
8.4 處理原始的遊戲狀態資料
8.5 建立Q網路與策略函數
8.6 內在好奇心模組(ICM)
8.7 另一種內在回饋值機制
第9章:多代理人的環境
9.1 多個代理人之間的互動
9.2 鄰近Q-Learning
9.3 1D Ising模型
9.4 平均場Q-Learning
9.5 包含『競爭』與『合作』關係的遊戲
第10章:具解釋性的模型:attention與關聯性模型
10.1 圖神經網路
10.2 以attention為基礎的關聯性推理
10.3 利用self-attention處理MNIST資料集
10.4 多端口的attention和關聯性DQN
10.5 雙重Q-Learning
10.6 訓練與視覺化結果
第11章:回顧與學習規劃
11.1 回顧學習歷程
11.2 有待探索的深度強化式學習問題
11.3 結語
第A章:數學、深度學習及PyTorch之額外知識補充
A.1 線性代數
A.2 微積分
A.3 深度學習
A.4 PyTorch
原價:
1000
售價:
900
現省:
100元
立即查看
強化動機 承諾改變:動機式晤談實務工作手冊
類似書籍推薦給您
立即查看
運動員增強式訓練解剖精解:強化爆發力、敏捷性、整體運動表現
類似書籍推薦給您
書名:運動員增強式訓練解剖精解:強化爆發力、敏捷性、整體運動表現
作者:Derek Hansen、Steve Kennelly著
出版社:旗標
出版日期:2/11/2019
條碼:9789863125877
內容簡介
喜愛運動的人或是運動員常常希望自己的運動表現能比現在更好,比如說跳得更高一點,起跑速度更快一點,轉換方向更靈活一點... 這些實際運動表現的需求,想靠勤練肌肉或勤練體能根本做不到,唯有採用增強式訓練才能幫助你達成願望。
現階段在各個運動領域的運動科學與技術發展,多把重心放在鼓勵運動員、教練以及運動醫學專家去追求更有效的訓練與監控方式。運動員不只要持續變得更快、更壯並且更有力,還需要能夠同時預防運動傷害。對高層級運動員而言,保持韌性與健康是變強的關鍵,因為一旦錯失任何一次的訓練課表,都會讓運動員很難維持高水準的表現與進步。所以你在選擇、安排與整合訓練動作元素時更要特別注意,才能讓訓練有最好的反應與適應效果。
要讓運動表現進步依賴的並不是什麼神奇的特效藥,而是透過一個完整的訓練計畫,並在適當的時機安排適當的動作與對應的訓練量來達成。就實際生理機轉來說,增強式的動作主要是應用肌肉快速伸展的生理反應,這個生理反應也稱作「伸展收縮循環」或「牽張反射」。研究顯示肌肉在收縮前的快速預伸展,會讓接下來的收縮更快更有力,對肌力、爆發力與速度產生正向加成效果。
舉例來說,籃球員在搶籃板的時候,會先降低身體重心下蹲後再全力跳起搶球。同樣地,排球員在阻止對方殺球時,也會先做一個深蹲後全力跳起攔網。人在做出爆發力動作之前都會有許多類似的蓄力與準備的反射動作。在高爾夫球的揮桿中,一定會先有一個向後延展作用肌群的動作,來增加向前揮擊的力量;棒球投手在本壘強傳之前也少不了先有手臂向後伸展的準備動作。顯然在許多運動項目中都可以看到增強式動作的存在。
作者在本書中分享他們過去針對各種不同專項、不同層級選手所使用的增強式訓練動作,一共包含 94 種,並針對各個動作延伸出 78 個進階變化動作,內容包含雙側訓練、單側訓練、核心訓練以及各種複合式訓練方法,一應俱全。除此之外,所有動作均附詳細的解剖構造圖示,你可了解不同動作下各個肌群與關節之間的相互關係,學習各種變化動作、進階動作與一系列會影響訓練適應、恢復與運動表現的相關因子。本書內容完整涵蓋增強式訓練各個細節,能幫助你找到強化肌力與爆發力最好的訓練方式。精闢圖解讓你更了解動作原理,並進一步增進整體運動表現。
本書特色
・市面上唯一一本訓練爆發力的增強式訓練專書,能增進各體育項目的運動表現。
・包含 94 種增強式訓練動作,並延伸出 78 種進階變化動作。
・以顏色深淺標示每個增強式訓練動作的主要肌群與輔助肌群。
作者介紹
作者簡介
Derek Hansen
Derek Hansen MASc及CSCS認證。於 1988 年開始從事力量、速度與爆發力相關的運動科學研究。最早是一名田徑教練,希望可以幫助各個項目的選手,主要以改善選手動作速度為主。Hansen 做為教練與運動顧問,曾經與許多頂尖運動員如奧運獎牌得主、世界紀錄保持人、加拿大國家隊運動員與專業運動團隊,和不同專項的頂級運動員有合作經驗。曾經在英國哥倫比亞培育出許多短跑選手,現在也仍然和許多世界數一數二快的運動員合作。
Hansen 同時也是美式足球聯盟 NFL、美國職業籃球聯盟 NBA、美國冰上曲棍球聯盟 NHL、美國職棒大聯盟 MLB、美國足球聯盟 MLS、美國大學運動一級聯盟 NCAA Division 1 等機構的運動表現顧問與復健專家。在 2003-2016 年間任職西門菲莎大學的肌力與體能教練。Hansen 在各個工作職位都曾協助非賽季增強式訓練的介入方式與時間點、賽季中肌力維持與傷後回場評估的任務。
Steve Kennelly
Steve Kennelly MEd, ATC, CSCS 認證。曾在紐約美式足球巨人隊醫療團隊服務超過 25 個賽季,現在則擔任該隊的首席助理防護員,在專業領域的表現受到美國美式足球聯盟 2012 年年度最佳防護員的肯定。從 1999 年開始就是巨人隊的防護團隊一員為選手服務。
Kennelly 身兼防護員以及肌力與體能教練,曾經主持過國家美式足球聯盟、職業足球運動聯盟、美國運動傷害防護協會與紐澤西運動防護員工會的醫療專題講座與擔任顧問。2013 年 Kennelly 整合傷害預防、運動表現、傷後復健與生理訓練的專業,成立 Kennelly 運動防護醫學團隊,期許可以教育教練、運動員與家長正確訓練適應由基礎到進階的進程。
譯者簡介
林晉利
國立體育大學運動保健學系/研究所專任副教授
柔道黑帶四段
台灣拳擊武術有氧體適能協會理事長
台灣運動保健協會理事長
台灣合格運動傷害防護師檢定官
美國運動醫學會體適能教練檢定官
美國肌力與體能訓練協會 CSCS 及 CPT 大中華區培訓講師
中華職籃戰神隊體能訓練師
曼谷亞運武術隊體能訓練師
萬明岳
清華大學學士及體大碩士
肌力與體能訓練師
運動傷害防護師
武術專長
目錄
動作索引
第 1 章 增強式訓練的生理機轉
第 2 章 訓練進度、環境與器材
第 3 章 基礎訓練動作
第 4 章 雙側下肢增強式訓練動作
第 5 章 單側下肢增強式訓練動作
第 6 章 上肢增強式訓練動作
第 7 章 核心肌群增強式訓練動作
第 8 章 增強式複合訓練動作
第 9 章 防傷訓練與復健
參考資料
收回
立即查看
強化肌力訓練全書:東大肌力學教授、骨科醫師及福岡軟銀鷹教練,寫給訓練者的科學化鍛鍊指南 (1版)
類似書籍推薦給您
立即查看
後中西醫英文考前衝刺:核心字彙&文法句型(MP3音檔 + 寫作強化加值包線上下載) (1版)
類似書籍推薦給您
學士後中西醫英文備考寶典
一本掌握必考核心字 + 必通文法句型
考前衝刺最有效率!
加強複習有讀就有分!
■ 備考後醫英文,核心單字很重要
單字是英文聽說讀寫的基礎,無論準備何種考試,想要衝高英文分數,累積單字量是首要條件。以後醫近幾年考試的命題趨勢看來,英文科在單字題方面的比重越來越高,尤其是後西醫,單字難度深、考題都偏長,連帶也考驗考生的閱讀能力,而且不僅是單字題,連文法題、閱讀題裡面都有很多直接考單字代換的題目。所以說備考後醫英文,除了平時就必須厚實文法、閱讀能力外,「背好單字的投報率非常高」,真的是一點也不誇張!
本書考量後醫考生之備考需求,精選無論英文程度如何,都應該反覆記背的「專業領域核心字彙」,只要熟習這些必考字就能拿分!另輔以歷年來相關考古題,考生可以在答題中順便熟悉各校命題的方向及試題難易度。
■ 文法:閱讀力的基石
英語是溝通工具,而理解是溝通的前提,英文科的出題方向即是測驗考生的英文理解能力。於是,我們看到英文試題之題幹明顯比過去長,變長的句子意味著每句都是複雜句,不再是一眼就能看懂或猜得出來的簡單句。每句都加長,段落就加長,各段落都加長,文章篇幅就增加了。由此可以預見:提升英文閱讀理解能力是應考的重中之重。而文法既然是一個語言造句所依據的規則,也就能用來破解、正確理解句意,所以學習文法對提升理解力是十分重要的。
本書也精選了許多重要的英文句型及文法觀念,並輔以考古題配合學習。對於文法基礎不錯的考生,它是一本非常適切的重點複習口袋書;對於文法差的考生,它會有效填補文法觀念的不足,在應考時不至於盲目猜答案。
【本書特色】
★ 從後醫歷屆考古題中精選 530 組考生必備專業領域字及其相關衍生字,只要熟習這些必考字就能拿分!
★ 彙整 65 個重要句型和文法觀念,考前重點複習,有效補強文法弱點。
★ 字彙及文法句型皆搭配考古題應證,考生可在答題過程中熟悉各校命題方向及試題難易度。
★ 雲端專屬加碼送!寫作加值資源協助改正文法錯誤、中式英文等寫作痛點,優化句子強化寫作力。
★ 口袋書設計,方便攜帶、隨時隨地聽學,輕鬆為後醫考試做足準備。
立即查看