核心開發者親授!PyTorch深度學習攻略 (1版)
其他會員也一起購買
核心開發者親授!PyTorch深度學習攻略
系列名:Learning by doing 從做中學系列
ISBN13:9789863126737
出版社:旗標出版社
作者:Eli Stevens;Luca Antiga;Thomas Viehmann
裝訂/頁數:平裝/656頁
規格:23cm*17cm*3.2cm (高/寬/厚)
版次:1
出版日:2021/07/23
中國圖書分類:特殊電腦方法
內容簡介
【PyTorch官方唯一推薦教材!】
深度學習是近年來非常夯的一個領域,發展的速度也十分的驚人。曾經,深度學習的函式庫五花八門,各自都具備了一定的重要性。如今,使用者開始往兩大函式庫,PyTorch及Tensorflow靠攏,進而鞏固了它們的地位。在2018年以前,Tensorflow在國際學術頂尖會議中的論文引用率都遠超PyTorch。自2019年起,PyTorch就奮起直追,越來越受到學者們的喜愛。在ICLR 2020和CVPR 2020會議中,使用PyTorch的論文數已超越Tensorflow。由此可見,掌握PyTorch,是勢在必行的!
PyTorch最為人稱道就是語法和Python相近,一樣簡潔好學,與Numpy、Pandas函式庫的相容性也很好,並支援動態運算圖(dynamic computational graph),有助於模型的優化,對記憶體的使用也非常有效率。本書作者為PyTorch核心開發者,深知PyTorch的強大之處,並擁有豐富的深度學習經驗,將帶你從無到有,利用PyTorch建構出深度學習模型,並用其來解決現實問題的能力。
與其他深度學習框架書相比,本書的最大特色為:利用數個章節來實作肺癌偵測專案。在實作該專案的過程中,你可以實際體會到如何充分把所學應用出來,並針對過程中所遇到的問題來找出解方。更重要的是,作者的寶貴經驗會讓你少走許多彎路,快速培養實戰能力!
閱讀完本書後,你將了解:
★深度學習的基本資料結構:張量(tensor)
★如何實作模組及損失函數
★如何從PyTorch Hub中載入預先訓練的模型
★在有限的資料下,訓練模型的方法
★分析測試結果,並找出現有模型中的問題
★透過擴增資料等方法,提高模型的表現
如果你對深度學習非常有熱忱,並且已經具備一定的Python能力,願意跟著書中內容動手嘗試,那你就是本書最適合的讀者!
本書特色
◎作者為PyTorch核心開發者,能以更全面的視角來進行教學
◎實作內容豐富,花費大量篇幅處理肺癌偵測專案
◎時刻提點實作專案時可能遇到的陷阱,讓讀者少走彎路
◎各章節的內容皆搭配程式範例,讀者可實際演練來加深印象
◎本書由施威銘研究室監修,書中針對原書進行大量補充,並適當添加註解,幫助讀者更好地理解內容
專家推薦
●Soumith Chintala,PyTorch 共同開發者 & Facebook AI Research 研究員:
『這本書出版後,我們終於有了關於 PyTorch 的權威著作,它具體地說明了基礎的知識和概念。』
●Mathieu Zhang,NVIDIA 深度學習技術經理:
『將深度學習切割成易於讀者消化的區塊,再以程式範例作為輔助。』
●Philippe Van Bergen,PÇ Consulting 雲端架構師:
『具及時性、實務性及透徹性的一本書。你應該把它放在你的電腦旁,而不只是把它放在書架上。』
●Orlando Alejo Méndez Morales,Experian 軟體分析師:
『這本書提供了非常實用的深度學習概述,適合做為教學資源。』
目錄
★第一篇 PyTorch的核心
☆第1章:深度學習與PyTorch函式庫
1-1 深度學習的演變
1-2 將PyTorch應用到深度學習中
1-3 為什麼要使用PyTorch?
1-4 PyTorch如何協助深度學習專案的開發
1-5 軟硬體需求
☆第2章:預先訓練的模型
2-1 利用預先訓練的模型來辨識圖像中的物體
2-2 利用預先訓練的模型來生成『假』圖片
2-3 能描述場景的神經網路模型
2-4 Torch Hub
2-5 結論
☆第3章:介紹張量
3-1 浮點數的世界
3-2 張量:多維陣列
3-3 利用索引值操作張量
3-4 為張量命名
3-5 張量的元素型別
3-6 其他常用的張量功能
3-7 張量的儲存原理
3-8 大小 、偏移及步長
3-9 把張量移到GPU上
3-10 與NumPy的互通性
3-11 通用的張量(可適用於各種硬體)
3-12 將張量序列化(長期儲存)
3-13 結論
☆第4章:用張量表示現實中的資料
4-1 圖片資料
4-2 3D立體圖片資料
4-3 表格資料
4-4 時間序列資料
4-5 表示文字資料
4-6 結論
☆第5章:學習的機制
5-1 學習的流程
5-2 學習就是在估算參數
5-3 以降低損失為目標
5-4 梯度下降演算法
5-5 用PyTorch的autograd進行反向傳播
5-6 結論
☆第6章:使用神經網路來擬合資料
6-1 神經元
6-2 PyTorch的nn模組
6-3 進入正題:神經網路
6-4 結論
☆第7章:從圖片中學習
7-1 由小型圖片組成的資料集
7-2 區分鳥和飛機
7-3 結論
☆第8章:卷積神經網路
8-1 關於卷積
8-2 卷積的實際應用
8-3 建立nn.Module的子類別
8-4 訓練卷積網路
8-5 模型設計的進階技巧
8-6 結論
★第2篇 從現實世界中的圖片學習:肺部腫瘤偵測專案
☆第9章:利用PyTorch對抗癌症
9-1 應用實例的介紹
9-2 為大型專案做準備
9-3 CT掃描到底是什麼?
9-4 專案概述:肺部腫瘤偵測器
9-5 結論
☆第10章:匯入原始資料並整合為資料集
10-1 原始CT資料
10-2 分析LUNA的標註資料
10-3 匯入CT掃描資料
10-4 定位結節
10-5 簡單的資料集實作
10-6 結論
☆第11章:訓練模型分辨結節的真假
11-1 最基礎的模型與訓練迴圈
11-2 程式的進入點
11-3 訓練前的設定與初始化
11-4 我們的首個神經網路
11-5 模型的訓練與驗證
11-6 輸出表現評估資料
11-7 執行訓練程式
11-8 評估模型表現:得到99-7%的分類準確率就代表結束了嗎?
11-9 使用TensorBoard畫出訓練評估指標
11-10 為什麼模型沒有學會偵測結節?
11-11 結論
☆第12章:利用評估指標和資料擴增來改善訓練成效
12-1 模型改善的大方向
12-2 偽陽性與偽陰性
12-3 陽性與陰性的視覺化描述
12-4 理想的資料集長什麼樣子?
12-5 過度配適
12-6 利用資料擴增來防止過度配適
12-7 結論
...
原價:
1000
售價:
900
現省:
100元
立即查看
機率與統計推論學習要訣 (4版)
其他會員也一起購買
機率與統計推論學習要訣
ISBN13:9789862698846
出版社:高點文化
作者:劉明昌
裝訂/頁數:平裝/776頁
規格:23cm*17cm*3cm (高/寬/厚)
版次:1
出版日:2021/12/20
中國圖書分類:基礎工程學
內容簡介
本書特色
機率與統計推論在許多領域有很多的應用,如隨機過程、通訊、可靠度分析等,不管是數學系或電類、商學的學生,都須有紮實的機率與統計推論基礎。為了讓這些學生能有效研讀,本書在編寫上具有如下特色:
1.以過來人的觀點,藉由親切的文字描述(數學以母語學習)以消除讀者學習上之恐懼。
2.強調應用,從工程師的觀點將一般抽象的機率理論,應用到相關科目或電子元件皆有詳盡描述。
3.將各研究所歷屆漂亮考題(作者已經翻成中文!)納入本書範例中詳盡解說,使讀者在面對各類考試時能游刃有餘。
第一章 古典機率
§1-0 什麼是機率
§1-1 排列與組合
§1-2 基本定義
§1-3 機率之計算
§1-4 條件機率
§1-5 貝氏定理
§1-6 期望值與方差
§1-7 考題說明
第二章 隨機變數
§2-1 隨機變數之觀念
§2-2 累積分布函數
§2-3 離散型隨機變數
§2-4 連續型隨機變數
§2-5 均值與方差
§2-6 動差
§2-7 動差產生函數
§2-8 考題說明
第三章 離散型機率分布
§3-1 白努利分布(兩點分布)
§3-2 二項分布
§3-3 波松分布
§3-4 幾何分布
§3-5 負二項分布、超幾何分布
§3-6 離散型隨機變數之函數
§3-7 考題說明
第四章 連續型機率分布
§4-1 均勻分布
§4-2 常態分布與對數常態分布
§4-3 指數分布
§4-4 Gamma分布與卡方分布
§4-5 Beta分布
§4-6 韋柏分布與萊利分布
§4-7 連續型隨機變數之函數
§4-8 隨機變數之電腦模擬
§4-9 考題說明
第五章 多隨機變數
§5-1 聯合機率函數
§5-2 獨立性與條件分布
§5-3 聯合動差母函數
§5-4 ?隨機變數之坐標變換
§5-5 協方差與相關係數
§5-6 多維常態分布
§5-7 在科學之應用
§5-8 考題說明
第六章 隨機數列
§6-1 獨立隨機變數之和
§6-2 謝比雪夫不等式
§6-3 大數定律與中央極限定理
§6-4 隨機和
§6-5 考題說明
第七章 抽樣,估計,假設檢定
§7-1 抽樣與抽樣分布
§7-2 參數估計
§7-3 信賴區間
§7-4 假設檢定
第八章 隨機程序
§8-1 隨機程序之觀念
§8-2 隨機程序之分布函數
§8-3 功率頻譜密度函數
附錄A:標準常態分布數值表
附錄B:各種機率密度函數之數字特徵
附錄C:離散型隨機變數之PMF與mgf
附錄D:連續型隨機變數之PDF與mgf
立即查看
資料科學的建模基礎:別急著coding!你知道模型的陷阱嗎?
其他會員也一起購買
內容簡介
會coding並不代表會建模!
你是否曾經有以下問題:
「如何評估模型的適用性?」
「有人說模型參數越多越不好?」
「各種模型的差異以及特色是什麼?」
「有人說模型好壞不能只看預測精確率?」
「要選哪一種模型比較適合手上的資料?」
這本書,將帶你釐清以上所有疑惑,以及你心中更多問不出來的問題!
市面上有很多優質的書籍,可以將建模工具(如:TensorFlow、Keras、PyTorch 等框架)鉅細靡遺地操作一遍;或是涵蓋許多數學、統計學的學理面,完美展現漂亮的數學式。但仍舊會讓人有隔靴搔癢、似懂非懂的感覺。再加上資料科學應用在不同領域,如工程學、物理學、化學、生物學、生態學、哲學、或是經濟學,產生大量令人混淆的知識、名詞。因此,過去那種單點突破式的學習歷程,已經不足以應付當代資料科學家的養成。
想要在這混亂的資料科學領域裡脫穎而出,關鍵就在於你需要有見樹也見林的通盤觀念:以「模型」為中心,將相關的數學、統計知識環繞在這個中心,做一個通盤的介紹;接著,以俯視的角度,來抓住各領域常用模型之間的關聯,並說明許多技術本質上是殊途同歸;最後,我們即可探討現實中不同問題的分析方式,以及實務上建模需要注意的事情。
本書將會講解與模型相關的機率、統計、微分方程、自我迴歸、狀態空間、馬可夫鏈等觀念;並且比較隨機森林、支援向量機(SVM)、神經網路、深度學習、自編碼器、強化式學習、多體系統等各種不同模型的優劣;最後討論貝氏推論、最大後驗估計、費雪三原則、訊息準則、概似比檢驗等如何應用在實際建模的過程。
中文版提供免費Python程式下載,讓讀者可以實際演練書中的範例,加深對知識的理解。
本書用宏觀的角度,來解述資料分析數學模型,讓你徹底了解資料分析過程中,不可或缺的「數學模型」。有了這本書,你將會掌握當代數學模型的基本精神,讓你在未來的研究或工作上,可以更順利。
本書特色
● 改變傳統一直寫程式的教學,帶你回到資料科學最根本的觀念
● 俯視資料科學的各種技術,掌握模型的特性跟陷阱
● 底線標示重要觀念,粗體標示重要名詞,註解提供讀者延伸資訊
● 滿滿全彩圖說,每章結束附有重點整理,中文版附贈範例程式
目錄
序言
第一篇 何謂數學模型
第1章 資料分析與數學模型
1.1 資料分析
1.2 數學模型的作用
第2章 數學模型的組成元素與類型
2.1 變數、數學結構、參數
2.2 數學模型與自然科學的基礎理論
2.3 理解導向建模與應用導向建模
2.4 理解導向建模
2.5 應用導向建模
2.6 數學模型的限制與適用範圍
第二篇 基礎數學模型
第3章 由簡單方程式建構而成之模型
3.1 線性模型(Linear Model)
3.2 實驗公式與曲線擬合
3.3 最佳化問題(Optimization Problem)
第4章 由基本微分方程式建構而成之模型
4.1 可求解的微分方程式模型
4.2 非線性微分方程式模型
4.3 可求解之模型和不可求解之模型
4.4 控制理論(Control Theory)
第5章 機率模型
5.1 隨機過程(Stochastic Process)
5.2 馬可夫過程(Markov Process)
5.3 排隊理論
第6章 統計模型
6.1 常態分佈
6.2 統計檢定
6.3 迴歸分析
第三篇 進階數學模型
第7章 時間序列模型
7.1 時間序列資料之結構
7.2 使用可觀測變數之模型
7.3 狀態空間模型(State Space Model)
7.4 他種類的時間序列分析法
第8章 機器學習(Machine Learning)模型
8.1 機器學習使用的模型與處理的問題特徵
8.2 分類(Classifification)、迴歸問題(Regression)
8.3 分群
8.4 降維(Dimensionality Reduction)
8.5 深度學習(Deep Learning)
第9章 強化式學習(Reinforcement Learning)模型
9.1 以強化式學習做為行為模型
92 以強化式學習進行機器學習
第10章 多體系統模型(Many-body System) 模型
10.1 從微觀到宏觀
10.2 各種集體現象模型
10.3 交互作用的網路
第四篇 建立數學模型
第11章 決定模型的因素
11.1 數學模型的性質
11.2 理解導向建模的要點
11.3 應用導向建模的要點
第12章 設計模型
12.1 變數的選擇
12.2 資料取得與實驗設計
12.3 數學結構與參數的選擇
12.4 避免建模錯誤
第13章 參數估計
13.1 根據目的進行參數估計
13.2 參數估計中目標函數的最小化
13.3 貝氏推論(Bayesian Inference)與貝氏建模(Bayesian Modeling)
第14章 評估模型
14.1 什麼是「好的模型」?
14.2 分類準確率之指標
14.3 訊息準則(Information Criterion)
14.4 與虛無模型(Null Model)的比較與概似比檢驗(Likelihood Ratio Test)
14.5 交叉驗證(Cross-Validation)
後記
立即查看
機器學習的統計基礎:深度學習背後的核心技術
其他會員也一起購買
機器學習的統計基礎:深度學習背後的核心技術
ISBN13:9789863126744
出版社:旗標出版社
作者:黃志勝
裝訂/頁數:平裝/432頁
規格:23cm*17cm*2.5cm (高/寬/厚)
版次:1
出版日:2021/11/15
中國圖書分類:特殊電腦方法
內容簡介
「作者在上市 IC 公司上班,每天面對 real world problems。探索如何建立輕量深度學習網路以及發展更有效率的學習方式是他每天的工作。這是一本學理及實務兼具的好工具書。」 - 中央研究院資訊科學研究所所長 廖弘源博士 推薦
[搭起 AI 與統計的橋樑]
原本統計學與人工智慧是兩個完全不同的領域,然而兩者在近代都有了新的發展進而產生連結。在人工智慧中導入機率與統計的觀念,讓電腦具有自己找出數據之間的關聯性並試圖解決問題的能力,因而出現機器學習 (machine learning) ,再加上電腦計算能力的大幅提升,解決多層類神經網路和大數據之間聯繫性的可能,進而衍生出現今最熱門的深度學習 (deep learning)。
不過,大部分電腦相關科系出身的人並不熟悉統計學,因此在更上一層樓的時候容易遇到障礙。有鑒於此,小編在推出《機器學習的數學基礎》(天瓏專業書店年度暢銷第一名) 一書之後,就積極開發 AI 與統計學相關的書籍。在尋尋覓覓之後請到擅長統計與機器學習的黃志勝博士出馬撰寫《機器學習的統計基礎》,首要之務就是讓讀者不要視統計為畏途,因此在書中設計大量範例以降低學習難度,務求讀得懂、做得出來才容易吸收,進而搭好統計與機器學習的橋樑。如果自覺數學已經還給老師了也不用擔心,可以將本書搭配《機器學習的數學基礎》一併完整學習。
[學會統計,由混亂到清晰]
本書從讀者在高中就學過的集合與機率論開始,帶您快速複習一遍,並將容易混淆之處多多舉例說明,並將以前似懂非懂的隨機變數、機率分布等觀念再解釋得更清楚。接下來就進入專有名詞特別多的統計學,這也是造成許多人暈頭轉向之處。特別是樣本估計、信賴區間、顯著水準、信心水準、t-分布、假設檢定...等讓人一個頭兩個大的主題,更是務求清楚明瞭。當然本書不可能把完整的統計學全都搬進來,此處只介紹機器學習、深度學習需要用到的統計基礎知識,縮短您的學習時間。
然後就進入機器學習的重頭戲,從資料前處理到迴歸、分類模型的建立,以及當數據的特徵數過多時的 PCA、LDA 統計降維法。從類神經網路開始進入深度學習的範疇,包括前向傳遞、梯度下降法與倒傳遞學習法的手算實作,幫助讀者一步步建立深度學習的演算邏輯,並利用參數常規化解決模型過擬合 (over-fitting) 的問題。最後,導入模型評估,例如二元、多元分類模型評估指標、迴歸模型評估指標、4 種交叉驗證的方法,做為判斷模型好壞的參考依據。
相信讀者認真看完本書後,一定能建立起機器學習結合統計學的硬底子。當然這只是開端,期望讀者以本書為基石繼續前行。
本書特色
1. 打好機率與統計的基礎,快速釐清讓人容易暈頭轉向的統計理論。
2. 藉由大量範例說明,務求讀得懂、做得出來,才容易吸收。
3. 作者提供專屬讀者天地,以及機器學習方面的文章供後續學習。
目錄
第 1 章 機器與深度學習常用的數學基礎
1.1 數值資料表示方式
1.1.1 純量 (scalar)
1.1.2 向量 (vector)
1.1.3 矩陣 (matrix)
1.1.4 張量 (tensor)
1.2 向量與矩陣運算
1.2.1 向量和純量相乘
1.2.2 向量相乘
1.2.3 矩陣相乘
1.2.4 Hadamard 乘積
1.2.5 逆矩陣 (反矩陣)
1.3 矩陣分解
1.3.1 特徵分解 (Eigenvalue decomposition)
1.3.2 奇異值分解 (SVD)
第 2 章 機器學習相關機率論
2.1 集合
2.2 隨機試驗與樣本空間
2.2.1 隨機試驗範例
2.2.2 隨機試驗與公正與否
2.3 事件
2.3.1 基本事件與複合事件
2.3.2 事件空間
2.4 事件的機率
2.4.1 事件機率三大公理
2.4.2 事件機率相同的例子
2.4.3 事件機率不同的例子
2.4.4 事件機率運算規則
2.5 條件機率與貝氏定理
2.5.1 條件機率
2.5.2 貝氏定理
2.5.3 統計獨立
2.6 隨機變數
2.6.1 隨機變數的類型
2.6.2 多維隨機變數
2.7 機率分布與機率密度函數
2.7.1 機率分布
2.7.2 數位化都是離散型的隨機變數
2.7.3 一維機率密度函數
2.7.4 多維機率密度函數 (聯合機率密度函數)
2.7.5 邊際機率密度函數
2.8 機器學習常用到的統計機率模型
2.8.1 伯努利分布 (Bernoulli Distribution)
2.8.2 二項分布 (Binomial Distribution)
2.8.3 均勻分布 (Uniform Distribution)
2.8.4 常態分布 (Normal Distribution)
第 3 章 機器學習常用的統計學 (一)
3.1 資料結構分類
3.1.1 「正確的資料」與「好品質的資料」
3.1.2 結構化資料
3.1.3 非結構化資料
3.1.4 半結構化資料
3.2 將統計量作為資料的特徵表徵
3.2.1 期望值
3.2.2 各階中心動差
3.2.3 相關係數與共變異數
3.2.4 共變異數矩陣
第 4 章 機器學習常用的統計學 (二)
4.1 母體與樣本估計
4.1.1 樣本統計量與抽樣分布
4.1.2 樣本平均數的期望值等於母體平均數
4.1.3 樣本變異數的期望值等於母體變異數
4.1.4 小結
4.2 信賴區間
4.2.1 信賴區間與顯著水準、信心水準的關係
4.3 母體為常態分布的區間估計
4.31 常態分布的特性
4.3.2 將常態分布標準化:z-score
4.3.3 標準常態分布平均值的區間估計
4.3.4 每次抽樣都有不同的信賴區間
4.3.5 信賴區間的用途
4.4 自由度 (Degree of Freedom)
4.5 t-分布 (t-distribution)
4.5.1 t 值 (t-score):母體為常態,但標準差未知的情況
4.5.2 t 值與 z 值的關係
4.5.3 t-分布:隨機變數 t 的機率分布
4.6 抽樣數的選擇
4.6.1 母體數有無限個的情況
4.6.2 有限母體數的修正
4.7 假設檢定
4.7.1 假設檢定的預備知識
4.7.2 虛無假設、對立假設
4.7.3 檢定虛無假設成立的機率
4.7.4 計算橫軸上的 t 值
4.7.5 計算 p 值
第 5 章 機器學習常用的資料處理方式
5.1 資料標準化
5.1.1 Z 值標準化
5.1.2 Min-max 正規化
5.2 資料縮放
5.3 非線性轉換
5.3.1 對數函數能將數值範圍縮小
5.3.2 指數函數將數值轉換到特定範圍
5.3.3 非線性轉換較少用於資料前處理的原因
5.4 類別變數編碼
5.4.1 One-hot encoding
...
立即查看
資料科學的統計實務:探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步 (1版)
其他會員也一起購買
很多資料科學、機器學習的書,內容充滿各種建模的技術展示、完美的案例分析,卻忘記了更重要的「資料」。唯有掌握好手中的資料,才是機器學習成功建模的第一步。
無法了解資料,深度學習也救不了你;相反的,正確蒐集資料,輕鬆建模沒煩惱。
如何了解資料?當然要從統計觀念開始。學習統計一定都要看抽象複雜的數學嗎?並不是!本書所使用的範例,會告訴大家「為什麼統計學要如此定義」、「為什麼技巧要那樣使用」。當讀者了解統計背後的觀念時,才不會迷失在複雜的數學。此外,有別於一般市售書籍總是用漂亮案例展示程式運行結果,此書用相當多的範例都是「專家也會犯的錯誤」,相信讀者同時學習成功以及失敗的案例後,可以更全面地了解資料科學的分析流程觀念。
本書會介紹資料分析中的許多技術的基本觀念,如變異數分析、偏相關係數、自相關函數、Bonferroni校正、Holm校正、隨機對照試驗、斷點迴歸分析、傾向評分匹配、T檢定、F檢定、分層多階段抽樣法等,介紹的過程中會直擊分析技術的思維,而非僅展示漂亮的數學。
本書亦會說明身為資料科學家該有的素養,來避免確認偏誤、倖存者偏誤、選擇偏誤、發表偏誤、自願者偏誤、可得性偏誤、樂觀偏誤、常態偏誤、後此謬論、賭徒謬誤、辛普森謬論、p-hacking、HARKing、單方論證、霍桑效應、畢馬龍效應等資料分析中可能踩到的陷阱。
目錄
序言
第一篇 資料特性的相關知識
第1章 測量其實並非易事
1.1 測量資料
1.2 測量的難處
1.3 測量誤差之外的誤差
第2章 資料誤差
2.1 測量標準的選擇
2.2 問卷帶來的問題
2.3 抽樣母體誤差
2.4 沒觀測誤差
2.5 回答者帶來的問題
2.6 發表偏誤(Publication Bias)
第3章 測量誤差中的隨機誤差 (Random Error) 與偏誤 (Bias)
3.1 測量誤差(Measurement Error)的分析
3.2 誤差與機率分佈(Probability Distribution)
3.3 機率分佈的相關知識
3.4 處理隨機誤差 (Random Error)
第4章 資料抽樣方法論
4.1 抽樣的概念
4.2 抽樣的方法
第二篇 資料分析的相關知識
第5章 資料分析的基本流程
5.1 檢查手中資料
5.2 正確分析資料
5.3 妥善管理資料
第6章 干擾因子(Confounding Factor)與因果關係
6.1 兩個變數之間的關聯
6.2 面對並處理干擾因子(Confounding Factor)
6.3 無法使用隨機對照試驗(Randomized Controlled Trial)的處理方式
第7章 單一變數的分析手法
7.1 探討敘述統計量 (Descriptive Statistics)
7.2 探討資料分佈
7.3 探討理論分佈
7.4 探討時序資料
第8章 探究變數之間的關係 – 假設檢定(Hypothesis Testing)、檢定三步驟、手法選擇、相關係數、效應大小(Effect Size)
8.1 比較兩個變數的數值
8.2 關於假設檢定的思維
8.3 研究兩個變數的相關性
第9章 解讀多變數資料
9.1 探索分析與多重檢定
9.2 變異數分析(Analysis of Variance)與多重比較
9.3 探究相關結構
9.4 分析方法整理
第10章 數學模型的要點
10.1 簡介數學模型
10.2 配合目標來建立模型
10.3 使用模型進行預測(Prediction)
第三篇 資料活用的相關知識
第11章 分析資料的陷阱
11.1 資料操作時容易遇到的陷阱
11.2 資料有限時容易遇到的陷阱
11.3 資料推論時容易遇到的陷阱
第12章 解讀資料的陷阱
12.1 分析結果的可信度
12.2 解讀資料的認知偏誤
第13章 運用資料的陷阱
13.1 依不同目標做出評估跟決策
13.2 獲取資料的實際考量
13.3 現實世界與資料分析的差異
立即查看
人工智慧:智慧型系統導論3/e (3版)
相關熱銷的書籍推薦給您
書名:人工智慧:智慧型系統導論(第三版)
作者:李聯旺
出版社:全華
ISBN:9789862800959
立即查看
圖解機器學習與資料科學的數學基礎|使用Python (1版)
類似書籍推薦給您
內容簡介
搞懂不會背叛你的數學,進一步提升你的程式功力!
本書透過圖表解說人工智慧與資料科學領域的相關數學知識,並告訴你如何將其轉換為程式碼,除了可以吸收關於數學的知識之外,也能立即運用在工作上。
透過機率統計的學習,了解如何改善業務流程
本書將AI與資料科學的相關數學知識分成四大篇,第一篇的「機率統計、機器學習篇」介紹的是了解工作情況,篩選出必要資訊的流程,以及位於這個流程背後的機率統計、機器學習的數學知識。能掌握工作情況就能知道該如何改善相關業務,也能進一步觀察未來的變化。
了解最佳化的步驟,學會職場所需的最佳化流程
第二篇「數理最佳化篇」介紹最佳化業務的流程,以及解決業務問題的方法。要最佳化業務,就必須先了解哪些部分需要改善效率,換言之,最佳化的重點在於找出問題。了解最佳化的步驟與問題的種類,就能學會工作職場所需的最佳化流程。
透過預測病毒的傳播模式,了解相關的數學理論
第三篇「數值模擬篇」則以傳染染病的傳播為主題,學習預測這類傳播模式的微分。只要了解微分,就能了解病毒的傳播模式,也能利用動畫說明傳播模式與製作出臨場感十足的簡報。最後的「深度學習篇」則會先說明近年來發展神速的深度學習技術原理,再說明這些原因都於哪些技術或職場應用。
來自讀者的讚譽
「這是我買過最實用的書」
「這本書可以讓你知道如何將數學應用在現實世界的工作之中」
「這本書拯救了文科出身,在工作上又不得不面對數學的我」
目錄
序章|設定 Python開發環境
第一篇機率統計、機器學習篇
第1章|取得資料之後的第一件事
第2章|試著利用機器學習進行分析
第3章|推測必需的資料筆數
第二篇 數理最佳化篇
第4章|透過最佳路徑規劃問題,了解解決最佳化問題的方法
第5章|透過排班問題了解最佳化問題的全貌
第三篇 數値模擬篇
第6章|試著預測傳染病的影響
第7章|試著透過動畫模擬人類的行為
第四篇 深度學習篇
第8章|了解深度學習辨識影像的方法
第9章|了解深度學習處理時間序列資料的機制
第10章|了解以深度學習進行的圖片處理與語言處理
Appendix 程式設計與數學之間的橋梁
Appendix 1|利用公式了解常態分佈
Appendix 2|微分方程式差分法造成的誤差與泰勒展開式
Appendix 3|非線性最佳化的機械學習/深度學習的迴歸/分類
立即查看
練好機器學習的基本功:用Python進行基礎數學理論的實作
類似書籍推薦給您
立即查看
萬顆GPU的訓練:分散式機器學習 — 系統工程與實戰 (1版)
類似書籍推薦給您
【簡介】
*分散式機器學習機礎,包括資料、模型、管線的並行
*集合通訊的重要性、參數伺服器PS-Lite
*PyTorch DataParalle、PyTorch DDP的基礎及動態邏輯
*Uber Horovod的原理及實作
*GPipe、PyTorch的管線並行及PipeDream基礎架構及實作
*Megatron原理及實作、PyTorch的模型並行原理實作
*分散式運算的最佳化器
*TensorFlow的分散式環境,靜態架構、動態邏輯
*分散式架構的策略基礎、MirroredStrategy、ParameterServerStrategy
本書書以PyTorch為主體講解,從系統和實踐的角度對分散式機器學習進行整理。
包括了第1篇分散式基礎,介紹了分散式機器學習的基本概念、基礎設施,以及機器學習並行化的技術、框架和軟體系統,然後對集合通訊和參數伺服器PS-Lite進行了介紹。
第2篇介紹資料並行,將計算負載切分到多張卡上,實作為PyTorch及Horovod。
第3篇介紹模型並行,主要說明了張量模型並行及管線模弄並行,讓模型可以放入多節點上。
第4篇NVIDIA Megatron進行分析,講解如何進行層內分割模型並行,然後學習PyTorch如何支援模型並行。
第5篇則是將全書的內容用TensorFlow實作,讓已經熟悉TensorFlow的使用者不必重新學習新的框架。
【目錄】
第1篇 分散式基礎
第1章 分散式機器學習
1.1 機器學習概念
1.2 機器學習的特點
1.3 分散式訓練的必要性
1.4 分散式機器學習研究領域
1.5 從模型角度看如何並行
1.6 從訓練併發角度看如何並行
1.7 分散式機器學習程式設計介面
1.8 PyTorch分散式
1.9 總結
第2章 集合通訊
2.1 通訊模式
2.2 點對點通訊
2.3 集合通訊
2.4 MPI_AllReduce
2.5 Ring All-Reduce
第3章 參數伺服器之PS-Lite
3.1 參數伺服器
3.2 基礎模組Postoffice
3.3 通訊模組Van
3.4 代理人Customer
3.5 應用節點實現
第2篇 資料並行
第4章 PyTorch DataParallel
4.1 整體說明
4.2 範例
4.3 定義
4.4 前向傳播
4.5 計算損失
4.6 反向傳播
4.7 總結
第5章 PyTorch DDP的基礎架構
5.1 DDP總述
5.2 設計理念
5.3 基礎概念
5.4 架構和初始化
第6章 PyTorch DDP的動態邏輯
6.1 Reducer類別
6.2 前向/反向傳播
第7章 Horovod
7.1 從使用者角度切入
7.2 horovodrun
7.3 網路基礎和Driver
7.4 DistributedOptimizer
7.5 融合框架
7.6 背景執行緒架構
第3篇 管線並行
第8章 GPipe
8.1 管線基本實現
8.2 梯度累積
8.3 Checkpointing
第9章 PyTorch管線並行
9.1 如何劃分模型
9.2 切分資料和Runtime系統
9.3 前向計算
9.4 計算依賴
9.5 平行計算
第10章 PipeDream之基礎架構
10.1 整體想法
10.2 profile階段
10.3 計算分區階段
10.4 轉換模型階段
第11章 PipeDream之動態邏輯
11.1 Runtime引擎
11.2 通訊模組
11.3 1F1B策略
第4篇 模型並行
第12章 Megatron
12.1 設計想法
12.2 模型並行實現
12.3 如何設置各種並行
12.4 Pipedream的管線刷新
第13章 PyTorch如何實現模型並行
13.1 PyTorch模型並行
13.2 分散式自動求導之設計
13.3 RPC基礎
13.4 上下文相關
13.5 如何切入引擎
13.6 自動求導引擎
第14章 分散式最佳化器
14.1 原生最佳化器
14.2 DP的最佳化器
14.3 DDP的最佳化器
14.4 Horovod的最佳化器
14.5 模型並行的分散式問題
14.6 PyTorch分散式最佳化器
14.7 PipeDream分散式最佳化器
第5篇 TensorFlow分散式
第15章 分散式運行環境之靜態架構
15.1 整體架構
15.2 Server
15.3 Master的靜態邏輯
15.4 Worker的靜態邏輯
第16章 分散式運行環境之動態邏輯
16.1 Session機制
16.2 Master動態邏輯
16.3 Worker動態邏輯
16.4 通訊機制
第17章 分散式策略基礎
17.1 使用TensorFlow進行分散式訓練
17.2 DistributedStrategy基礎
17.3 分散式變數
第18章 MirroredStrategy
18.1 MirroredStrategy集合通訊
18.2 MirroredStrategy分發計算
第19章 ParameterServerStrategy
19.1 ParameterServerStrategyV1
19.2 ParameterServerStrategyV2
19.3 ClusterCoordinator
原價:
1280
售價:
1152
現省:
128元
立即查看