【簡介】 作者完美呈現監管單位觀點、風險管理、可解釋性與其他諸多主題的概觀,同時提供實務建議與程式碼範例。」 —Christoph Molnar Interpretable Machine Learning作者 「使用獨特戰術處理方式,解決ML系統風險,讓本書脫穎而出。透過細微差異的處理降低ML風險,為讀者提供寶貴資源,以負責任又可持續的方式成功佈署ML系統。」 —Liz Grennan Digital Trust, McKinsey&Company初級合夥人暨全球事務共同領導者 過去十年,見證了人工智慧與機器學習(AI/ML)技術的廣泛採用。然而,疏於監督這些廣泛實施的技術,導致原本可由適切風險管理來避免的事故與不良後果。在認識AI/ML真正的好處前,從業人員必須瞭解如何降低風險。 本書說明負責任AI的處理方式:建立在風險管理、資安、資料隱私上,並套用社交科學的最佳實作,提升AI/ML技術、商業程序與文化能力的完整框架。作者Patrick Hall、James Curtis與Parul Pandey創作了這本指南,以期能協助企業、客戶與大眾改善真實世界AI/ML系統結果的資料科學家。 ‧學習完整涵蓋可解釋性、模組驗證與除錯、偏見管理、資料隱私與ML安全性的負責任AI技術處理 ‧學習如何建立成功的、有影響力的AI風險管理實作 ‧對採用AI技術的現有標準、法律與評估方式有基本瞭解,包括近期的NIST AI Risk Management Framework ‧使用GitHub與Colab的互動式資源 【目錄】 前言 第一部 AI風險管理理論與實務應用 第一章 當代機器學習風險管理 第二章 可詮釋性與可解釋性機器學習 第三章 機器學習系統的安全與效能除錯 第四章 機器學習偏差管理 第五章 機器學習安全性 第二部 AI 風險管理付諸實現 第六章 可解釋增強機與解釋XGBoost 第七章 解釋PyTorch 影像分類器 第八章 XGBoost 模型的選擇與除錯 第九章 PyTorch 影像分類除錯 第十章 使用XGBoost 測試與補救偏差 第十一章 XGBoost 紅隊演練 第三部 結論 第十二章 如何實現高風險機器學習目標 索引
還沒有人留下心得,快來搶頭香!
為您推薦
類似書籍推薦給您
【簡介】 從標註到資料科學的人類監督 掌握訓練資料的訣竅,提升AI專案成功率 「本書以全方位的視角解說如何產生高品質的訓練資料以及啟動新專案。」 — Anirudh Koul Pinterest機器學習、資料科學負責人 「要做好機器學習,必須學習如何訓練資料。本書的價值比黃金還要珍貴。」 — Neal Linson InCite Logix首席資料與分析長,LLM超級明星 您的訓練資料對於資料專案的成功與否與演算法本身一樣重要,因為人工智慧系統的大多數失敗都與訓練資料有關。儘管訓練資料是成功的人工智慧與機器學習的基礎,但鮮少有全面的資源可以幫助您掌握這一過程。 在這本實用指南中,作者Anthony Sarkis(Diffgram AI訓練資料軟體的首席工程師)向技術專業人員、管理者和相關領域專家展示如何處理和擴展訓練資料,同時闡述監督機器的人性面。無論是工程領導者、資料工程師或是資料科學專業人士,都能從本書獲得成功使用訓練資料所需之概念、工具和流程的深入理解。 透過這本書,您將學會: ‧有效地處理訓練資料,包括綱要、原始資料和標註 ‧將工作、團隊或組織轉型為更以人工智慧/機器學習資料為中心 ‧向其他員工、團隊成員和利益相關者清楚解釋訓練資料概念 ‧為生產級別的人工智慧應用設計、部署和交付訓練資料 ‧識別並修正基於新訓練資料的失敗模式,如資料偏差 ‧完全掌握自動化技術,更有效地建立訓練資料 ‧成功維護、操作和改進訓練資料的記錄系統 【目錄】 前言 第 01 章 訓練資料導論 訓練資料的意圖 訓練資料的機會 訓練資料的重要性 真實的訓練資料 生成式人工智慧 總結 第 02 章 快速上手 引言 快速上手 工具概述 取捨 歷史 總結 第 03 章 綱要 深入介紹綱要 標籤和屬性:內容 空間表達法:在哪裡? 關係、序列、時間序列:何時? 指南和說明 機器學習任務與訓練資料的關係 通用概念 總結 第 04 章 資料工程 引言 原始資料儲存 格式和映射 資料存取 安全性 預標記 總結 第 05 章 工作流程 引言 技術和人之間的黏合劑 開始人類任務 品質保證 分析 模型 資料流 直接標註 總結 第 06 章 理論、概念和維護 引言 理論 一般概念 樣本建立 維護 訓練資料管理 總結 第 07 章 人工智慧轉型與應用案例 引言 人工智慧轉型 任命領導者:人工智慧資料主管 使用案例發現 新的「群眾外包」:您自己的專家 現代訓練資料工具 總結 第 08 章 自動化 引言 入門 取捨 預標記 互動式標註自動化 品質保證自動化 資料發掘:應該標記的內容 擴增 模擬和合成資料 媒體特定 特定於領域 總結 第 09 章 案例研究和故事 引言 產業 訓練資料的學術方法 總結
類似書籍推薦給您
【簡介】 進行機器學習的開發時,精通相關數學理論是關鍵的基礎。本書基於對所有機器學習演算法的系統分類,詳細介紹了監督學習單模型、監督學習集成模型、無監督學習模型、概率模型等四大類共26個經典演算法,並進行詳細的公式推導和程式碼實現。旨在協助讀者充分了解演算法細節、實現方法和內在邏輯。 本書適合數理基礎扎實的初學者,也適合深入學習的進階者閱讀,同時可作為機器學習領域的參考書籍。 【目錄】 第一部分:入門篇 第 1 章 機器學習預備知識 第二部分:監督學習單模型 第 2 章 線性迴歸 第 3 章 邏輯迴歸 第 4 章 迴歸模型擴展 第 5 章 線性判別分析 第 6 章 k 近鄰演算法 第 7 章 決策樹 第 8 章 神經網路 第 9 章 支援向量機 第三部分:監督學習整合模型 第 10 章 AdaBoost 第 11 章 GBDT 第 12 章 XGBoost 第 13 章 LightGBM 第 14 章 CatBoost 第 15 章 隨機森林 第 16 章 整合學習:對比與調參 第四部分:無監督學習模型 第 17 章 聚類分析與 k 均值聚類演算法 第 18 章 主成分分析 第 19 章 奇異值分解 第五部分:機率模型 第 20 章 最大訊息熵模型 第 21 章 貝氏機率模型 第 22 章 EM 演算法 第 23 章 隱馬可夫模型 第 24 章 條件隨機場 第 25 章 馬可夫鏈蒙地卡羅方法 第六部分:總結 第 26 章 機器學習模型總結 參考文獻
類似書籍推薦給您
機器學習的統計基礎:深度學習背後的核心技術 ISBN13:9789863126744 出版社:旗標出版社 作者:黃志勝 裝訂/頁數:平裝/432頁 規格:23cm*17cm*2.5cm (高/寬/厚) 版次:1 出版日:2021/11/15 中國圖書分類:特殊電腦方法 內容簡介 「作者在上市 IC 公司上班,每天面對 real world problems。探索如何建立輕量深度學習網路以及發展更有效率的學習方式是他每天的工作。這是一本學理及實務兼具的好工具書。」 - 中央研究院資訊科學研究所所長 廖弘源博士 推薦 [搭起 AI 與統計的橋樑] 原本統計學與人工智慧是兩個完全不同的領域,然而兩者在近代都有了新的發展進而產生連結。在人工智慧中導入機率與統計的觀念,讓電腦具有自己找出數據之間的關聯性並試圖解決問題的能力,因而出現機器學習 (machine learning) ,再加上電腦計算能力的大幅提升,解決多層類神經網路和大數據之間聯繫性的可能,進而衍生出現今最熱門的深度學習 (deep learning)。 不過,大部分電腦相關科系出身的人並不熟悉統計學,因此在更上一層樓的時候容易遇到障礙。有鑒於此,小編在推出《機器學習的數學基礎》(天瓏專業書店年度暢銷第一名) 一書之後,就積極開發 AI 與統計學相關的書籍。在尋尋覓覓之後請到擅長統計與機器學習的黃志勝博士出馬撰寫《機器學習的統計基礎》,首要之務就是讓讀者不要視統計為畏途,因此在書中設計大量範例以降低學習難度,務求讀得懂、做得出來才容易吸收,進而搭好統計與機器學習的橋樑。如果自覺數學已經還給老師了也不用擔心,可以將本書搭配《機器學習的數學基礎》一併完整學習。 [學會統計,由混亂到清晰] 本書從讀者在高中就學過的集合與機率論開始,帶您快速複習一遍,並將容易混淆之處多多舉例說明,並將以前似懂非懂的隨機變數、機率分布等觀念再解釋得更清楚。接下來就進入專有名詞特別多的統計學,這也是造成許多人暈頭轉向之處。特別是樣本估計、信賴區間、顯著水準、信心水準、t-分布、假設檢定...等讓人一個頭兩個大的主題,更是務求清楚明瞭。當然本書不可能把完整的統計學全都搬進來,此處只介紹機器學習、深度學習需要用到的統計基礎知識,縮短您的學習時間。 然後就進入機器學習的重頭戲,從資料前處理到迴歸、分類模型的建立,以及當數據的特徵數過多時的 PCA、LDA 統計降維法。從類神經網路開始進入深度學習的範疇,包括前向傳遞、梯度下降法與倒傳遞學習法的手算實作,幫助讀者一步步建立深度學習的演算邏輯,並利用參數常規化解決模型過擬合 (over-fitting) 的問題。最後,導入模型評估,例如二元、多元分類模型評估指標、迴歸模型評估指標、4 種交叉驗證的方法,做為判斷模型好壞的參考依據。 相信讀者認真看完本書後,一定能建立起機器學習結合統計學的硬底子。當然這只是開端,期望讀者以本書為基石繼續前行。 本書特色 1. 打好機率與統計的基礎,快速釐清讓人容易暈頭轉向的統計理論。 2. 藉由大量範例說明,務求讀得懂、做得出來,才容易吸收。 3. 作者提供專屬讀者天地,以及機器學習方面的文章供後續學習。 目錄 第 1 章 機器與深度學習常用的數學基礎 1.1 數值資料表示方式 1.1.1 純量 (scalar) 1.1.2 向量 (vector) 1.1.3 矩陣 (matrix) 1.1.4 張量 (tensor) 1.2 向量與矩陣運算 1.2.1 向量和純量相乘 1.2.2 向量相乘 1.2.3 矩陣相乘 1.2.4 Hadamard 乘積 1.2.5 逆矩陣 (反矩陣) 1.3 矩陣分解 1.3.1 特徵分解 (Eigenvalue decomposition) 1.3.2 奇異值分解 (SVD) 第 2 章 機器學習相關機率論 2.1 集合 2.2 隨機試驗與樣本空間 2.2.1 隨機試驗範例 2.2.2 隨機試驗與公正與否 2.3 事件 2.3.1 基本事件與複合事件 2.3.2 事件空間 2.4 事件的機率 2.4.1 事件機率三大公理 2.4.2 事件機率相同的例子 2.4.3 事件機率不同的例子 2.4.4 事件機率運算規則 2.5 條件機率與貝氏定理 2.5.1 條件機率 2.5.2 貝氏定理 2.5.3 統計獨立 2.6 隨機變數 2.6.1 隨機變數的類型 2.6.2 多維隨機變數 2.7 機率分布與機率密度函數 2.7.1 機率分布 2.7.2 數位化都是離散型的隨機變數 2.7.3 一維機率密度函數 2.7.4 多維機率密度函數 (聯合機率密度函數) 2.7.5 邊際機率密度函數 2.8 機器學習常用到的統計機率模型 2.8.1 伯努利分布 (Bernoulli Distribution) 2.8.2 二項分布 (Binomial Distribution) 2.8.3 均勻分布 (Uniform Distribution) 2.8.4 常態分布 (Normal Distribution) 第 3 章 機器學習常用的統計學 (一) 3.1 資料結構分類 3.1.1 「正確的資料」與「好品質的資料」 3.1.2 結構化資料 3.1.3 非結構化資料 3.1.4 半結構化資料 3.2 將統計量作為資料的特徵表徵 3.2.1 期望值 3.2.2 各階中心動差 3.2.3 相關係數與共變異數 3.2.4 共變異數矩陣 第 4 章 機器學習常用的統計學 (二) 4.1 母體與樣本估計 4.1.1 樣本統計量與抽樣分布 4.1.2 樣本平均數的期望值等於母體平均數 4.1.3 樣本變異數的期望值等於母體變異數 4.1.4 小結 4.2 信賴區間 4.2.1 信賴區間與顯著水準、信心水準的關係 4.3 母體為常態分布的區間估計 4.31 常態分布的特性 4.3.2 將常態分布標準化:z-score 4.3.3 標準常態分布平均值的區間估計 4.3.4 每次抽樣都有不同的信賴區間 4.3.5 信賴區間的用途 4.4 自由度 (Degree of Freedom) 4.5 t-分布 (t-distribution) 4.5.1 t 值 (t-score):母體為常態,但標準差未知的情況 4.5.2 t 值與 z 值的關係 4.5.3 t-分布:隨機變數 t 的機率分布 4.6 抽樣數的選擇 4.6.1 母體數有無限個的情況 4.6.2 有限母體數的修正 4.7 假設檢定 4.7.1 假設檢定的預備知識 4.7.2 虛無假設、對立假設 4.7.3 檢定虛無假設成立的機率 4.7.4 計算橫軸上的 t 值 4.7.5 計算 p 值 第 5 章 機器學習常用的資料處理方式 5.1 資料標準化 5.1.1 Z 值標準化 5.1.2 Min-max 正規化 5.2 資料縮放 5.3 非線性轉換 5.3.1 對數函數能將數值範圍縮小 5.3.2 指數函數將數值轉換到特定範圍 5.3.3 非線性轉換較少用於資料前處理的原因 5.4 類別變數編碼 5.4.1 One-hot encoding ...
類似書籍推薦給您
內容簡介 收錄豐富的圖示與詳盡的解說,即便完全零知識也能夠輕鬆學習。 機器學習與深度學習的原理與技術,單靠這一本 就能深入瞭解的教科書 「人工智慧」、「機器學習」、「深度學習」這些以前在科幻小說中才會見到的字眼,如今已經深入我們的日常,成為大家平日琅琅上口的名詞。可是,真的想要深入一點了解這些名詞,一翻開相關書籍,看到滿滿的數學公式頭就暈了,難道沒有人能夠用大家都聽得懂的方式解釋這些科技名詞嗎? 本書就是因應您心中的吶喊而生的一本書。這本書不會給你滿滿的數學式,而是藉由生活化的舉例、圖解進行說明,盡可能地表達人工智慧的正確知識。期望各位能夠透過本書,觸及機器學習的趣味與可能性,進而踏入機器學習的世界中。 藉由本書,您將可以: .了解人工智慧、機器學習、深度學習三者之間的關係 .機器學習的程序與核心技術 .了解機器學習應用了哪些演算法 .深度學習的程序與核心技術 .了解深度學習應用了哪些演算法 產品目錄 第1章|人工智慧的基礎知識 01 何謂人工智慧? 02 何謂機器學習(ML)? 03 何謂深度學習(DL)? 04 人工智慧與機器學習的普及過程 第2章|機器學習的基礎知識 05 監督式學習的機制 06 非監督式學習的機制 07 增強學習的機制 08 統計與機器學習的差異 09 機器學習與特徵量 10 擅長與不擅長的領域 11 機器學習的運用範例 第3章|機器學習的程序與核心技術 12 機器學習的基本工作程序 13 蒐集資料 14 資料變形 15 模型的作成與學習 16 批次學習與線上學習 17 使用測試資料驗證預測結果 18 學習結果的評估基準 19 超參數與模型的調整 20 主動學習 21 相關與因果 22 反饋迴圈 第4章|機器學習的演算法 23 迴歸分析 24 支援向量機 25 決策樹 26 整體學習 27 整體學習的運用 28 邏輯迴歸 29 貝葉斯模型 30 時序分析與狀態空間模型 31 K 近鄰法(K-NN)與 K 平均法(K-Means) 32 維度縮減與主成分分析 33 最佳化與遺傳演算法 第5章|深度學習的基礎知識 34 類神經網路與其歷史 35 深度學習與圖像辨識 36 深度學習與自然語言處理 第6章|深度學習的程序與核心技術 37 誤差反向傳播法的類神經網路學習 38 類神經網路的最佳化 39 梯度消失問題 40 遷移學習 第7章|深度學習的演算法 41 卷積類神經網路(CNN) 42 遞歸類神經網路(RNN) 43 增強學習與深度學習 44 自動編碼器 45 GAN(生成對抗網路) 46 物體偵測 第8章|系統開發與開發環境 47 編寫人工智慧的主要程式語言 48 機器學習用資料庫與框架 49 深度學習的框架 50 GPU程式設計與高速化 51 機器學習服務
資訊
工程
數學與統計學
機率與統計
自然科學
健康科學
地球與環境
建築、設計與藝術
人文與社會科學
教育
語言學習與考試
法律
會計與財務
大眾傳播
觀光與休閒餐旅
考試用書
研究方法
商業與管理
經濟學
心理學
生活
生活風格商品
參考書/測驗卷/輔材