內行人才知道的機器學習系統設計面試指南
類似書籍推薦給您
【簡介】
這本最新的面試指南提供了大量具有高度相關性的深入洞見,為讀者解鎖ML系統設計面試的整個程序。科技業長期以來一直缺乏這樣的資源,而作者則是用本書給出了解方。
— Eddie Santos,Block機器學習工程師
本書是ML專業人士的重要資源,針對各領域的ML系統設計,提供了極為精彩的實用資訊。對於任何有興趣學習系統設計應用知識的人來說,本書可說是非常完美,也是準備面試時非常理想的參考資源!
— Aishwarya Srinivasan,Google資料科學家
在ML相關的各種面試中,ML系統設計可說是最具有挑戰性的主題之一,這類的職位有可能包括資料工程師、資料科學家、 ML工程師等等。
如果你正打算準備參加ML面試,無論初學者還是經驗豐富的工程師,本書就是為你而寫的。
想像一下,在一場競爭激烈的ML面試中,面試官要求你設計一套端到端的ML系統,可能是視覺搜尋、偵測違反社群守則的字詞,或廣告點擊預測。
你知道,這些題目沒有標準答案,真正的挑戰在於你如何思考,如何深入理解各種ML主題,最後設計出一個既複雜又實用的系統。
面試官會仔細評估你的設計過程、在多種設計選項中你如何做出權衡取捨。最重要的是,你是否有能力成功設計出一個有效的ML系統。
該如何在這樣的面試中脫穎而出,順利成為一名成功的ML工程師呢?
本書以7步驟框架、10個真實案例及211個圖表,提供機器學習系統設計面試的強化策略。
ML系統設計的面試考題,主要是想評估應試者能否設計出一些端對端的ML系統(例如視覺搜尋、影片推薦、廣告點擊的預測……等等)。這些考題通常都缺乏清晰的結構,涵蓋的主題範圍也比較廣泛,往往相當具有挑戰性;而且通常不會有很明確的答案,所以很可能有多種不同的解釋方式與解法。
總體來說,面試的目標就是要評估應試者能不能應用ML的理論知識,設計並實作出真正有效的系統。
本書有哪些內容?
關於面試官真正想找的人以及背後的緣由,提供內行人真正的看法。
7步驟框架 可用來解決任何ML系統設計面試問題。
10個ML系統設計面試實戰題 以及詳細的解決方案。
211張圖表 更直觀解釋了各種系統的原理。
【目錄】
Chapter 1 簡介與概述
Chapter 2 視覺搜尋系統
Chapter 3 Google 街景模糊化系統
Chapter 4 YouTube 影片搜尋
Chapter 5 有害內容偵測
Chapter 6 影片推薦系統
Chapter 7 活動推薦系統
Chapter 8 社群平台的廣告點擊預測
Chapter 9 短期租屋平台的類似選項
Chapter 10 個人動態訊息
Chapter 11 你或許認識的朋友
立即查看
機器學習工程師面試全破解:嚴選124道AI演算法決勝題完整剖析
類似書籍推薦給您
立即查看
深度學習詳解|台大李宏毅老師機器學習課程精粹 (1版)
類似書籍推薦給您
【簡介】
台灣大學電機工程學系 李宏毅教授 ~專文推薦~
很高興看到Datawhale的王琦、楊毅遠、江季等同學將我的線上錄影轉化為可閱讀的教材,他們的努力使我的教學內容能接觸更多學子。希望這本書能幫助更多人探索深度學習領域,激發更多學子對這個領域的興趣和熱情。
■ 名師授課精華,一本掌握深度學習核心觀念
台灣大學電機工程學系李宏毅教授開設的「機器學習」與「生成式AI」課程在YouTube上廣受歡迎,累積超過30萬訂閱,影響力橫跨學界與業界。
本書依據李宏毅教授「機器學習」課程中與深度學習相關的內容編寫,並融合近年課程更新重點,為AI學習者提供最完整、最系統化的深度學習知識架構。
■ 從基礎到進階,完整呈現深度學習關鍵知識
內容包括了深度學習的基礎知識、類神經網路的訓練技巧、生成模型、自監督學習(包括 BERT 和 GPT)、擴散模型、元學習、神經網路壓縮等。此外,還探討了如何解決類神經網路訓練中的常見問題,如局部最小值、鞍點、批次與動量、自動調整學習速率等。
■ 理論實務兼具,打造易懂又實用的學習體驗
在理論嚴謹的基礎上,本書保留了課程中大量生動有趣的例子,幫助讀者從生活化的角度瞭解深度學習的概念、建模過程與核心演算法細節。適合對深度學習感興趣,想要入門深度學習的讀者閱讀,更可作為深度學習相關課程的教材。
王琦
上海交通大學人工智能教育部重點實驗室博士研究生,碩士畢業於中國科學院大學。Datawhale成員,《Easy RL:強化學習教程》作者,英特爾邊緣計算創新大使,Hugging Face社區志願者,AI TIME成員。主要研究方向為強化學習、計算機視覺、深度學習。曾獲「中國光谷.華為杯」第十九屆中國研究生數學建模競賽二等獎、中國大學生計算機設計大賽二等獎、亞太地區大學生數學建模競賽(APMCM)二等獎,並發表多篇SCI/EI論文。
楊毅遠
牛津大學計算機系博士研究生,碩士畢業於清華大學。Datawhale成員,《Easy RL:強化學習教程》作者。主要研究方向為時間序列、資料探勘、智能傳感系統及深度學習。曾獲中國國家獎學金、北京市優秀畢業生、清華大學優秀碩士學位論文及中國大學生智能汽車競賽總冠軍等榮譽,並發表多篇SCI/EI論文。
江季
網易高級算法工程師,碩士畢業於北京大學。Datawhale成員,《Easy RL:強化學習教程》作者。主要研究方向為強化學習、深度學習、大模型及機器人等。曾獲中國國家獎學金、上海市優秀畢業生等榮譽,並取得多項強化學習與遊戲AI相關專利。
【目錄】
chapter 1 機器學習基礎
1.1 案例學習
1.2 線性模型
chapter 2 實踐方法論
2.1 模型偏差
2.2 最佳化問題
2.3 過擬合
2.4 交叉驗證
2.5 不匹配
chapter 3 深度學習基礎
3.1 局部最小值與鞍點
3.2 批次和動量
3.3 自適化學習率
3.4 學習率排程
3.5 最佳化總結
3.6 分類
3.7 批次正規化
chapter 4 卷積神經網路
4.1 觀察 1:檢測模式不需要整幅圖片
4.2 簡化 1:感知域
4.3 觀察 2:同樣的模式可能出現在圖片的不同區域
4.4 簡化 2:共用參數
4.5 簡化 1 和簡化 2 的總結
4.6 觀察 3:降取樣不影響模式檢測
4.7 簡化 3:池化
4.8 卷積神經網路的應用:下圍棋
chapter 5 遞迴神經網路
5.1 獨熱編碼
5.2 什麼是 RNN
5.3 RNN 架構
5.4 其他 RNN
5.5 LSTM 網路原理
5.6 RNN 的學習方式
5.7 如何解決 RNN 的梯度消失或梯度爆炸問題
5.8 RNN 的其他應用
chapter 6 自注意力機制
6.1 輸入是向量序列的情況
6.2 自注意力機制的運作原理
6.3 多頭自注意力
6.4 位置編碼
6.5 截斷自注意力
6.6 對比自注意力與卷積神經網路
6.7 對比自注意力與遞迴神經網路
chapter 7 Transformer
7.1 序列到序列模型
7.2 Transformer 結構
7.3 Transformer 編碼器
7.4 Transformer 解碼器
7.5 編碼器—解碼器注意力
7.6 Transformer 的訓練過程
7.7 序列到序列模型訓練常用技巧
chapter 8 生成模型
8.1 生成對抗網路
8.2 生成器與判別器的訓練過程
8.3 GAN 的應用案例
8.4 GAN 的理論介紹
8.5 WGAN 演算法
8.6 GAN 訓練的困難點與技巧
8.7 GAN 的效能評估方法
8.8 條件型生成
8.9 CycleGAN
chapter 9 擴散模型
9.1 擴散模型產生圖片的過程
9.2 降噪模組
9.3 訓練雜訊預測器
chapter 10 自監督學習
10.1 BERT
10.2 GPT
chapter 11 自動編碼器
11.1 自動編碼器的概念
11.2 為什麼需要自動編碼器
11.3 降噪自動編碼器
11.4 自動編碼器應用之特徵解離
11.5 自動編碼器應用之離散隱性表徵
11.6 自動編碼器的其他應用
chapter 12 對抗式攻擊
12.1 對抗式攻擊簡介
12.2 如何進行網路攻擊
12.3 快速梯度符號法
12.4 白箱攻擊與黑箱攻擊
12.5 其他模態資料被攻擊案例
12.6 現實世界中的攻擊
12.7 防禦方式中的被動防禦
12.8 防禦方式中的主動防禦
chapter 13 轉移學習
13.1 領域偏移
13.2 領域自適應
13.3 領域概化
chapter 14 增強式學習
14.1 增強式學習的應用
14.2 增強式學習框架
14.3 評價動作的標準
chapter 15 元學習
15.1 元學習的概念
15.2 元學習的三個步驟
15.3 元學習與機器學習
15.4 元學習的實例演算法
15.5 元學習的應用
chapter 16 終身學習
16.1 災難性遺忘
16.2 終身學習的評估方法
16.3 終身學習問題的主要解法
1chapter 17 網路壓縮
17.1 網路修剪
17.2 知識蒸餾
17.3 參數量化
17.4 網路架構設計
17.5 動態計算
chapter 18 可解釋性機器學習
18.1 可解釋性人工智慧的重要性
18.2 決策樹模型的可解釋性
18.3 可解釋性機器學習的目標
18.4 可解釋性機器學習中的局部解釋
18.5 可解釋性機器學習中的全局解釋
18.6 擴充與小結
chapter 19 ChatGPT
19.1 ChatGPT 簡介和功能
19.2 對 ChatGPT 的誤解
19.3 ChatGPT 背後的關鍵技術—預訓練
19.4 ChatGPT 帶來的研究問題
立即查看
機器學習-從理論到實作攻略 (1版)
類似書籍推薦給您
【簡介】
本書內容兼顧理論與實務,用大量示意圖與範例,幫助讀者建立機器學習的基本概念。第一章介紹機器學習的基本概念與類型,幫助讀者快速入門。第二章深入探討監督式學習,涵蓋多種經典演算法,如線性回歸、決策樹與神經網路等。第三章則介紹非監督式學習,重點講解資料探索與聚類方法。第四章專注於模型評估與優化,幫助讀者提升模型性能。最後,第五章通過台股數據分析與YOLO物件辨識兩個實戰專案,讓讀者實際應用所學知識,開啟機器學習與深度學習的探索之旅。
本書特色
1.強調實作與錯誤學習:本書不僅講解理論,還鼓勵讀者動手實踐,以實際應用深化理解。
2.系統化的學習路徑:以示意圖與簡單範例帶領讀者進入機器學習,逐步深入監督式與非監督式學習,最終挑戰更進階的AI應用。
3.提供完整的學習支援:書中還整理了機器學習的專業術語,並附有環境安裝指南,讓更多人能輕鬆入門機器學習。
4.豐富的線上教學資源:作者經營YouTube頻道「工程師の師」,提供多樣化的教學影片,作為書本內容的延伸學習資源。
【目錄】
第一章 機器學習新手上路
1-1 什麼是機器學習
1-2 機器學習的種類
1-3 免費練習開發平台
1-4 機器學習步驟
第二章 監督式學習
2-1 線性回歸 Linear Regression
2-2 支援向量機 Support Vector Machine
2-3 單純貝氏分類器 Naïve Bayes Classifier
2-4 決策樹Decision Tree
2-5 隨機森林 Random Forest
2-6 神經網路 Neural Network
2-7 近鄰演算法 K-Nearest Neighbors
第三章 非監督式學習
3-1 主成分分析 Principal Components Analysis
3-2 非負矩陣 Non-negative Matrix Factorization
3-3 平均分群演算法 K-means
3-4 高斯混合分布 Gaussian Mixture Models
第四章 評估方法與訓練技巧
4-1 分類問題評估
4-2 回歸問題評估
4-3 交叉驗證 Cross-Validation
4-4 批次量 Batch Size
第五章 最終挑戰—實戰應用
5-1 AI 股票理財專家
5-2 YOLOv9 物件辨識
結語
附錄
附錄一 專有名詞解釋
附錄二 環境安裝
附錄三 參考文獻
習題
立即查看
機器學習─Python程式實作 (1版)
類似書籍推薦給您
【簡介】
內容涵蓋機器學習三大主題:監督式學習、無監督式學習與強化式學習。
採用生動活潑的範例,以深入淺出、圖文並茂的方式,建立良好的理論基礎。
搭配 Python 程式實作,實現「做中學」的學習理念。
提供豐富的學習資源,包含:數學背景、練習題等,厚植機器學習技術研發能力。
【目錄】
Chapter 1 介 紹
Chapter 2 端到端機器學習
Chapter 3 迴 歸
Chapter 4 貝氏分類器
Chapter 5 k-最近鄰
Chapter 6 支援向量機
Chapter 7 決策樹
Chapter 8 隨機森林
Chapter 9 提升方法
Chapter 10 類神經網路
Chapter 11 k-Means分群
Chapter 12 DBSCAN
Chapter 13 高斯混合模型
Chapter 14 主成分分析
Chapter 15 t-SNE
Chapter 16 強化式學習
附錄 數學背景
習題參考解答
參考文獻
立即查看