書名: Kaggle大師教您用Python玩資料科學,比賽拿獎金
作者: 石原祥太郎、村田秀樹
ISBN: 9789865027681
出版社: 碁峰
書籍開數、尺寸: 17x23x1.13
頁數: 192
內文印刷顏色: 全彩
#資訊
#資訊科學與資訊系統
定價: 480
售價: 408
庫存: 已售完
LINE US! 詢問這本書 團購優惠、書籍資訊 等
此書籍已售完,調書籍需2-5工作日。建議與有庫存書籍分開下單

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

詳細資訊

內容簡介   本書是利用Python參加機器學習競賽「kaggle」的入門書。一開始先以適合初學者學習的「Titanic:Machine Learning from Disater」競賽學習Kaggle的基礎。從中除了可學習實踐Titanic的方法,還能掌握自行參加競賽所需的知識。 本書特色   .為了kaggle撰寫的習作教學書籍   .每一章或每一節都有具體的主題,可讓讀者按部就班地掌握需要的知識   .解說各種表單、圖片檔、文字檔的操作方法,作為進入下一個競賽的路標。   .兩位執筆者都擁有「Kaggle Master」的稱號,也有賺到獎金的經驗   .除了說明之外,還有兩位筆者的對談,從不同的角度介紹Kaggle的魅力   .會為程式設計與Python的初學者詳細講解範例程式 目錄 第1章|了解Kaggle 1.1 何謂Kaggle 1.2 於Kaggle使用的機器學習 1.3 建立Kaggle的帳號 1.4 Competitions 頁面的概要 1.5 不需另行建置環境的「Notebooks」的使用方法 第2章|著手進行Titanic 2.1 先submit !試著寫進順位表 2.2 掌握全貌!了解submit之前的處理流程 2.3 找出下一步!試著進行探索式資料分析 2.4 在此拉開差距!基於假設建立新的特徵值 2.5 決策樹是最強的演算法?試著使用各種機器學習演算法 2.6 機器學習演算法的心情?試著調整超參數 2.7 在submit 之前!了解「Cross Validation」的重要性 2.8 「三個臭皮匠,勝過一個諸葛亮!」體驗集成學習 第3章|往Titanic的下個階段前進 3.1 操作多個表格 3.2 操作影像資料 3.3 操作文字資料 第4章|為了進一步學習 4.1 挑選競賽的方法 4.2 初學者適用的參賽方式 4.3 可選擇的分析環境 4.4 值得參考的資料、文獻、連結 4.5 第4 章總結 附錄A|範例程式碼詳細解說

為您推薦

Kaggle 競賽攻頂秘笈 - 揭開 Grandmaster 的特徵工程心法,掌握制勝的關鍵技術

Kaggle 競賽攻頂秘笈 - 揭開 Grandmaster 的特徵工程心法,掌握制勝的關鍵技術

類似書籍推薦給您

Kaggle 競賽攻頂秘笈:揭開 Grandmaster 的特徵工程心法,掌握制勝的關鍵技術 ISBN13:9789863126379 替代書名:Kaggleで勝つデータ分析の技術/初版 出版社:旗標出版社 作者:門脇大輔;阪田隆司;保坂桂佑;平松雄司 譯者:李彥婷 裝訂/頁數:平裝/480頁 規格:23.5cm*18.3cm*2.4cm (高/寬/厚) 出版日:2021/02/22 中國圖書分類:電腦科學 內容簡介   Kaggle 是目前最大的資料科學競賽平台,這裡匯集世界各地超過 10 萬名資料科學家,解決各大企業公開於平台上面的資料及問題。Kaggle 曾經舉辦過總獎金一百萬美金的競賽,尋求各路好手解決癌症影像辨識的問題;也曾經有參賽者因為解決了一家壽險公司在 Kaggle 上發布的問題,因此順利進入該公司工作。因此,Kaggle 無疑是展現高超技術力,同時也是尋求優渥獎金、薪資、更好職位的途徑。   對於人工智慧的工程師、學生來說,Kaggle 平台提供了大量免費的資源:真實世界的資料集、各路好手的討論分享、以及累積實際操作的經驗等等。這些資源在一般課堂上幾乎很難取得,卻也是這領域最需要的知識與技能。   本書作者為四位 Kaggle 資料科學競賽專家,他們不僅透過實務上的角度解析各種特徵工程技術,超越一般教科書的視野;更重要的是提供各種技術、流程使用心得,讓讀者可以直接跳過嘗試、摸索的階段。試想下列的這些問題,不就是實務上經常會碰到的難處!而作者將會在書中闡述他們如何看待、解決這些事情:   ● 如何最佳化模型的閾值來獲得最高的評價分數?   ● 如何將資料經過編碼、降維等等轉換,以彰顯資料的特性?   ● 如何依據問題的型態選擇模型,且依照模型的特性來提取適當的特徵?   ● 如何正確進行時序資料的驗證以避免過度配適或資料外洩?   ● 如何調整梯度提升決策樹、類神經網路的參數?   ● 如何將自己所學的各種技術,進行有效的模型集成?   我們也在書中適時加上小編補充,讓讀者可以完整吸收四位專家的思想精髓,希望讀者閱讀本書之後,不僅可以在 Kaggle 競賽中締造絕佳成績,也相信讀者可以解決工作、研究中複雜且混亂的資料集。   讓我們一同走上資料科學的巔峰吧! 本書特色   ● 國立成功大學資訊工程學系特聘教授 陳培殷博士 推薦   ● 本書由施威銘研究室監修,內容易讀易懂,並加入大量「編註」與「小編補充」以幫助理解及補充必要知識。   ● 集結 4 位 Kaggle 高手累積共 37 面獎牌的實戰經驗   ● 整理當前實務上各種特徵工程的困難問題以及解決的方法   ● 分享各種技術使用時機與實踐結果的寶貴心得   ● 揭露 Kaggle 競賽高人一等的制勝精華   ● 提供書中 Python 範例程式下載 目錄 第 1 章 數據分析競賽是什麼? 1.1 什麼是數據分析競賽? 1.1.1 數據分析競賽的目的 1.1.2 提交預測結果與排行榜 (Leaderboard) 1.1.3 組隊參賽 1.1.4 獎金、獎品 1.2 Kaggle 平台簡介 1.2.1 Kaggle 1.2.2 Rankings (排名、頭銜制度) 1.2.3 Notebooks 1.2.4 Discussion 1.2.5 Datasets 1.2.6 Kaggle API 1.2.7 Newsfeed 1.2.8 實際舉辦過的數據分析競賽類別與案例 1.2.9 數據分析競賽的形式 (format) 1.3 從開始參加數據分析競賽到結束 1.3.1 參加數據分析競賽 1.3.2 同意規定和條約 1.3.3 下載資料 1.3.4 產生預測值 1.3.5 提交預測值 1.3.6 查看 Public Leaderboard 1.3.7 選擇最終預測值 1.3.8 查看 Private Leaderboard 1.4 參加數據分析競賽的意義 1.4.1 獲得獎金 1.4.2 獲得頭銜或排名 1.4.3 使用實際資料進行分析的經驗/技術 1.4.4 建立和其他資料科學家的交流 1.4.5 獲得就業機會 1.5 贏得優勝的秘訣 1.5.1 任務和評價指標 (Metric) 1.5.2 建立特徵 1.5.3 建立模型 1.5.4 評價模型 1.5.5 模型調整 1.5.6 集成學習 (Ensemble Learning) 1.5.7 數據分析競賽的流程 第 2 章 任務與評價指標 2.1 數據分析競賽的任務種類 2.1.1 迴歸任務 (Regression) 2.1.2 分類任務 (Classification):二元分類與多分類 2.1.3 推薦任務 (Recommendation) 2.1.4 圖像資料任務 2.2 數據分析競賽的資料集 (Dataset) 2.2.1 表格資料 (tabular data) 2.2.2 外部資料 2.2.3 時間序列資料 2.2.4 圖像或自然語言等資料 2.3 任務與評價指標 2.3.1 什麼是評價指標 (evaluation metrics)? 2.3.2 迴歸任務的評價指標 2.3.3 二元分類任務的評價指標:預測值為正例或負例的情況 2.3.4 二元分類任務的評價指標:預測值為正例機率的情況 2.3.5 多元分類 (Multiclass Classification) 任務的評價指標 2.3.6 推薦任務的評價指標:MAP@K 2.4 評價指標和目標函數 2.4.1 評價指標和目標函數的差異 2.4.2 自定義評價指標與目標函數 2.5 評價指標的最佳化 2.5.1 最佳化評價指標的方法 2.5.2 最佳化閾值 2.5.3 是否該使用 out-of-fold 來最佳化閾值? 2.5.4 針對預測機率的調整 2.6 最佳化評價指標的競賽實例 2.6.1 balanced accuracy 的最佳化 2.6.2 mean-F1 的閾值最佳化 2.6.3 最佳化 quadratic weighted kappa 閾值 2.6.4 最佳化MAE ─ 使用相似的自定義目標函數 2.6.5 MCC 的近似值:PR-AUC 及模型的選擇 2.7 資料外洩 (data leakage) 2.7.1 在無預期的情況下外洩有利於預測的資訊 2.7.2 驗證機制錯誤所造成的資料外洩 第 3 章 特徵提取 3.1 本章結構 3.2 模型和特徵 3.2.1 模型和特徵 3.2.2 初步 (Baseline) 模型 3.2.3 從決策樹 (Decision Tree) 的角度思考 3.3 缺失值的處理 3.3.1 維持缺失值 3.3.2 以代表值填補缺失值 3.3.3 使用其他變數來預測缺失值 3.3.4 由缺失值來建立一個全新的特徵 3.3.5 認識資料中的缺失值 3.4 數值變數的轉換 3.4.1 標準化 (standardization) 3.4.2 Min-Max 縮放方法 3.4.3 非線性轉換 3.4.4 Clipping 3.4.5 Binning (分組) 3.4.6 將數值轉換為排序 3.4.7 RankGauss ...

原價: 1000 售價: 900 現省: 100元
立即查看
自學機器學習:上Kaggle接軌世界,成為資料科學家

自學機器學習:上Kaggle接軌世界,成為資料科學家

類似書籍推薦給您

原價: 680 售價: 612 現省: 68元
立即查看
初探機器學習-從認識AI到Kaggle競賽(學AI真簡單系列1)

初探機器學習-從認識AI到Kaggle競賽(學AI真簡單系列1)

類似書籍推薦給您

初探機器學習:從認識AI到Kaggle競賽 系列名:學AI真簡單 ISBN13:9789865035624 出版社:全華圖書 作者:AI4kids 裝訂/頁數:平裝/144頁 規格:26cm*19cm*0.7cm (高/寬/厚) 重量:309克 出版日:2021/02/01 中國圖書分類:中學教學法 內容簡介 本書透過有趣且生活化的AI實作案例,讓初學者一次掌握「機器學習」五大流程。透過圖文並茂的觀念解說與全步驟程式碼解析,讓你越過深奧的數學與方程式阻礙,直接探索AI各種實務應用,包含透過「Quick Draw!」塗鴉資料的AI判讀、監督式學習的線性迴歸模型、KNN、決策樹分類模型、非監督式學習的K-means分群模型,最後引領你勇闖Kaggle國際AI競賽平台,以實作取得排名成績。 本書作者為AI4kids團隊,曾應教育部國教署邀請,至全國高中主任會議分享AI教學、親子天下雜誌專文報導,成員來自AIA台灣人工智慧學校的校友,團隊有軟體技術、創新研發、工程管理、電商行銷等資歷專長,因為對AI科技教育的熱情而投入AI的教案研發與教學,目標是透過教孩子動手實作AI專題,來啟發他們對好奇心與想像力,協助他們運用各種程式或平台工具來探索、創造自己的AI應用。 目錄 CH1 打開AI人工智慧之門 1-1 WOW!令人驚嘆的人工智慧 1-2 Why?人人都要學會當AI的主人 1-3 What? AI 快問快答 1-4 為什麼機器可以像人類一樣學習? 1-5 Quick Draw!畫一畫你就懂了! 1-6 總結 CH2 我也能打造機器學習 2-1 機器學習的五大流程 2-2 總結 CH3 動手實作監督式學習 3-1 迴歸與分類 3-2 房價秒預測—線性迴歸介紹與應用 3-3 乳癌機率有多高—KNN 分類器介紹與應用 3-4 傑克與蘿絲誰的生存機率高—決策樹分類器介紹與應用 3-5 總結 CH4 動手實作非監督式學習 4-1 K 平均分群演算法(K-means)的基本介紹與應用 4-2 鳶尾花的分群—K-means 應用範例 4-3 手寫數字的分群—K-means 應用範例 4-4 總結 CH5 國際AI競賽走一遭 5-1 Kaggle 網站介紹 5-2 經典賽事介紹 5-3 Kaggle 資料上傳與排名 5-4 總結 附錄A Python基礎語法查詢表 附錄B Google Colab使用簡介

原價: 280 售價: 246 現省: 34元
立即查看