書名:	資料科學學習手冊｜Python資料處理、探索、視覺化與建模實作 (1版)
作者:	Sam Lau, Joseph Gonzalez, Deborah Nolan
譯者:	楊新章/ 楊翔宇
版次:	1
ISBN:	9786264252591
出版社:	碁峰資訊
出版日期:	2026/01
書籍開數、尺寸:	23*18.5
頁數:	630
#資訊 #編程與軟體開發 #Python

定價:	~~980~~元
折扣:	8.5 折
售價:	833 元
庫存:	現貨: 2
查看店內位置
LINE US!	詢問這本書團購優惠、書籍資訊等

資料科學學習手冊｜Python資料處理、探索、視覺化與建模實作 (1版)

官網限定: 833 蝦皮價格 880 現省: 47

付款方式:	超商取貨付款
	信用卡
	線上轉帳
物流方式:	超商取貨
	宅配
	門市自取

詳細資訊
閱讀心得

【簡介】 「這本書正是我當年提出『資料科學家』這個職稱時，所希望能擁有的一本書。如果您希望投身資料科學／工程、人工智慧，或機器學習領域，就該從這裡開始。」 ── DJ Patil 博士，美國首任首席資料科學家身為一位有志成為資料科學家的讀者，能夠理解各類組織為何仰賴資料來做出關鍵決策──無論是公司在設計網站、還是市政府在改善公共服務，或者是科學家在致力於阻止疾病擴散。而您也希望具備將雜亂資料整理為可行洞見的能力。我們將這整個過程稱為「資料科學生命週期」：也就是從資料的收集、整理、分析，到導出結論的完整流程。本書是第一本涵蓋程式設計與統計兩大基礎技能、並貫穿整個資料科學生命週期的書籍。本書的對象包括希望成為資料科學家的人、與資料科學家共事的專業人士，以及希望跨越「技術／非技術」界線的資料分析師。只要具備基本的 Python 程式設計知識，便可學習如何透過業界標準工具（如 pandas）來處理資料：．將感興趣的問題精煉為可透過資料探究的研究問題．執行資料蒐集，其中可能涉及文字處理、網頁爬蟲等技術．透過資料清理、探索與視覺化，萃取出有價值的洞見．學會使用建模來描述資料特性．推廣研究結果，進行超出資料本身的推論 【目錄】 前言【第一部分　資料科學生命週期】第一章　資料科學生命週期生命週期的各個階段生命週期的範例總結第二章　問題與資料範疇大數據與新機會研究母體、抽樣架構與樣本儀器與操作程序自然現象的量測準確度總結第三章　模擬與資料設計抽籤模型範例：模擬選舉民調的偏誤與變異性範例：模擬疫苗的隨機試驗範例：空氣品質測量總結第四章　以摘要統計量建構模型常數模型最小化損失總結第五章　個案研究：為什麼我的公車總是拖班？問題與範疇資料整理探索公車時間建立等車時間模型總結【第二部分】　矩形資料第六章　使用pandas操作資料框架子集合選取（Subsetting）匯總合併轉換資料框架與其他資料表達法有何不同？總結第七章　使用SQL操作關係子集合選取（Subsetting）匯總合併轉換與共通表格運算式總結【第三部分】　理解資料第八章　整理檔案資料來源範例檔案格式檔案編碼檔案大小殼層與命令行工具表格形狀與粒度總結第九章　整理資料框架範例：整理冒納羅亞觀測站的CO2測量資料品質檢查缺漏的值與紀錄轉換與時間戳記修改結構範例：處理餐廳安全違規資料總結第十章　探索性資料分析特徵類型觀察分布的重點在關係中應注意的事項多變數情境下的比較探索準則範例：房屋售價總結第十一章　資料視覺化選擇合適的刻度以揭示結構資料的平滑化與匯總促進有意義的比較融入資料設計加入情境資訊使用plotly繪製圖表其他視覺化工具總結第十二章　案例研究：空氣品質測量有多準確？問題、設計與範疇尋找共址感測器整理與清洗 AQS感測器資料整理PurpleAir感測器資料探索PurpleAir與AQS測量值建立校準PurpleAir測量值之模型總結【第四部分】　其他資料來源第十三章　處理文字資料文字與任務的範例字串處理正規表達式文字分析總結第十四章　資料交換 NetCDF資料 JSON資料 HTTP REST XML、HTML與XPath 總結【第五部分】　線性建模第十五章　線性模型簡單線性模型範例：空氣品質的簡單線性模型擬合簡單線性模型多元線性模型擬合多元線性模型範例：哪裡是機會之地？數值型測量值之特徵工程類別型測量值的特徵工程總結第十六章　模型選擇過度擬合訓練-測試切分交叉驗證正則化模型偏誤與變異性總結第十七章　推論與預測的理論基礎分布：母體、經驗、抽樣假設檢定的基本概念以自助法推論信賴區間的基本概念預測區間的基本概念用於推論與預測的機率理論總結第十八章　案例研究：如何幫驢子秤體重？驢子研究的問題與範圍資料整理與轉換探索建立驢子體重的模型總結【第六部分】　分類第十九章　分類範例：風災倒木建模與分類對比例（與機率）建模邏輯斯模型的損失函數從機率到分類總結第二十章　數值最佳化梯度下降法基礎最小化Huber損失凸形且可微分的損失函數梯度下降法的變體總結第二十一章　個案研究：偵測假新聞問題與範疇取得與整理資料探索資料建模總結延伸資料資料來源索引

大家的想法

還沒有人留下心得，快來搶頭香！

撰寫您的閱讀心得

為您推薦

Deep Learning: 用Python進行深度學習的基礎理論實作 (1版)

書名：DEEP LEARNING｜用PYTHON進行深度學習的基礎理論實作出版社：歐萊禮出版年月：201708 條碼：9789864764846 內容簡介不走捷徑，幫助您真正搞懂「深度學習」的真義這是一本與「深度學習」有關的書籍。從入門開始說明，一步一步帶領你瞭解深度學習必須具備的知識。本書可以幫助您了解：深度學習究竟是什麼？有何特色？根據何種原理來運作？從零開始，由實做中學習本書的目標是，盡量避免使用不瞭解內容的「黑盒子」，以基礎的知識為起點，以容易上手的Python撰寫程式，從動手實作的過程中，一步步深入瞭解深度學習。若以車用書籍來比喻這本書的話，這本書並不屬於汽車駕訓教材，而是希望能夠幫助您瞭解車子的原理，而非教您開車的方法。為了瞭解汽車的結構，必須試著打開車子的引擎蓋，將每個零件都拿起來觀察、操作看看。然後盡量用簡單的形狀，篩選出車子的核心部分，就像組合迷你模型般，製作出這台車子。本書的目標，就是透過製作車子的過程，讓你感受到自己實際可以製作出車子，進而熟悉與車子的相關技術。本書特色：．利用最少的外部函式庫，使用Python，從零開始實際執行深度學習的程式。．說明Python 的用法，讓Python 的初學者也能理解。．實際執行Python 的原始碼，同時提供讀者手邊可以進行實驗的學習環境。．從簡單的機器學習問題開始，到最後執行精密辨識影像的系統。．以淺顯易懂的方式說明深度學習與神經網路理論。．針對看似複雜的技術，如誤差反向傳播與卷積運算等，利用實際操作方式說明，幫助理解。．介紹在執行深度學習時，有幫助且實用的技巧，包括決定學習率的方法、權重的預設值等。．說明Batch Normalization、Dropout、Adam 等最近的趨勢與操作。．為什麼深度學習很優秀，為什麼加深層數，就能提高辨識準確度，為什麼隱藏層很重要，仔細說明這些「為什麼」。．介紹自動運作、產生影像、強化學習等深度學習的應用範例。作者介紹作者簡介斎藤康毅 1984年生於長崎縣對馬，畢業於東京工業大學工學院，東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬，畢業於東京工業大學工學院，東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。目錄第一章 Python入門第二章感知器第三章神經網路第四章神經網路的學習第五章誤差反向傳播法第六章與學習有關的技巧第七章卷積神經網路第八章深度學習附錄A Softmax-with-Loss層的計算圖參考文獻

原價: ~~580~~ 售價: 493 現省: 87元

立即查看

Python資料科學學習手冊 (2版)

簡介處理大量資料的基本工具「這本書提供了清晰且易於遵循的範例，幫助您設置與使用最重要的資料科學和機器學習工具。」 —Anne Bonner Content Simplicity創辦人和CEO Python是許多研究人員的首選工具，它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中，藉由本書，您可以一次獲得這些資源，包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。對於熟悉Python，需要處理大量資料的資料科學家和資料處理人員來說，這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題，像是操作、轉換及清理資料，視覺化不同形式的資料，建立統計學或機器學習模型等。藉由本書，你將可以學習到： ‧IPython和Jupyter：提供資料科學家使用的Python計算環境 ‧NumPy：在Python中進行高效儲存及操作密集資料陣列的ndarrys ‧Pandas：在Python中進行對於標籤式/欄位式的資料高效率儲存與操作 ‧Matplotlib：在Python中進行彈性範圍的資料視覺化功能 ‧Scikit-Learn：提供機器學習演算法以及簡潔的Python實作作者介紹 Jake VanderPlas 是Google Research的軟體工程師，致力於開發支援資料密集型研究的工具。他創建並開發了用於資料密集型科學的Python工具，包括Scikit-Learn、SciPy、AstroPy、Altair、JAX等。目錄第一章 IPython：更好用的Python Shell還是Notebook IPython 的求助與說明文件在IPython Shell中的快捷鍵 IPython的Magic命令輸入和輸出的歷程 IPython和Shell命令和Shell相關的Magic命令錯誤以及除錯剖析和測定程式碼的時間第二章 NumPy介紹瞭解Python的資料型態 NumPy陣列基礎 NumPy 陣列屬性陣列索引：存取單一個陣列元素在NumPy陣列中的計算：Universal Functions 聚合操作：Min、Max、以及兩者間的所有事在陣列上的計算：Broadcasting 比較、遮罩以及布林邏輯 Fancy索引排序陣列結構化的資料：NumPy的結構化陣列更多進階的複合型態第三章使用Pandas操作資料安裝並使用Pandas Pandas 物件的介紹資料的索引和選擇在Pandas中操作資料處理缺失資料階層式索引資料集的合併：Concat 和Append 合併資料集：Merge 以及Join 聚合計算與分組樞紐分析表向量化字串操作使用時間系列高效率Pandas：eval() 以及query() 第四章使用Matplotlib進行視覺化通用的Matplotlib技巧買一送一的介面簡單的線條圖形簡單的散佈圖視覺化誤差密度圖和等高線圖直方圖、分箱法及密度自訂圖表的圖例自訂色彩條多重子圖表文字和註解自訂刻度客製化Matplotlib：系統配置和樣式表在Matplotlib中的三維繪圖法 Basemap的地理資料使用Seaborn進行視覺化第五章機器學習什麼是機器學習？ Scikit-Learn簡介超參數以及模型驗證特徵工程深究：Naive Bayes Classification 深究：線性迴歸（Linear Regression）深究：Support Vector Machines 深究：決策樹（Decision Tree）和隨機森林（Random Forest）深究：主成份分析（Principal Component Analysis）深究：流形學習（Manifold Learning）深究：k- 均集群法深究：高斯混合模型（Gaussian Mixture Models）深究：核密度估計（Kernel Density Estimation）應用：臉部辨識的管線

原價: ~~980~~ 售價: 830 現省: 150元

立即查看

Python資料科學學習手冊

書名：PYTHON資料科學學習手冊出版社：歐萊禮出版年月：201712 條碼：9789864766857 內容簡介需要處理大量資料的人必備的案頭書對於許多研究人員來說，Python是首選的工具，因為它擁有豐富的儲存、操作、以及洞察資料的程式庫。這些資源散布在資料科學的領域中，但藉由本書，你可以一口氣取得這些資源，包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn等等。對於需要處理大量資料的人而言，這是一本非常有價值的案頭書，可以有效率地處理每天面對的問題，像是操作、轉換，以及清理資料、視覺化不同形式的資料，建立統計學或機器學習的模型等等。藉由這本手冊，你將可以學習到如何使用：．IPython和Jupyter：提供資料科學家使用的Python計算環境。．NumPy：在Python中進行高效儲存以及操作密集資料陣列的ndarrys。．Pandas：在Python中進行對於標籤式/欄位式的資料高效率儲存與操作。．Matplotlib：在Python中進行彈性範圍的資料視覺化的能力。．Scikit-Learn：提供機器學習演算法以及簡潔的Python實作。名人推薦 ”如果你想要藉由Python學習資料科學，本書是一個極佳的起點。我用來教授電腦科學以及統計學獲得極大的成功。Jake在這些開放源碼的工具上的基礎上更進一步；使用了清晰的語言以及易懂的解釋闡述資料科學基礎的概念、範式、以及抽象的內容。“ -- Brian Granger, Jupyter計畫聯合創始人作者介紹作者簡介 Jake VanderPlas Python科學端的長期使用者以及開發者，目前是一位在Washington大學跨學科資料科學研究者。他主導自己的天文學研究，而且也會為來自於廣泛領域的本地科學家提供建議以及接受諮詢。目錄第一章 IPython：更好用的Python Shell還是Notebook IPython 的求助與說明文件在IPython Shell中的快捷鍵 IPython的Magic命令輸入和輸出的歷程 IPython和Shell命令和Shell相關的Magic命令錯誤以及除錯剖析和測定程式碼的時間第二章 NumPy介紹瞭解Python的資料型態 NumPy陣列基礎 NumPy 陣列屬性陣列索引：存取單一個陣列元素在NumPy陣列中的計算：Universal Functions 聚合操作：Min、Max、以及兩者間的所有事在陣列上的計算：Broadcasting 比較、遮罩以及布林邏輯 Fancy索引排序陣列結構化的資料：NumPy的結構化陣列更多進階的複合型態第三章使用Pandas操作資料安裝並使用Pandas Pandas 物件的介紹資料的索引和選擇在Pandas中操作資料處理缺失資料階層式索引資料集的合併：Concat 和Append 合併資料集：Merge 以及Join 聚合計算與分組樞紐分析表向量化字串操作使用時間系列高效率Pandas：eval() 以及query() 第四章使用Matplotlib進行視覺化通用的Matplotlib技巧買一送一的介面簡單的線條圖形簡單的散佈圖視覺化誤差密度圖和等高線圖直方圖、分箱法及密度自訂圖表的圖例自訂色彩條多重子圖表文字和註解自訂刻度客製化Matplotlib：系統配置和樣式表在Matplotlib中的三維繪圖法 Basemap的地理資料使用Seaborn進行視覺化第五章機器學習什麼是機器學習？ Scikit-Learn簡介超參數以及模型驗證特徵工程深入探究：Naive Bayes Classification 深入探究：線性迴歸（Linear Regression）深入探究：Support Vector Machines 深入探究：決策樹（Decision Tree）和隨機森林（Random Forest）深入探究：主成份分析（Principal Component Analysis）深入探究：流形學習（Manifold Learning）深入探究：k- 平均集群法深入探究：高斯混合模型（Gaussian Mixture Models）深入探究：核密度估計（Kernel Density Estimation）應用：臉部辨識的管線

原價: ~~780~~ 售價: 663 現省: 117元

立即查看

東京大學資料科學家養成全書：使用Python動手學習資料分析

原價: ~~780~~ 售價: 702 現省: 78元

立即查看

圖解機器學習與資料科學的數學基礎｜使用Python (1版)

內容簡介　　搞懂不會背叛你的數學，進一步提升你的程式功力！　　本書透過圖表解說人工智慧與資料科學領域的相關數學知識，並告訴你如何將其轉換為程式碼，除了可以吸收關於數學的知識之外，也能立即運用在工作上。　　透過機率統計的學習，了解如何改善業務流程　　本書將AI與資料科學的相關數學知識分成四大篇，第一篇的「機率統計、機器學習篇」介紹的是了解工作情況，篩選出必要資訊的流程，以及位於這個流程背後的機率統計、機器學習的數學知識。能掌握工作情況就能知道該如何改善相關業務，也能進一步觀察未來的變化。　　了解最佳化的步驟，學會職場所需的最佳化流程　　第二篇「數理最佳化篇」介紹最佳化業務的流程，以及解決業務問題的方法。要最佳化業務，就必須先了解哪些部分需要改善效率，換言之，最佳化的重點在於找出問題。了解最佳化的步驟與問題的種類，就能學會工作職場所需的最佳化流程。　　透過預測病毒的傳播模式，了解相關的數學理論　　第三篇「數值模擬篇」則以傳染染病的傳播為主題，學習預測這類傳播模式的微分。只要了解微分，就能了解病毒的傳播模式，也能利用動畫說明傳播模式與製作出臨場感十足的簡報。最後的「深度學習篇」則會先說明近年來發展神速的深度學習技術原理，再說明這些原因都於哪些技術或職場應用。來自讀者的讚譽　　「這是我買過最實用的書」　　「這本書可以讓你知道如何將數學應用在現實世界的工作之中」　　「這本書拯救了文科出身，在工作上又不得不面對數學的我」目錄序章｜設定 Python開發環境第一篇機率統計、機器學習篇第1章｜取得資料之後的第一件事第2章｜試著利用機器學習進行分析第3章｜推測必需的資料筆數第二篇數理最佳化篇第4章｜透過最佳路徑規劃問題，了解解決最佳化問題的方法第5章｜透過排班問題了解最佳化問題的全貌第三篇數値模擬篇第6章｜試著預測傳染病的影響第7章｜試著透過動畫模擬人類的行為第四篇深度學習篇第8章｜了解深度學習辨識影像的方法第9章｜了解深度學習處理時間序列資料的機制第10章｜了解以深度學習進行的圖片處理與語言處理 Appendix 程式設計與數學之間的橋梁 Appendix 1｜利用公式了解常態分佈 Appendix 2｜微分方程式差分法造成的誤差與泰勒展開式 Appendix 3｜非線性最佳化的機械學習／深度學習的迴歸／分類

原價: ~~650~~ 售價: 553 現省: 97元

立即查看

自學機器學習：上Kaggle接軌世界，成為資料科學家

原價: ~~680~~ 售價: 612 現省: 68元

立即查看

大家的想法

撰寫您的閱讀心得

書籍分類

您的購物車