搜尋建議
書名: 資料科學學習手冊|Python資料處理、探索、視覺化與建模實作 (1版)
作者: Sam Lau, Joseph Gonzalez, Deborah Nolan
譯者: 楊新章/ 楊翔宇
版次: 1
ISBN: 9786264252591
出版社: 碁峰資訊
出版日期: 2026/01
書籍開數、尺寸: 23*18.5
頁數: 630
#資訊
#編程與軟體開發
#Python
定價: 980
折扣: 8.5
售價: 833
庫存: 現貨: 2
查看店內位置
LINE US! 詢問這本書 團購優惠、書籍資訊 等

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

【簡介】 「這本書正是我當年提出『資料科學家』這個職稱時,所希望能擁有的一本書。如果您希望投身資料科學/工程、人工智慧,或機器學習領域,就該從這裡開始。」 ── DJ Patil 博士,美國首任首席資料科學家 身為一位有志成為資料科學家的讀者,能夠理解各類組織為何仰賴資料來做出關鍵決策──無論是公司在設計網站、還是市政府在改善公共服務,或者是科學家在致力於阻止疾病擴散。而您也希望具備將雜亂資料整理為可行洞見的能力。我們將這整個過程稱為「資料科學生命週期」:也就是從資料的收集、整理、分析,到導出結論的完整流程。 本書是第一本涵蓋程式設計與統計兩大基礎技能、並貫穿整個資料科學生命週期的書籍。本書的對象包括希望成為資料科學家的人、與資料科學家共事的專業人士,以及希望跨越「技術/非技術」界線的資料分析師。只要具備基本的 Python 程式設計知識,便可學習如何透過業界標準工具(如 pandas)來處理資料: .將感興趣的問題精煉為可透過資料探究的研究問題 .執行資料蒐集,其中可能涉及文字處理、網頁爬蟲等技術 .透過資料清理、探索與視覺化,萃取出有價值的洞見 .學會使用建模來描述資料特性 .推廣研究結果,進行超出資料本身的推論 【目錄】 前言 【第一部分 資料科學生命週期】 第一章 資料科學生命週期 生命週期的各個階段 生命週期的範例 總結 第二章 問題與資料範疇 大數據與新機會 研究母體、抽樣架構與樣本 儀器與操作程序 自然現象的量測 準確度 總結 第三章 模擬與資料設計 抽籤模型 範例:模擬選舉民調的偏誤與變異性 範例:模擬疫苗的隨機試驗 範例:空氣品質測量 總結 第四章 以摘要統計量建構模型 常數模型 最小化損失 總結 第五章 個案研究:為什麼我的公車總是拖班? 問題與範疇 資料整理 探索公車時間 建立等車時間模型 總結 【第二部分】 矩形資料 第六章 使用pandas操作資料框架 子集合選取(Subsetting) 匯總 合併 轉換 資料框架與其他資料表達法有何不同? 總結 第七章 使用SQL操作關係 子集合選取(Subsetting) 匯總 合併 轉換與共通表格運算式 總結 【第三部分】 理解資料 第八章 整理檔案 資料來源範例 檔案格式 檔案編碼 檔案大小 殼層與命令行工具 表格形狀與粒度 總結 第九章 整理資料框架 範例:整理冒納羅亞觀測站的CO2測量資料 品質檢查 缺漏的值與紀錄 轉換與時間戳記 修改結構 範例:處理餐廳安全違規資料 總結 第十章 探索性資料分析 特徵類型 觀察分布的重點 在關係中應注意的事項 多變數情境下的比較 探索準則 範例:房屋售價 總結 第十一章 資料視覺化 選擇合適的刻度以揭示結構 資料的平滑化與匯總 促進有意義的比較 融入資料設計 加入情境資訊 使用plotly繪製圖表 其他視覺化工具 總結 第十二章 案例研究:空氣品質測量有多準確? 問題、設計與範疇 尋找共址感測器 整理與清洗 AQS感測器資料 整理PurpleAir感測器資料 探索PurpleAir與AQS測量值 建立校準PurpleAir測量值之模型 總結 【第四部分】 其他資料來源 第十三章 處理文字資料 文字與任務的範例 字串處理 正規表達式 文字分析 總結 第十四章 資料交換 NetCDF資料 JSON資料 HTTP REST XML、HTML與XPath 總結 【第五部分】 線性建模 第十五章 線性模型 簡單線性模型 範例:空氣品質的簡單線性模型 擬合簡單線性模型 多元線性模型 擬合多元線性模型 範例:哪裡是機會之地? 數值型測量值之特徵工程 類別型測量值的特徵工程 總結 第十六章 模型選擇 過度擬合 訓練-測試切分 交叉驗證 正則化 模型偏誤與變異性 總結 第十七章 推論與預測的理論基礎 分布:母體、經驗、抽樣 假設檢定的基本概念 以自助法推論 信賴區間的基本概念 預測區間的基本概念 用於推論與預測的機率理論 總結 第十八章 案例研究:如何幫驢子秤體重? 驢子研究的問題與範圍 資料整理與轉換 探索 建立驢子體重的模型 總結 【第六部分】 分類 第十九章 分類 範例:風災倒木 建模與分類 對比例(與機率)建模 邏輯斯模型的損失函數 從機率到分類 總結 第二十章 數值最佳化 梯度下降法基礎 最小化Huber損失 凸形且可微分的損失函數 梯度下降法的變體 總結 第二十一章 個案研究:偵測假新聞 問題與範疇 取得與整理資料 探索資料 建模 總結 延伸資料 資料來源 索引

大家的想法

還沒有人留下心得,快來搶頭香!

撰寫您的閱讀心得

為您推薦

Deep Learning: 用Python進行深度學習的基礎理論實作 (1版)

Deep Learning: 用Python進行深度學習的基礎理論實作 (1版)

相關熱銷的書籍推薦給您

書名:DEEP LEARNING|用PYTHON進行深度學習的基礎理論實作 出版社:歐萊禮 出版年月:201708 條碼:9789864764846 內容簡介 不走捷徑,幫助您真正搞懂「深度學習」的真義 這是一本與「深度學習」有關的書籍。從入門開始說明,一步一步帶領你瞭解深度學習必須具備的知識。本書可以幫助您了解:深度學習究竟是什麼?有何特色?根據何種原理來運作? 從零開始,由實做中學習 本書的目標是,盡量避免使用不瞭解內容的「黑盒子」,以基礎的知識為起點,以容易上手的Python撰寫程式,從動手實作的過程中,一步步深入瞭解深度學習。若以車用書籍來比喻這本書的話,這本書並不屬於汽車駕訓教材,而是希望能夠幫助您瞭解車子的原理,而非教您開車的方法。為了瞭解汽車的結構,必須試著打開車子的引擎蓋,將每個零件都拿起來觀察、操作看看。然後盡量用簡單的形狀,篩選出車子的核心部分,就像組合迷你模型般,製作出這台車子。本書的目標,就是透過製作車子的過程,讓你感受到自己實際可以製作出車子,進而熟悉與車子的相關技術。 本書特色: .利用最少的外部函式庫,使用Python,從零開始實際執行深度學習的程式。 .說明Python 的用法,讓Python 的初學者也能理解。 .實際執行Python 的原始碼,同時提供讀者手邊可以進行實驗的學習環境。 .從簡單的機器學習問題開始,到最後執行精密辨識影像的系統。 .以淺顯易懂的方式說明深度學習與神經網路理論。 .針對看似複雜的技術,如誤差反向傳播與卷積運算等,利用實際操作方式說明,幫助理解。 .介紹在執行深度學習時,有幫助且實用的技巧,包括決定學習率的方法、權重的預設值等。 .說明Batch Normalization、Dropout、Adam 等最近的趨勢與操作。 .為什麼深度學習很優秀,為什麼加深層數,就能提高辨識準確度,為什麼隱藏層很重要,仔細說明這些「為什麼」。 .介紹自動運作、產生影像、強化學習等深度學習的應用範例。 作者介紹 作者簡介 斎藤康毅 1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。 目錄 第一章 Python入門 第二章 感知器 第三章 神經網路 第四章 神經網路的學習 第五章 誤差反向傳播法 第六章 與學習有關的技巧 第七章 卷積神經網路 第八章 深度學習 附錄A Softmax-with-Loss層的計算圖 參考文獻

原價: 580 售價: 493 現省: 87元
立即查看
Python資料科學學習手冊 (2版)

Python資料科學學習手冊 (2版)

類似書籍推薦給您

簡介 處理大量資料的基本工具 「這本書提供了清晰且易於遵循的範例,幫助您設置與使用最重要的資料科學和機器學習工具。」 —Anne Bonner Content Simplicity創辦人和CEO Python是許多研究人員的首選工具,它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中,藉由本書,您可以一次獲得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。 對於熟悉Python,需要處理大量資料的資料科學家和資料處理人員來說,這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題,像是操作、轉換及清理資料,視覺化不同形式的資料,建立統計學或機器學習模型等。 藉由本書,你將可以學習到: ‧IPython和Jupyter:提供資料科學家使用的Python計算環境 ‧NumPy:在Python中進行高效儲存及操作密集資料陣列的ndarrys ‧Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作 ‧Matplotlib:在Python中進行彈性範圍的資料視覺化功能 ‧Scikit-Learn:提供機器學習演算法以及簡潔的Python實作 作者介紹 Jake VanderPlas 是Google Research的軟體工程師,致力於開發支援資料密集型研究的工具。 他創建並開發了用於資料密集型科學的Python工具,包括Scikit-Learn、SciPy、AstroPy、Altair、JAX等。 目錄 第一章 IPython:更好用的Python Shell還是Notebook IPython 的求助與說明文件 在IPython Shell中的快捷鍵 IPython的Magic命令 輸入和輸出的歷程 IPython和Shell命令 和Shell相關的Magic命令 錯誤以及除錯 剖析和測定程式碼的時間 第二章 NumPy介紹 瞭解Python的資料型態 NumPy陣列基礎 NumPy 陣列屬性 陣列索引:存取單一個陣列元素 在NumPy陣列中的計算:Universal Functions 聚合操作:Min、Max、以及兩者間的所有事 在陣列上的計算:Broadcasting 比較、遮罩以及布林邏輯 Fancy索引 排序陣列 結構化的資料:NumPy的結構化陣列 更多進階的複合型態 第三章 使用Pandas操作資料 安裝並使用Pandas Pandas 物件的介紹 資料的索引和選擇 在Pandas中操作資料 處理缺失資料 階層式索引 資料集的合併:Concat 和Append 合併資料集:Merge 以及Join 聚合計算與分組 樞紐分析表 向量化字串操作 使用時間系列 高效率Pandas:eval() 以及query() 第四章 使用Matplotlib進行視覺化 通用的Matplotlib技巧 買一送一的介面 簡單的線條圖形 簡單的散佈圖 視覺化誤差 密度圖和等高線圖 直方圖、分箱法及密度 自訂圖表的圖例 自訂色彩條 多重子圖表 文字和註解 自訂刻度 客製化Matplotlib:系統配置和樣式表 在Matplotlib中的三維繪圖法 Basemap的地理資料 使用Seaborn進行視覺化 第五章 機器學習 什麼是機器學習? Scikit-Learn簡介 超參數以及模型驗證 特徵工程 深究:Naive Bayes Classification 深究:線性迴歸(Linear Regression) 深究:Support Vector Machines 深究:決策樹(Decision Tree)和隨機森林(Random Forest) 深究:主成份分析(Principal Component Analysis) 深究:流形學習(Manifold Learning) 深究:k- 均集群法 深究:高斯混合模型(Gaussian Mixture Models) 深究:核密度估計(Kernel Density Estimation) 應用:臉部辨識的管線

原價: 980 售價: 830 現省: 150元
立即查看
Python資料科學學習手冊

Python資料科學學習手冊

類似書籍推薦給您

書名:PYTHON資料科學學習手冊 出版社:歐萊禮 出版年月:201712 條碼:9789864766857 內容簡介 需要處理大量資料的人必備的案頭書 對於許多研究人員來說,Python是首選的工具,因為它擁有豐富的儲存、操作、以及洞察資料的程式庫。這些資源散布在資料科學的領域中,但藉由本書,你可以一口氣取得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn等等。 對於需要處理大量資料的人而言,這是一本非常有價值的案頭書,可以有效率地處理每天面對的問題,像是操作、轉換,以及清理資料、視覺化不同形式的資料,建立統計學或機器學習的模型等等。 藉由這本手冊,你將可以學習到如何使用: .IPython和Jupyter:提供資料科學家使用的Python計算環境。 .NumPy:在Python中進行高效儲存以及操作密集資料陣列的ndarrys。 .Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作。 .Matplotlib:在Python中進行彈性範圍的資料視覺化的能力。 .Scikit-Learn:提供機器學習演算法以及簡潔的Python實作。 名人推薦 ”如果你想要藉由Python學習資料科學,本書是一個極佳的起點。我用來教授電腦科學以及統計學獲得極大的成功。Jake在這些開放源碼的工具上的基礎上更進一步;使用了清晰的語言以及易懂的解釋闡述資料科學基礎的概念、範式、以及抽象的內容。“ -- Brian Granger, Jupyter計畫聯合創始人 作者介紹 作者簡介 Jake VanderPlas Python科學端的長期使用者以及開發者,目前是一位在Washington大學跨學科資料科學研究者。他主導自己的天文學研究,而且也會為來自於廣泛領域的本地科學家提供建議以及接受諮詢。 目錄 第一章 IPython:更好用的Python Shell還是Notebook IPython 的求助與說明文件 在IPython Shell中的快捷鍵 IPython的Magic命令 輸入和輸出的歷程 IPython和Shell命令 和Shell相關的Magic命令 錯誤以及除錯 剖析和測定程式碼的時間 第二章 NumPy介紹 瞭解Python的資料型態 NumPy陣列基礎 NumPy 陣列屬性 陣列索引:存取單一個陣列元素 在NumPy陣列中的計算:Universal Functions 聚合操作:Min、Max、以及兩者間的所有事 在陣列上的計算:Broadcasting 比較、遮罩以及布林邏輯 Fancy索引 排序陣列 結構化的資料:NumPy的結構化陣列 更多進階的複合型態 第三章 使用Pandas操作資料 安裝並使用Pandas Pandas 物件的介紹 資料的索引和選擇 在Pandas中操作資料 處理缺失資料 階層式索引 資料集的合併:Concat 和Append 合併資料集:Merge 以及Join 聚合計算與分組 樞紐分析表 向量化字串操作 使用時間系列 高效率Pandas:eval() 以及query() 第四章 使用Matplotlib進行視覺化 通用的Matplotlib技巧 買一送一的介面 簡單的線條圖形 簡單的散佈圖 視覺化誤差 密度圖和等高線圖 直方圖、分箱法及密度 自訂圖表的圖例 自訂色彩條 多重子圖表 文字和註解 自訂刻度 客製化Matplotlib:系統配置和樣式表 在Matplotlib中的三維繪圖法 Basemap的地理資料 使用Seaborn進行視覺化 第五章 機器學習 什麼是機器學習? Scikit-Learn簡介 超參數以及模型驗證 特徵工程 深入探究:Naive Bayes Classification 深入探究:線性迴歸(Linear Regression) 深入探究:Support Vector Machines 深入探究:決策樹(Decision Tree)和隨機森林(Random Forest) 深入探究:主成份分析(Principal Component Analysis) 深入探究:流形學習(Manifold Learning) 深入探究:k- 平均集群法 深入探究:高斯混合模型(Gaussian Mixture Models) 深入探究:核密度估計(Kernel Density Estimation) 應用:臉部辨識的管線

原價: 780 售價: 663 現省: 117元
立即查看
東京大學資料科學家養成全書:使用Python動手學習資料分析

東京大學資料科學家養成全書:使用Python動手學習資料分析

類似書籍推薦給您

原價: 780 售價: 702 現省: 78元
立即查看
圖解機器學習與資料科學的數學基礎|使用Python (1版)

圖解機器學習與資料科學的數學基礎|使用Python (1版)

類似書籍推薦給您

內容簡介   搞懂不會背叛你的數學,進一步提升你的程式功力!   本書透過圖表解說人工智慧與資料科學領域的相關數學知識,並告訴你如何將其轉換為程式碼,除了可以吸收關於數學的知識之外,也能立即運用在工作上。   透過機率統計的學習,了解如何改善業務流程   本書將AI與資料科學的相關數學知識分成四大篇,第一篇的「機率統計、機器學習篇」介紹的是了解工作情況,篩選出必要資訊的流程,以及位於這個流程背後的機率統計、機器學習的數學知識。能掌握工作情況就能知道該如何改善相關業務,也能進一步觀察未來的變化。   了解最佳化的步驟,學會職場所需的最佳化流程   第二篇「數理最佳化篇」介紹最佳化業務的流程,以及解決業務問題的方法。要最佳化業務,就必須先了解哪些部分需要改善效率,換言之,最佳化的重點在於找出問題。了解最佳化的步驟與問題的種類,就能學會工作職場所需的最佳化流程。   透過預測病毒的傳播模式,了解相關的數學理論   第三篇「數值模擬篇」則以傳染染病的傳播為主題,學習預測這類傳播模式的微分。只要了解微分,就能了解病毒的傳播模式,也能利用動畫說明傳播模式與製作出臨場感十足的簡報。最後的「深度學習篇」則會先說明近年來發展神速的深度學習技術原理,再說明這些原因都於哪些技術或職場應用。 來自讀者的讚譽   「這是我買過最實用的書」   「這本書可以讓你知道如何將數學應用在現實世界的工作之中」   「這本書拯救了文科出身,在工作上又不得不面對數學的我」 目錄 序章|設定 Python開發環境 第一篇機率統計、機器學習篇 第1章|取得資料之後的第一件事 第2章|試著利用機器學習進行分析 第3章|推測必需的資料筆數 第二篇 數理最佳化篇 第4章|透過最佳路徑規劃問題,了解解決最佳化問題的方法 第5章|透過排班問題了解最佳化問題的全貌 第三篇 數値模擬篇 第6章|試著預測傳染病的影響 第7章|試著透過動畫模擬人類的行為 第四篇 深度學習篇 第8章|了解深度學習辨識影像的方法 第9章|了解深度學習處理時間序列資料的機制 第10章|了解以深度學習進行的圖片處理與語言處理 Appendix 程式設計與數學之間的橋梁 Appendix 1|利用公式了解常態分佈 Appendix 2|微分方程式差分法造成的誤差與泰勒展開式 Appendix 3|非線性最佳化的機械學習/深度學習的迴歸/分類

原價: 650 售價: 553 現省: 97元
立即查看
自學機器學習:上Kaggle接軌世界,成為資料科學家

自學機器學習:上Kaggle接軌世界,成為資料科學家

類似書籍推薦給您

原價: 680 售價: 612 現省: 68元
立即查看
書籍資訊 詳細資訊 & 心得 為您推薦

書籍分類

  • 資訊 資訊
  • 工程 工程
  • 數學與統計學 數學與統計學
  • 機率與統計 機率與統計
  • 自然科學 自然科學
  • 健康科學 健康科學
  • 地球與環境 地球與環境
  • 建築、設計與藝術 建築、設計與藝術
  • 人文與社會科學 人文與社會科學
  • 教育 教育
  • 語言學習與考試 語言學習與考試
  • 法律 法律
  • 會計與財務 會計與財務
  • 大眾傳播 大眾傳播
  • 觀光與休閒餐旅 觀光與休閒餐旅
  • 考試用書 考試用書
  • 研究方法 研究方法
  • 商業與管理 商業與管理
  • 經濟學 經濟學
  • 心理學 心理學
  • 生活 生活
  • 生活風格商品 生活風格商品
  • 參考書/測驗卷/輔材 參考書/測驗卷/輔材
您的購物車
貼心提醒:中文書超過5本,原文書超過3本超商容易超重,建議選擇宅配或分開下單