書名: Python資料科學學習手冊 (2版)
作者: Jake VanderPlas
譯者: 何敏煌
版次: 2
ISBN: 9786263246843
出版社: OREILLY歐萊禮
出版日期: 2023/11
書籍開數、尺寸: 18.5x23x2.88
重量: 1.11 Kg
頁數: 636
內文印刷顏色: 單色
#資訊
#編程與軟體開發
#Python
定價: 980
售價: 833
庫存: 庫存: 2
LINE US! 詢問這本書 團購優惠、書籍資訊 等

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

詳細資訊

簡介 處理大量資料的基本工具 「這本書提供了清晰且易於遵循的範例,幫助您設置與使用最重要的資料科學和機器學習工具。」 —Anne Bonner Content Simplicity創辦人和CEO Python是許多研究人員的首選工具,它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中,藉由本書,您可以一次獲得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。 對於熟悉Python,需要處理大量資料的資料科學家和資料處理人員來說,這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題,像是操作、轉換及清理資料,視覺化不同形式的資料,建立統計學或機器學習模型等。 藉由本書,你將可以學習到: ‧IPython和Jupyter:提供資料科學家使用的Python計算環境 ‧NumPy:在Python中進行高效儲存及操作密集資料陣列的ndarrys ‧Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作 ‧Matplotlib:在Python中進行彈性範圍的資料視覺化功能 ‧Scikit-Learn:提供機器學習演算法以及簡潔的Python實作 作者介紹 Jake VanderPlas 是Google Research的軟體工程師,致力於開發支援資料密集型研究的工具。 他創建並開發了用於資料密集型科學的Python工具,包括Scikit-Learn、SciPy、AstroPy、Altair、JAX等。 目錄 第一章 IPython:更好用的Python Shell還是Notebook IPython 的求助與說明文件 在IPython Shell中的快捷鍵 IPython的Magic命令 輸入和輸出的歷程 IPython和Shell命令 和Shell相關的Magic命令 錯誤以及除錯 剖析和測定程式碼的時間 第二章 NumPy介紹 瞭解Python的資料型態 NumPy陣列基礎 NumPy 陣列屬性 陣列索引:存取單一個陣列元素 在NumPy陣列中的計算:Universal Functions 聚合操作:Min、Max、以及兩者間的所有事 在陣列上的計算:Broadcasting 比較、遮罩以及布林邏輯 Fancy索引 排序陣列 結構化的資料:NumPy的結構化陣列 更多進階的複合型態 第三章 使用Pandas操作資料 安裝並使用Pandas Pandas 物件的介紹 資料的索引和選擇 在Pandas中操作資料 處理缺失資料 階層式索引 資料集的合併:Concat 和Append 合併資料集:Merge 以及Join 聚合計算與分組 樞紐分析表 向量化字串操作 使用時間系列 高效率Pandas:eval() 以及query() 第四章 使用Matplotlib進行視覺化 通用的Matplotlib技巧 買一送一的介面 簡單的線條圖形 簡單的散佈圖 視覺化誤差 密度圖和等高線圖 直方圖、分箱法及密度 自訂圖表的圖例 自訂色彩條 多重子圖表 文字和註解 自訂刻度 客製化Matplotlib:系統配置和樣式表 在Matplotlib中的三維繪圖法 Basemap的地理資料 使用Seaborn進行視覺化 第五章 機器學習 什麼是機器學習? Scikit-Learn簡介 超參數以及模型驗證 特徵工程 深究:Naive Bayes Classification 深究:線性迴歸(Linear Regression) 深究:Support Vector Machines 深究:決策樹(Decision Tree)和隨機森林(Random Forest) 深究:主成份分析(Principal Component Analysis) 深究:流形學習(Manifold Learning) 深究:k- 均集群法 深究:高斯混合模型(Gaussian Mixture Models) 深究:核密度估計(Kernel Density Estimation) 應用:臉部辨識的管線

為您推薦

Python 函式庫語法範例字典

Python 函式庫語法範例字典

相關熱銷的書籍推薦給您

商品描述 <內容簡介> 彙整最常使用的 Python 函式庫語法 功能索引 + 字母順序查詢, 隨查隨用, 快速解決問題! Python 是近來非常熱門的程式語言, 原因之一就是具有豐富的標準函式庫及第三方套件可以使用, 用途涵蓋字串處理、數值計算、資料壓縮與封存、XML與 JSON 存取等層面。本書集合 Python 常用的函式及模組功能, 依用途分門別類, 提供詳細的使用說明、豐富的語法範例, 讓使用者可以在短時間內找到、學會函式的正確使用方式, 在撰寫程式時更加得心應手! <本書特色> ● 依功能分類, 每個函式都以豐富範例實際演練用法 ● 目錄上列有函式名稱與用途說明, 可依據名稱或是用途查詢 ● 可依字母順序快速查詢想使用的函式功能 ● 本書嚴選的模組功能包括: argparse/array/base64/beautifulsoup4/bisect/bz2/collections/ConfigParser/csv/datetime/dateutil/decimal/doctest/email/enum/fnmatch/glob/gzip/heapg/io/itertools/json/logging/lxml/lzma/math/multiprocessing/openpyxl/os/pathlib/paramiko/pdb/Pillow/pprint/PyCrypto/pydoc/pytest/pytz/random/re/requests/shutil/statistics/subprocess/sys/tartile/tempfile/time/timeit/traceback/unicodedata/unittest/unittest.mock/urllib.parse/weakref/xml.etree.ElementTree/yaml/zipfile/zlib ● 適用 Python 3

原價: 450 售價: 405 現省: 45元
立即查看
東京大學資料科學家養成全書:使用Python動手學習資料分析

東京大學資料科學家養成全書:使用Python動手學習資料分析

類似書籍推薦給您

原價: 780 售價: 702 現省: 78元
立即查看
必學! Python資料科學.機器學習最強套件: NumPy、Pandas、Matplotlib、OpenCV、Scikit-learn、tf.Keras

必學! Python資料科學.機器學習最強套件: NumPy、Pandas、Matplotlib、OpenCV、Scikit-learn、tf.Keras

類似書籍推薦給您

必學!Python資料科學‧機器學習最強套件-NumPy、Pandas、Matplotlib、OpenCV、scikit-learn、tf.Keras ISBN13:9789863126157 出版社:旗標出版社 作者:石川聡彥-著;施威銘研究室-監修 譯者:劉金讓 裝訂/頁數:平裝/448頁 規格:23cm*17cm*2.8cm (高/寬/厚) 重量:982克 版次:1 出版日:2021/04/19 中國圖書分類:電腦程式語言 內容簡介 最夯的 Python 套件解說 ✕ 最夯的資料科學、機器學習技術, 本書帶您一次學會!   Python 是近來最熱門的程式語言, 也是資料科學、機器學習實作時的首選語言。Python 之所以在這些領域大放異彩, 就是仰賴了各種功能強大的第三方套件, 不過套件百百款, 該從哪些下手呢?很簡單, 很少用到的先不用花太多時間, 我們挑常用、關鍵的先學好!本書為有志於學習資料科學、機器學習的初學者, 嚴選出 NumPy、Pandas、Matplotlib、OpenCV、scikit-learn、tf.Keras 等最強套件, 絕對是初學者必須好好掌握的!   NumPy 數值運算套件可以做資料高速運算, 許多套件也都是以 NumPy 為基礎建構而成, 經常得跟 NumPy 搭配使用, 一定要紮穩這個重要基石;   在面對龐大的資料時, 使用 Pandas、Matplotlib 可以輕鬆做資料整理, 並藉由繪圖獲取重要資訊, 是資料科學實作的強大利器;   OpenCV 是電腦視覺 (Computer Vision) 領域響叮噹的套件, 不管是裁切、縮放、輪廓偵測、過濾影像以強化資訊...各種影像處理功能一應俱全, 是影像辨識、機器學習做資料擴增的最強助手;   最後, 我們將帶您一窺 scikit-learn、tf.Keras 這兩個重量級套件如何在機器學習、深度學習領域中發揮關鍵性的作用, 我們會實際操演如何利用它們做資料預處理 (Preprocessing)、建構 KNN / SVM / 邏輯斯迴歸 (Logistic regression) / 決策樹 (Decision tree) / 隨機森林 (Random forest)…等監督式學習分類模型;以及建立 DNN、CNN 等影像辨識神經網路 (Neural network)。   看了本書之後, 你將深刻體會到各套件的強大之處, 利用短短幾行程式碼, 竟然瞬間完成許多運算、建模工作。不過各套件的函式、參數設定可不像網路文章寫的這麼單純, 當中有許多設定「眉角」需要特別注意, 為此, 小編都經過逐一詳測, 針對可能遇到的問題添加大量註解, 幫助讀者更加理解內容! 本書特色   □資料科學熱門套件解說   ‧紮穩 NumPy 重要基礎:axis、dimention、陣列切片、各種高速運算函式   ‧Pandas 資料分析技巧:資料清理、缺失值處理、快速取得各種統計數據   ‧Matplotlib 資料視覺化:繪製 2D / 3D 圖 / 子圖、比較資料的分布狀況   ‧OpenCV 影像處理:影像裁切 / 縮放 / 翻轉...做資料擴增, 二值化 (binarization) / 降雜訊...強化重要影像資訊   □最紮實的機器學習、深度學習實戰   ‧機器學習的資料預處理 (Data preprocessing)   ‧快速建構 KNN / SVM / 邏輯斯迴歸 (Logistic regression) / 決策樹 (Decision tree) / 隨機森林 (Random forest)...監督式學習分類模型   ‧建立 DNN、CNN 影像辨識神經網路 (Neural network)   ‧建模完只是第一步!各模型超參數 (Hyperparameter) 調整心法大公開!   □本書由【施威銘研究室監修】, 書中針對原書進行大量補充, 並適當添加註解, 幫助讀者更加理解內容! 目錄 第 1 章 Python 基礎:變數、 資料型別與 if 判斷式 第 2 章 Python 基礎:list、dict 與迴圈 第 3 章 函式、 類別與模組 第 4 章 進階函式及特殊容器 第 5 章 NumPy 高速運算套件 5-1 NumPy 的基本介紹 5-2 陣列的基本操作 5-2-1 建立陣列 5-2-2 陣列的切片操作 5-2-3 使用布林陣列篩選值 5-2-4 陣列的四則計算 5-2-5 體驗好用的 NumPy 函式 5-3 NumPy 多軸陣列 5-3-1 陣列的軸 (axis) 5-3-2 陣列的 shape 5-3-3 多軸陣列的切片做法 5-3-4 陣列轉置 (transpose) 5-3-5 陣列排序 5-3-6 陣列擴張 (Broadcasting) 5-3-7 用 NumPy 函式計算矩陣乘積 第 6 章 pandas 的基礎 6-1 pandas 簡介 6-2 Series 物件的操作處理 6-2-1 建立 Series 物件 6-2-2 取出 Series 當中的元素 6-2-3 單取出「索引值」或者「內容值」-.index、.values 6-2-4 新增 Series 物件的元素–append() 6-2-5 刪除 Series 物件的元素–drop() 6-2-6 從 Series 物件篩選出想要的元素 6-2-7 將 Series 的元素排序–sort_index()、 sort_values() 6-3 DataFrame 物件的操作處理 6-3-1 建立 DataFrame 物件–pd.DataFrame() 6-3-2 修改 index 和 column 的名稱–.index、.column 6-3-4 加入新的資料列–append() 6-3-4 加入新的欄位 6-3-5 取出 DataFrame 當中的元素–df.loc[]、df.iloc[] 6-3-6 刪除 df 物件的列或行–drop() 6-3-7 將欄位值依大小排序–sort_values() 6-3-8 從 df 物件篩選出想要的資料 第 7 章 DataFrame 的串接與合併 7-1 概念說明 7-2 用 concat() 串接多個 DataFrame 7-3 用 merge() 合併多個 DataFrame 第 8 章 DataFrame 的進階應用 8-1 載入外部檔案並做資料整理 8-2 處理 DataFrame 中的缺失值 8-2-1 用 dropna() 刪除含有 NaN (缺失值) 的列 8-2-2 用 fllna() 填補 NaN 值 8-3 分析數據常用到的技巧 (一) 8-3-1 duplicated()、drop_duplicated() - 尋找或刪除 DataFrame 內重複的資料 8-3-2 map()–利用 DataFrame 的既有欄位生成新的欄位 8-3-3 用 cut() 劃分、篩選資料 8-4 分析數據常用到的技巧 (二) 8-4-1 取頭尾列–head()、tail() ...

原價: 680 售價: 612 現省: 68元
立即查看
Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定! (1版)

Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定! (1版)

類似書籍推薦給您

Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定! ISBN13:9789863127246 出版社:旗標出版社 作者:陳會安 裝訂/頁數:平裝/616頁 規格:23cm*17cm*2.8cm (高/寬/厚) 重量:946克 出版日:2022/08/22 中國圖書分類:電腦科學 內容簡介 【題材涵蓋最全面!一本書掌握資料科學 / 數據工程必學 know-how!】   從大數據到人工智慧世代,其背後蘊含的關鍵技術與理論不脫資料科學、機器學習的範疇。基本上,資料科學需要的背景知識與技能相當的多,通常要會 Python 程式設計基礎、熟悉相關 Python 套件和模組的使用;再加上機器學習的基礎就是機率和統計,因此也免不了得學機率和統計知識,可說有一拖拉庫的主題等著你去學,也難怪市面上各主題 (程式基礎、統計、套件、機器學習建模...) 的專書滿坑滿谷,一時間實在讓人難以消化...   為了降低讀者初學資料科學面對的負擔以及混亂感,我們精心設計了這本入門實戰教本,秉持讓讀者「買一本抵多本」的精神,本書一次涵蓋所有入門必須熟悉的重要題材,同時也將初學資料科學的脈絡梳理清楚。   在章節的安排上,本書從資料取得的網路爬蟲開始,提供一個標準 SOP 來幫助讀者從網路取得資料;接著說明資料科學必學的 Python 重量級套件,再接著介紹機率、統計和探索式資料分析的基礎知識,最後進入最熱門的機器學習、深度學習建模主題。   這一連串「取得資料 → 探索資料 → 預測分析」是一套完整的資料科學 / 數據工程實戰訓練,跟著本書掌握這些重要 know-how 後,就不難看懂網路上眾多資料科學、機器學習專案的 Python 程式碼和線上教材,甚至參與資料科學、機器學習的網路競賽;希望本書能協助讀者開啟資料科學家 / 數據工程師的成功之路!   本書特色   □ 資料科學三部曲:取得資料 → 探索資料 → 預測分析 □ 一次補足最入門的統計和機率基礎 □ Python 開發環境與基礎語法快速上手 □ 從網頁爬蟲、資料清理到資料視覺化,快速完成資料探索的預處理程序 □ 將清理後的資料存入 SQL 資料庫,便於日後存取利用 □ 實踐資料科學的四大套件:NumPy、Pandas、Matplotlib、Seaborn 一次掌握 □ 用 Scikit-learn、tensorflow.Keras 套件實作最熱門的 AI 機器學習應用 目錄 第一篇 資料科學和 Python 基礎 第 1 章 資料科學概論與開發環境建立 – Anaconda 第 2 章 Python 程式語言   第二篇 網路爬蟲和 Open Data (取得、清理與儲存資料) 第 3 章 取得網路資料 第 4 章 資料擷取 第 5 章 資料清理與資料儲存 第 6 章 網路爬蟲實作案例   第三篇 Python資料科學套件 – 探索資料(資料視覺化與大數據分析) 第 7 章 向量與矩陣運算 – NumPy 套件 第 8 章 資料處理與分析 – Pandas 套件 第 9 章 大數據分析 (一) – Matplotlib 和 Pandas 資料視覺化 第 10 章 大數據分析 (二) – Seaborn 統計資料視覺化 第 11 章 機率與統計 第 12 章 估計與檢定 第 13 章 探索性資料分析實作案例   第四篇 人工智慧、機器學習與深度學習 – 預測資料 第 14 章 人工智慧與機器學習概論 – 認識深度學習 第 15 章 機器學習演算法實作案例 – 迴歸 第 16 章 機器學習演算法實作案例 – 分類與分群 第 17 章 深度學習神經網路實作案例   附錄 A:HTML 網頁結構與 CSS 附錄 B:Python 文字檔案存取與字串處理 附錄 C:下載與安裝 MongoDB 和 MySQL 資料庫

原價: 680 售價: 612 現省: 68元
立即查看
Python資料科學與機器學習:從入門到實作必備攻略

Python資料科學與機器學習:從入門到實作必備攻略

類似書籍推薦給您

原價: 650 售價: 553 現省: 97元
立即查看
圖解機器學習與資料科學的數學基礎|使用Python (1版)

圖解機器學習與資料科學的數學基礎|使用Python (1版)

類似書籍推薦給您

內容簡介   搞懂不會背叛你的數學,進一步提升你的程式功力!   本書透過圖表解說人工智慧與資料科學領域的相關數學知識,並告訴你如何將其轉換為程式碼,除了可以吸收關於數學的知識之外,也能立即運用在工作上。   透過機率統計的學習,了解如何改善業務流程   本書將AI與資料科學的相關數學知識分成四大篇,第一篇的「機率統計、機器學習篇」介紹的是了解工作情況,篩選出必要資訊的流程,以及位於這個流程背後的機率統計、機器學習的數學知識。能掌握工作情況就能知道該如何改善相關業務,也能進一步觀察未來的變化。   了解最佳化的步驟,學會職場所需的最佳化流程   第二篇「數理最佳化篇」介紹最佳化業務的流程,以及解決業務問題的方法。要最佳化業務,就必須先了解哪些部分需要改善效率,換言之,最佳化的重點在於找出問題。了解最佳化的步驟與問題的種類,就能學會工作職場所需的最佳化流程。   透過預測病毒的傳播模式,了解相關的數學理論   第三篇「數值模擬篇」則以傳染染病的傳播為主題,學習預測這類傳播模式的微分。只要了解微分,就能了解病毒的傳播模式,也能利用動畫說明傳播模式與製作出臨場感十足的簡報。最後的「深度學習篇」則會先說明近年來發展神速的深度學習技術原理,再說明這些原因都於哪些技術或職場應用。 來自讀者的讚譽   「這是我買過最實用的書」   「這本書可以讓你知道如何將數學應用在現實世界的工作之中」   「這本書拯救了文科出身,在工作上又不得不面對數學的我」 目錄 序章|設定 Python開發環境 第一篇機率統計、機器學習篇 第1章|取得資料之後的第一件事 第2章|試著利用機器學習進行分析 第3章|推測必需的資料筆數 第二篇 數理最佳化篇 第4章|透過最佳路徑規劃問題,了解解決最佳化問題的方法 第5章|透過排班問題了解最佳化問題的全貌 第三篇 數値模擬篇 第6章|試著預測傳染病的影響 第7章|試著透過動畫模擬人類的行為 第四篇 深度學習篇 第8章|了解深度學習辨識影像的方法 第9章|了解深度學習處理時間序列資料的機制 第10章|了解以深度學習進行的圖片處理與語言處理 Appendix 程式設計與數學之間的橋梁 Appendix 1|利用公式了解常態分佈 Appendix 2|微分方程式差分法造成的誤差與泰勒展開式 Appendix 3|非線性最佳化的機械學習/深度學習的迴歸/分類

原價: 650 售價: 553 現省: 97元
立即查看