看圖學Python:資料分析與資料視覺化 (1版)
類似書籍推薦給您
【簡介】
本書特色
1. 由淺入深,循序漸進
從基礎Python語言開始講解,適合初學者入門。完整說明Python程式設計的基本能力,包括變數、資料型態、控制流程、函式、物件導向等。
2. 圖文並茂,易學易懂
使用大量圖例和流程圖來詳細說明程式設計的觀念和語法,讓讀者更容易理解。
3. 結合ChatGPT,提升學習效率
介紹ChatGPT生成式AI,並提供了各種程式設計實例,幫助讀者更有效地學習Python。
4. 完整涵蓋Pandas資料分析
詳細說明Pandas套件的Python資料分析,包括資料匯入、匯出、篩選、編輯、彙整、清理、排序、合併、運算、群組分析、樞紐分析表、資料視覺化等。
5. 實戰導向,學以致用
本書提供大量實作範例,幫助讀者將所學知識應用於實際情況中。
內容簡介
本書是一本學習Python程式設計和資料分析的入門教材,適合初學者輕鬆上手。以Excel使用者的角度,詳細說明Pandas套件的Python資料分析,並透過ChatGPT生成式AI的幫助,讓讀者能夠更快、更輕鬆地學習Python程式設計和資料分析。
首先,本書從介紹Python程式語言的基礎開始,徹底解說讀者需要具備的程式設計能力,並介紹OpenAI推出的ChatGPT生成式AI,探討其在程式設計中的應用,以及如何利用ChatGPT來協助學習Python程式設計等相關技術。
其次,本書重點闡述Pandas套件在Python資料分析中的應用。從建立Series和DataFrame物件開始,逐步介紹了如何匯入和匯出不同格式的資料,以及如何進行資料篩選、操作和彙整。特別是在第14章至第16章中,通過具體的範例,讀者將學會如何進行資料清理、排序、合併,以及執行各種資料運算和視覺化。
本書的獨特之處在於將ChatGPT生成式AI融入到學習過程中,通過ChatGPT的幫助,讀者不僅可以寫出Python程式碼,還能夠自動產生商業模擬數據的學習範例,使得學習過程更加生動有趣,並且實際應用到商業資料分析中。
最後,本書使用豐富的圖例和流程圖詳細解說程式設計的觀念和語法,並利用fChart流程圖直譯器呈現動畫流程圖,幫助讀者更好地理解程式邏輯,從而提升解決問題的能力和思維邏輯。
《看圖學Python:資料分析與資料視覺化》不僅適用於計算機概論、程式設計和Python資料分析課程的教學,也是自學Python和資料分析的理想選擇。無論是對於初學者還是有一定程式基礎的讀者,本書都將成為你的良師益友,引領你踏入Python程式設計和資料分析的世界。
【目錄】
CH01 Python語言與運算思維基礎
1-1 程式與程式邏輯
1-2 認識Python、運算思維和Thonny
1-3 下載與安裝Thonny
1-4 使用Thonny建立第一個Python程式
1-5 Thonny基本使用與程式除錯
CH02 寫出和認識Python程式
2-1 開發Python程式的基本步驟
2-2 編輯現存的Python程式
2-3 建立第二個Python程式的加法運算
2-4 看看Python程式的內容
2-5 Python文字值
2-6 Python寫作風格
CH03 變數、運算式與運算子
3-1 程式語言的變數
3-2 在程式使用變數
3-3 變數的資料型態和型態轉換函數
3-4 讓使用者輸入變數值
3-5 認識運算式和運算子
3-6 在程式使用運算子
CH04 條件判斷
4-1 你的程式可以走不同的路
4-2 關係運算子與條件運算式
4-3 if單選條件敘述
4-4 if/else二選一條件敘述
4-5 if/elif/else多選一條件敘述
4-6 在條件敘述使用邏輯運算子
CH05 重複執行程式碼
5-1 認識迴圈敘述
5-2 for計數迴圈
5-3 while條件迴圈
5-4 改變迴圈的執行流程
5-5 巢狀迴圈與無窮迴圈
5-6 在迴圈中使用條件敘述
CH06 函數
6-1 認識函數
6-2 使用者自訂函數
6-3 函數的參數
6-4 函數的回傳值
6-5 函數的實際應用
6-6 變數範圍和內建函數
CH07 字串與容器型態
7-1 字串型態
7-2 串列型態
7-3 元組型態
7-4 字典型態
7-5 字串與容器型態的運算子
CH08 檔案、類別與例外處理
8-1 檔案處理
8-2 二進位檔案讀寫
8-3 類別與物件
8-4 建立例外處理
CH09 Python模組與套件
9-1 Python模組與套件
9-2 os模組:檔案操作與路徑處理
9-3 math模組:數學函數
9-4 turtle模組:海龜繪圖
9-5 pywin32套件:Office軟體自動化
CH10 使用ChatGPT學習Python程式設計
10-1 認識ChatGPT
10-2 註冊與使用ChatGPT
10-3 ChatGPT是你最佳的Python程式助手
10-4 ChatGPT應用:找出Python視窗程式的學習方向
10-5 ChatGPT應用:幫助你學習Python視窗程式設計
CH11 Pandas套件:匯入與匯出DataFrame
11-1 Pandas套件的基礎
11-2 建立Series和DataFrame物件
11-3 匯入外部資料
11-4 匯出DataFrame物件
11-5 實作案例:使用Pandas爬取HTML表格資料
CH12 檢視、選取與篩選DataFrame資料
12-1 檢視與了解DataFrame資料
12-2 檢視DataFrame的整體資訊
12-3 選取和走訪DataFrame整列與整欄資料
12-4 檢視DataFrame指定欄位的資訊
12-5 篩選DataFrame資料
12-6 實作案例:使用SQL語言篩選DataFrame資料
CH13 DataFrame索引、編輯與資料彙整
13-1 DataFrame索引設定
13-2 使用索引器選取DataFrame子集
13-3 編輯DataFrame資料
13-4 串聯多個DataFrame資料
13-5 實作案例:多個Excel工作表的資料彙整
CH14 DataFrame資料清理、排序與資料合併
14-1 字串與日期/時間的資料處理
14-2 DataFrame資料清理
14-3 DataFrame資料排序
14-4 DataFrame資料合併
14-5 實作案例:DataFrame商業資料清理
CH15 DataFrame資料運算、群組分析與樞紐分析表
15-1 DataFrame資料運算
15-2 DataFrame資料分組的群組分析
15-3 使用DataFrame建立樞紐分析表
15-4 實作案例:使用樞紐分析表進行資料分析
CH16 Pandas+Plotly Express資料視覺化
16-1 認識資料視覺化
16-2 Pandas資料視覺化
16-3 Plotly互動資料視覺化
16-4 實作案例:Tutsplus教學文件的資料視覺化
16-5 實作案例:台積電股價的互動資料視覺化
CHA Google Colab雲端服務基本使用(電子書)
立即查看
Python資料分析必備套件!Pandas資料清理、重塑、過濾、視覺化
類似書籍推薦給您
商品描述
內容介紹:
【最齊全!徹底活用Pandas的114技】
想學Pandas,看官方文件就夠了?
對於Python使用者來說,Pandas無疑是資料分析的必備套件。有了Pandas,您可以非常高效地重塑、過濾、清理以及整合大部分類型的資料。的確,Pandas的官方網站提供了不同指令的使用範例。因此有的使用者會說:『不用買書看啦!網路資源這麼豐富,多看看官方文件就好了!』
不過,單單只知道某個指令的運作方式是不足夠的。在實際進行資料分析時,您可能需要結合多個指令來達成目標。這時候,您更需要知道如何活用Pandas。舉例來說,假設您現在面對DataFrame的記憶體用量過大,導致無法順利分析資料的難題時,該怎麼辦呢?
從Pandas的官方文件中,您可以了解轉換欄位型別的方法,也知道如何查詢欄位的浮點數精度。只要結合這兩個方法,您就可以非常輕鬆地降低DataFrame的記憶體用量。遺憾的是,官方文件並不會告訴您這個訣竅,而必須自己花時間來摸索。在摸索的過程中,不可避免地會多走許多彎路。
本書並非單純的Pandas語法參考手冊。作者寫作此書時的目標,是希望讀者們可以從完整的範例中學習,並充分了解活用Pandas技巧的重要性。此外,作者習慣給出同一問題的不同解法,同時比較不同做法的效能。由此一來,讀者日後在實際分析資料時,才能知道哪一種做法是最優解。
目錄大綱
目錄:
☆第0章:Pandas 套件的基礎
0-1 DataFrame物件
0-2 DataFrame的屬性(attributes)
0-3 Series物件
0-4 Pandas中的資料型別
☆第1章:DataFrame及Series的基本操作
1-1 選取DataFrame的欄位
1-2 呼叫Series的方法(method)
1-3 Series的相關操作
1-4 串連Series的方法
1-5 更改欄位名稱
1-6 新增及刪除欄位
☆第2章:DataFrame的運算技巧
2-1 選取多個DataFrame的欄位
2-2 用方法選取欄位
2-3 對欄位名稱進行排序
2-4 DataFrame的統計方法
2-5 串連DataFrame的方法
2-6 DataFrame的算符運算
2-7 比較缺失值
2-8 轉置DataFrame運算的方向
2.9 案例演練:確定大學校園的多樣性
☆第3章:建立與保存DataFrame
3-1 從無到有建立DataFrame
3-2 存取CSV檔案
3-3 讀取大型的CSV檔案
3-4 使用Excel檔案
3-5 讀取ZIP檔案中的資料
3-6 存取資料庫
3-7 存取JSON格式的資料
3-8 讀取HTML表格
☆第4章:開始資料分析
4-1 制定資料分析的例行程序
4-2 資料字典
4-3 改變資料型別以減少記憶體用量
4-4 資料的排序
4-5 排序後選取每組的最大值和最小值
4-6 用sort_values()選取最大值
4-7 案例演練:計算移動停損單價格
☆第5章:探索式資料分析
5-1 摘要統計資訊
5-2 轉換欄位的資料型別
5-3 資料轉換與缺失值處理
5-4 檢視連續資料的分佈狀況
5-5 檢視不同分類的資料分佈
5-6 比較連續欄位的關聯性
5-7 比較分類欄位的關聯性
5-8 使用Profiling函式庫建立摘要報告
☆第6章:選取資料的子集
6-1 選取一筆或躲避Series資料
6-2 選取DataFrame的列
6-3 同時選取DataFrame的列與欄位
6-4 混用位置與標籤來選取資料
6-5 按標籤的字母順序進行切片
☆第7章:用布林陣列篩選特定的資料
7-1 計算布林陣列的統計資訊
7-2 設定多個布林條件
7-3 以布林陣列來進行過濾
7-4 布林選取 vs 索引選取
7-5 用唯一或已排序的索引標籤來選取資料
7-6 利用Pandas實現SQL中的功能
7-7 使用query方法提高布林選取的可讀性
7-8 使用where()維持Series的大小
7-9 對DataFrame的列進行遮罩
7-10 以布林陣列、位置數字和標籤選擇資料
☆第8章:索引對齊與尋找欄位最大值
8-1 檢驗Index物件
8-2 笛卡兒積
8-3 索引爆炸
8-4 填補缺失值
8-5 從不同的DataFrame增加欄位
8-6 凸顯每一欄位的最大值
8-7 串連方法來實現idxmax()的功能
8-8 尋找最常見的欄位最大值
☆第9章:透過分組來進行聚合、過濾和轉換
9-1 進行簡單的分組及聚合運算
9-2 對多個欄位執行分組及聚合運算
9-3 分組後刪除MultiIndex
9-4 使用自訂的聚合函式來分組
9-5 可接收多個參數的自訂聚合函式
9-6 深入了解groupby物件
9-7 過濾特定的組別
9-8 分組轉換特定欄位的資料
9-9 使用apply()計算加權平均數
9-10 以連續變化的數值進行分組
9-11 案例演練:計算城市之間的航班總數
9-12 案例演練:尋找航班的連續準時記錄
☆第10章:將資料重塑成整齊的形式
10-1 使用stack()整理『欄位名稱為變數值』的資料
10-2 使用melt()整理『欄位名稱為變數值』的資料
10-3 同時堆疊多組變數
10-4 欄位堆疊的反向操作
10-5 在彙總資料後進行反堆疊操作
10-6 使用groupby()模擬pivot_table的功能
10-7 重新命名各軸內的不同層級
10-8 重塑『欄位名稱包含多個變數』的資料
10-9 重塑『多個變數儲存在單一欄位內』的資料
10-10 整理『單一儲存格中包含多個值』的資料
10-11 整理『欄位名稱及欄位值包含變數』的資料
☆第11章:時間序列分析
11-1 了解Python和Pandas日期工具的差別
11-2 對時間序列切片
11-3 過濾包含時間資料的欄位
11-4 僅適用於DatetimeIndex的方法
11-5 依據時間區段重新分組
11-6 分組彙總同一時間單位的多個欄位
11-7 案例演練:以『星期幾』來統計犯罪率
11-8 使用匿名函式來分組
11-9 使用Timestamp與另一欄位來分組
☆第12章:利用Matplotlib、Pandas和Seaborn進行資料視覺化
12-1 Matplotlib入門
12-2 Matplotlib的物件導向指南
12-3 用Matplotlib視覺化資料
12-4 使用Pandas繪製基本圖形
12-5 視覺化航班資料集
12-6 使用堆疊面積圖找出趨勢
12-7 了解Seaborn和Pandas之間的區別
12-8 使用Seaborn進行多變量分析
Bonus A:組合多個DataFrame或Series
A-1 在DataFrame上添加新的列
A-2 連接多個DataFrame
A-3 concat()、join()和merge()的區別
A-4 連接到SQL資料庫
Bonus B:案例演練-使用Seaborn發現辛普森悖論
Bonus C:Pandas的效能、除錯與測試
C-1 轉換資料
C-2 apply()方法的效能
C-3 提高apply()的效能
C-4 快速檢視程式碼的技巧
C-5 在Jupyter中除錯
C-6 以Great Expectations來管理資料完整性
C-7 使用pytest來測試Pandas
C-8 使用Hypothesis產生測試
立即查看
用Excel學Python資料分析
類似書籍推薦給您
內容簡介
結合資料分析與Python、Excel
集Python、Excel、資料分析為一體是本書的最大特色。本書圍繞整個資料分析的基本流程,分別說明使用Excel與使用Python如何完成。內容包括:Python環境配置、Python基礎知識、資料來源的取得、資料概覽、資料預處理、數值操作、資料運算、時間序列、資料分組、樞紐分析表、結果檔匯出、資料視覺化等。
對比Excel學習Python
Python 雖然是一門程式語言,但是在資料分析領域實現的功能和Excel的基本功能一樣,而Excel 又是大家比較熟悉、容易上手的軟體,所以可以透過Excel資料分析去對比學習Python資料分析。對於同一個功能,本書會告訴你在Excel中怎麼做,並告訴你如何在Python裡頭完成相對應的的操作。
使用Python輕鬆完成自動化
以實戰案例說明如何在工作中應用Python。諸如:利用Python實現報表自動化、自動發送電子郵件、使用Python分析報表找出暢銷商品、不同門市的銷售佔比並完成相關圖表的繪製等等
目錄
推薦序
作者序
【入門篇】
第1章 資料分析基礎
【實踐篇】
第2章 熟悉鍋 - Python 基礎知識
第3章 Pandas 資料結構
第4章 準備食材 - 取得資料來源
第5章 淘米洗菜 - 數據預處理
第6章 菜品挑選 - 資料的選擇
第7章 切配菜品 - 數值操作
第8章 開始烹調 - 資料運算
第9章 炒菜計時器 - 時間序列
第10章 菜品分類 - 資料分組 / 樞紐分析表
第11章 水果拼盤 - 多表拼接
第12章 盛菜裝盤 - 結果匯出
第13章 菜品擺放 - 資料視覺化
【進階篇】
第14章 典型資料分析案例
第15章 NumPy 陣列
立即查看
超高效!Python × Excel 資料分析自動化:輕鬆打造你的完美工作法!
類似書籍推薦給您
立即查看
SQL × Power Automate × Python 自動化 Excel 與 Pandas 資料分析 (6版)
類似書籍推薦給您
【簡介】
Excel 使用者的最佳 SQL 語言入門書
讓資料處理、報表生成自動化!
【18 個一定要會的資料分析技巧!】
【輕鬆超入門 × 任務自動化 × 全方位上手資料分析 × 打造高效率工作術】
本書的目的是讓 Excel 使用者快速升級成 SQL 資料庫的使用者,學習如何使用 SQL 語言來進行 Excel 資料分析,並且以 SQL 角度來學習使用 Python 的 Pandas 套件,在 DataFrame 物件執行資料分析。
Excel 無所不能,但是功能操作繁雜。使用 SQL 語言,我們就只需要少少的程式碼來代替 Excel 功能,進行一系列的資料處理,包含排序、切割、篩選、合併、使用聚合函數、建立群組查詢,最後產生樞紐分析表。本書提供的 ChatGPT 提問模板,可以產生 SQL 及 Python 指令,幫助我們更快精通 Excel 與 Python 資料分析。
最後再結合 Power Automate 這套免費流程自動化工具,不僅能加速我們整理、命名報表檔案的效率,其內建的設定可以執行 SQL 語言,輕鬆完成自動化 Excel 資料分析。
▍你將學會
◆ 認識 RPA 與 Power Automate 基本概念及操作技巧
◆ 設定自動化流程,實現檔案批次命名、工作表合併
◆ 理解 SQL、Python 及資料庫結構的基本概念
◆ 使用 Pandas 來擷取網路表格資料
◆ 使用 SQL 指令和 Pandas 來處理 Excel 工作表資料
◆ 與 ChatGPT 對話,幫你寫出 SQL 及 Python 指令
▍本書應用範例
◆ 自動統計各個通路的業績總和
◆ 顯示業績達標狀況通知
◆ 自動在 Excel 執行 VBA 程式
◆ 使用 Pandas 套件爬取 HTML 表格資料
◆ 批次命名和移動檔案
◆ 撰寫 SQL 指令以建立樞紐分析表
◆ 將不同檔案資料合併到同一個工作表
◆ 讓 ChatGPT 幫你寫 SQL、Python 指令
▍適合讀者
◆ 經常使用 Excel 工作表進行資料分析的上班族
◆ 渴望學習 SQL、Python 但缺乏經驗的新手
◆ 追求工作流程自動化,希望融入 AI 技術以提升效率的人
【目錄】
第1章 RPA 與 Power Automate 基本使用
1-1 認識 Power Automate與 RPA
1-2 下載與安裝 Power Automate 桌面版
1-3 建立第一個 Power Automate 桌面流程
1-4 Power Automate 介面說明與匯出/匯入流程
1-5 Power Automate 的變數與資料型態
1-6 Power Automate 的條件、清單與迴圈
第2章 Power Automate × Excel 自動化應用
2-1 自動化建立與儲存 Excel 檔案
2-2 自動化在 Excel 工作表新增整列和整欄資料
2-3 自動化讀取和編輯 Excel 儲存格資料
2-4 自動化 Excel 工作表的處理
2-5 實作案例:自動化統計和篩選 Excel 工作表的資料
2-6 實作案例:自動化在 Excel 執行 VBA 程式
第3章 Power Automate 自動化下載 CSV 檔案與檔案處理
3-1 自動化檔案與資料夾處理
3-2 自動化日期 / 時間處理
3-3 實作案例:自動化依據副檔名來分類檔案
3-4 實作案例:自動化下載 CSV 檔案來匯入儲存至 Excel
第4章 使用 ChatGPT 學習 Python 程式設計
4-1 Python 變數、資料型別與運算子
4-2 流程控制
4-3 函數、模組與套件
4-4 容器型別
4-5 檔案與例外處理
4-6 實作案例:使用 ChatGPT 學習 Python 程式設計
第5章 Python 程式版 Excel:Pandas 套件
5-1 Pandas 基本使用
5-2 Pandas 資料讀取與儲存
5-3 Pandas 常用的資料處理
5-4 實作案例:使用 Pandas 匯入 / 匯出 Excel 資料
5-5 實作案例:使用 Pandas 爬取 HTML 表格資料
第6章 認識 Excel 工作表、資料庫和 SQL 語言
6-1 Excel 工作表與關聯式資料庫
6-2 認識 SQL 語言
6-3 實作案例:使用 ChatGPT 學習資料庫觀念
6-4 實作案例:使用 ChatGPT 寫出 SQL 指令敘述
第7章 在 Excel 工作表執行 SQL 指令
7-1 使用 Power Automate 在 Excel 執行 SQL 指令
7-2 使用 Excel VBA 在 Excel 執行 SQL 指令
7-3 使用 Python 在 Excel 和 DataFrame 執行 SQL 指令
7-4 建立適用 SQL 指令的 Excel 工作表
7-5 實作案例:處理 SQL 查詢結果的日期 / 時間資料
7-6 實作案例:將 Python 的 SQL 查詢結果匯出成 CSV 和 Excel 檔案
第8章 使用 SQL 顯示、篩選與排序 Excel 工作表
8-1 SQL 語言的 SELECT 指令
8-2 使用 SQL 指令顯示資料
8-3 使用 SQL 指令排序資料
8-4 使用 SQL 指令篩選資料
8-5 實作案例:使用 SQL 指令描述你的資料
8-6 實作案例:使用 SQL 指令找出你的排名
第9章 使用 SQL 編輯 Excel 工作表與彙整資料
9-1 使用 SQL 指令新增運算式和SQL函數欄位
9-2 使用 SQL 指令新增記錄
9-3 使用 SQL 指令更新資料
9-4 實作案例:使用 Power Automate + SQL 指令刪除記錄
9-5 實作案例:使用 Power Automate + SQL 指令彙整資料
第10章 使用 SQL 執行 Excel 多工作表查詢
10-1 Excel 多工作表查詢:子查詢
10-2 Excel 多工作表查詢:聯集查詢
10-3 Excel 多工作表查詢:合併查詢
10-4 實作案例:使用 Power Automate + SQL 合併工作表
第11章 使用 SQL 執行 Excel 工作表的資料清理
11-1 SQL 指令的 Null 空值處理
11-2 使用 SQL 指令處理遺漏值
11-3 使用 SQL 指令處理重複資料
11-4 使用 SQL 指令轉換資料類型和欄位值
11-5 實作案例:使用 Power Automate + SQL 執行 Excel 資料清理
第12章 使用 SQL 執行 Excel 工作表的資料分析與樞紐分析表
12-1 使用 Excel 建立樞紐分析表
12-2 使用 SQL 指令執行群組查詢
12-3 使用 SQL 指令建立樞紐分析表
12-4 實作案例:Power Automate + SQL 群組查詢建立樞紐分析表
附錄A Python 開發環境與註冊使用 ChatGPT
A-1 Python 開發環境:Thonny
A-2 註冊使用 ChatGPT
立即查看