書名: Python網路爬蟲:大數據擷取、清洗、儲存與分析 王者歸來 (2版)
作者: 洪錦魁
版次: 2
ISBN: 9789860776478
出版社: 深智數位
出版日期: 2021/10
書籍開數、尺寸: 17x23x2.76
頁數: 552
內文印刷顏色: 單色
#資訊
#編程與軟體開發
#Python
定價: 750
售價: 675
庫存: 已售完
LINE US! 詢問這本書 團購優惠、書籍資訊 等
此書籍已售完,調書籍需2-5工作日。建議與有庫存書籍分開下單

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

為您推薦

Python 函式庫語法範例字典

Python 函式庫語法範例字典

相關熱銷的書籍推薦給您

商品描述 <內容簡介> 彙整最常使用的 Python 函式庫語法 功能索引 + 字母順序查詢, 隨查隨用, 快速解決問題! Python 是近來非常熱門的程式語言, 原因之一就是具有豐富的標準函式庫及第三方套件可以使用, 用途涵蓋字串處理、數值計算、資料壓縮與封存、XML與 JSON 存取等層面。本書集合 Python 常用的函式及模組功能, 依用途分門別類, 提供詳細的使用說明、豐富的語法範例, 讓使用者可以在短時間內找到、學會函式的正確使用方式, 在撰寫程式時更加得心應手! <本書特色> ● 依功能分類, 每個函式都以豐富範例實際演練用法 ● 目錄上列有函式名稱與用途說明, 可依據名稱或是用途查詢 ● 可依字母順序快速查詢想使用的函式功能 ● 本書嚴選的模組功能包括: argparse/array/base64/beautifulsoup4/bisect/bz2/collections/ConfigParser/csv/datetime/dateutil/decimal/doctest/email/enum/fnmatch/glob/gzip/heapg/io/itertools/json/logging/lxml/lzma/math/multiprocessing/openpyxl/os/pathlib/paramiko/pdb/Pillow/pprint/PyCrypto/pydoc/pytest/pytz/random/re/requests/shutil/statistics/subprocess/sys/tartile/tempfile/time/timeit/traceback/unicodedata/unittest/unittest.mock/urllib.parse/weakref/xml.etree.ElementTree/yaml/zipfile/zlib ● 適用 Python 3

原價: 450 售價: 405 現省: 45元
立即查看
Python網路爬蟲與資料視覺化應用實務

Python網路爬蟲與資料視覺化應用實務

類似書籍推薦給您

原價: 650 售價: 585 現省: 65元
立即查看
Python網路文字探勘入門到上手:10堂基礎+5場實戰,搞定網路爬蟲、文本分析的淘金指南

Python網路文字探勘入門到上手:10堂基礎+5場實戰,搞定網路爬蟲、文本分析的淘金指南

類似書籍推薦給您

書名:Python網路文字探勘入門到上手:10堂基礎+5場實戰,搞定網路爬蟲、文本分析的淘金指南 作者:陳寬裕 出版社:五南 出版日期:2020/01/00 ISBN:9789577637000 內容簡介   文字探勘,離我們一點都不遙遠。   小至今天吃什麼,大至國際動態趨勢,   想知道風往哪吹熱度怎麼蹭,就是派它上場的時刻!   ✦每位渴望突破的程式設計新手都應該閱讀的一本書✦   隨書附贈光碟:內含範例程式資料檔、習題解答程式檔。從做中學,效果加倍!   翻開程式工具書就頭昏眼花的症頭   ✔口語化的親切教學,不怕你嫌生硬只怕你嫌囉嗦   埋頭學習卻經常找不到方向的迷航學子   ✔範例導引式編排,附習題,示範編碼、驗收成果。   不甘於紙上談兵的實用主義者   ✔豐富多元的探勘實作,PChome 24h、Google 學術、PTT八卦版   到達純文字極限,數位學習上癮的科技人   ✔QRcode影音課程畫龍點睛,針對部份操作重點,加強吸收力度。   ▶▶▶   大數據時代,網路的電子化文本恆河沙數,新聞、google、PTT、部落格、購物網、Facebook、Twitter,無一不是非結構化資料。偏偏在0和1的世界,要想馴服它們,就必須「轉換」為電腦可判讀的結構化資料。   這個「轉換」的過程,就是文字探勘的研究領域,具有高度商業價值。   本書給魚也給竿,帶領我們駕馭這項新興技術。   攜手踏入網路爬蟲的場域,無論你是——   ●程式設計零基礎,想在網路進行資料探勘的初心者   ●統計學一知半解,卻需要時刻關注最新動態的社群小編   ●需要快速調查、統合資源的市調顧問、行銷企劃工作者   ●正好缺乏質性文本分析數據的社會科學研究者   使用最新版本的Python3,易讀、易學且擴展性強的語法特點。   ●從零開始,由安裝教起,快速習得10大基本技巧、萃取有用資訊。   ●現學現賣,5大實戰演練,精進探勘能力:PChome 24h-商品資料、Google學術-論文資料、PTT 八卦版-PO文資料、誠品金石堂-書籍比價系統、PTT 政黑版-文字雲和長條圖。   ▶▶▶   按部就班,嗅得先機。   你,也可以是全新領域的開拓者! 目錄 自 序 Chapter 01 Python 簡介 1-1 何謂程式設計 1-2 Python 程式設計的特點 1-3 選擇 Python 作為第一種程式語言的理由 1-4 安裝Python 與環境設定 1-5 安裝編輯器:Visual Studio Code 1-6 建置Anaconda 開發環境 Chapter 02 資料型態 2-1 Python 處理的資料類型 2-2 數值型態 2-3 字串型態 2-4 變數 2-5 數值和字串間型態的轉換 Chapter 03 流程控制 3-1 流程控制的構成要素 3-2 條件分岐 3-3 input 函式 3-4 條件運算式的組成 3-5 多向的條件分岐 Chapter 04 串列與迴圈 4-1 串列的意義與操作 4-2 for 迴圈 4-3 for 迴圈和if 敘述的組合運用 4-4 range() 函式 4-5 亂數的運用 4-6 break 及continue 命令 4-7 while 迴圈 4-8 進階串列操作 Chapter 05 元組、字典與集合 5-1 元組 5-2 字典 5-3 集合 Chapter 06 函式 6-1 函式的意義 6-2 函式的參數 6-3 函式與變數的作用範圍 Chapter 07 錯誤與例外 7-1 錯誤的型態 7-2 例外 7-3 例外處理 7-4 錯誤的種類 Chapter 08 網頁爬蟲的簡單範例 8-1 網頁爬蟲(Web Scraping) 8-2 網路爬蟲的執行步驟 8-3 向網路伺服器發送請求服務的訊息 8-4 解析網頁資訊 8-5 BeautifulSoup 的運用:於自由時報電子報網站進行爬蟲 Chapter 09 向伺服器發送請求的方式 9-1 網頁爬蟲的基本步驟 9-2 送出簡單的GET 請求 9-3 送出帶有參數的GET 請求 9-4 送出帶有參數的GET 請求至Ajax 網頁 9-5 送出帶有Cookie 的GET 請求 9-6 送出帶有Headers 的GET 請求 9-7 以form 形式發送POST 請求 9-8 送出帶有登入Cookie 的POST 請求 9-9 模擬登入 Chapter 10 萃取有用資訊 10-1 網頁萃取的工作內容 10-2 本章所使用的範例網頁 10-3 走訪DOM 文件樹 10-4 搜尋DOM 文件樹 10-5 CSS 選擇器 Chapter 11 爬取「PChome 24h 購物」的商品資料 11-1 PChome 24h 購物網站 11-2 確認標的網站的URL 網址 11-3 送出 HTTP 請求,取得頁面資料(JSON 格式) 11-4 解析結果頁面資料,獲取商品資訊 11-5 將商品詳細資料,存入Excel 檔案中 11-6 建立主程式 Chapter 12 爬取「Google 學術搜尋」的論文資料 12-1 確認標的網站的URL 網址 12-2 送出HTTP 請求,取得搜尋結果頁面資料 12-3 取得各分頁的連結url 12-4 解析分頁資料,獲取分頁內的論文資料 12-5 彙總所有分頁的論文資料 12-6 將論文詳細資料,存入Excel 檔案中 12-7 建立主程式 12-8 執行爬蟲程式 12-9 使用平行處理技術 12-10 有關爬取Google 學術搜尋的結語 Chapter 13 爬取「PTT 八卦版」的PO 文資料 13-1 確認標的網站的URL 網址 13-2 送出HTTP 請求,取得頁面資料 13-3 取得八卦版目前總頁數 13-4 取得各分頁的連結url 13-5 取得各分頁中的PO 文標題 13-6 彙總所有分頁的PO 文標題 13-7 取得每篇PO 文之發言內容 13-8 彙整所有PO 文的相關資訊 13-9 將PO 文的詳細資料,存入Excel 檔案中 13-10 建立主程式 Chapter 14 書籍比價爬蟲 14-1 確認標的網站的URL 網址 14-2 送出HTTP 請求,取得頁面資料 14-3 取得搜尋結果的總頁數 14-4 取得各分頁的連結 14-5 取得每本書的詳細資料 14-6 取得每本書於誠品、金石堂的價格 14-7 取得分頁中各書籍的其它基本資料與比價資料 14-8 彙整所有書籍資料 14-9 將書籍比價資料,存入Excel 檔案中 14-10 建立主程式 Chapter 15 製作文字雲 15-1 簡介 15-2 建立主程式 15-3 取得所有PO 文的發言內容 15-4 繪製文字雲 15-5 繪製長條圖

原價: 450 售價: 383 現省: 67元
立即查看
Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術 (1版)

Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術 (1版)

類似書籍推薦給您

原價: 620 售價: 527 現省: 93元
立即查看
AI世代必備!Python×ChatGPT高效率工作術:從網路爬蟲到辦公室自動化超實務 (1版)

AI世代必備!Python×ChatGPT高效率工作術:從網路爬蟲到辦公室自動化超實務 (1版)

類似書籍推薦給您

【簡介】 最全面的 ChatGPT × Python 應用手冊! AI 詠唱寫程式,打造超快速自動化技巧! 學會對 AI 下指令,提升工作效能! ChatGPT 詠唱技巧+資料擷取術+辦公室自動化 本書將帶你學會「網路爬蟲」和「辦公室自動化」的 Python 程式設計,並結合使用 ChatGPT 指令和提示,寫出各種不同應用的 Python 程式,成為 AI 指令達人。 本書介紹了網路爬蟲的流程到實作,首先分析 HTML 網頁結構及標籤,將資料擷取下來後進行資料處理與轉換,接著實際爬取天氣、電影、電商網頁。另外,本書的職場自動化技巧,包含彙整 Excel 資料、製作統計圖表、批次命名及移動圖片、自動寄開會通知信,讓你輕鬆駕馭日常工作,建立全方位的自動化辦公室! 23 個自動化範例 + 8 個套件 = 活用資料擷取術、節省繁瑣工作 你將學會 ● 取得、剖析和擷取網頁資料 ● 將爬取的資料轉為 Excel 檔案 ● 用 ChatGPT 寫網路爬蟲程式,擷取不同類型的資料 ● 使用 openpyxl 和 pandas 繪製圖表 ● 自動建立與編輯 Word、PPT 內容 ● 撰寫客戶回應信件、產生 PDF 報表 ● 寫出 SQLite / MySQL 資料庫程式 ● 串接 ChatGPT API,讓你在 LINE 使用 AI 聊天機器人 適合讀者 本書適合想要快速學會 Python 和 ChatGPT 詠唱的程式新手,也適合對資料處理、資料分析與資料視覺化有需求的從業人員。 本書範例檔案 本書提供 Python 範例程式、完整的 ChatGPT 提示文字及產出程式碼。 【目錄】 第一篇:Python X ChatGPT 程式設計與 HTML「超」入門 01 使用 ChatGPT 學習 Python 程式設計 1-1 Python 變數、資料型別與運算子 1-2 流程控制 1-3 函式、模組與套件 1-4 容器型別 1-5 檔案與例外處理 1-6 ChatGPT 應用:Python 程式設計小幫手 02 爬取的資料來源:HTML、CSV 和 JSON 2-1 HTML 與 CSS 基礎 2-2 資料標籤 – 文字和圖片標籤 2-3 群組標籤 – 清單、表格和結構標籤 2-4 網站巡覽 – 超連結標籤 2-5 CSV 與 JSON 2-6 ChatGPT 應用:學習 HTML 標籤的 CSS 選擇器 第二篇:Python X ChatGPT 網路爬蟲SOP 標準作業程序「超」實務 03 作業步驟一:認識網路爬蟲與 HTML 網頁分析 3-1 網路爬蟲與 URL 網址 3-2 認識 JavaScript 動態網頁內容 3-3 建立 Python 網路爬蟲的 SOP 3-4 使用開發人員工具分析 HTML 網頁結構 3-5 ChatGPT 應用:分析 Bootstrap 相簿網頁的標籤結構 04 作業步驟二:Requests 和 Selenium 取得網路資料 4-1 使用 requests 取得網路資料 4-2 使用 Selenium 取得網路資料 4-3 取得 HTML 表單送回的網路資料 4-4 使用 Web API 取得網路資料 4-5 ChatGPT 應用:取得無限捲動網頁的資料 4-6 ChatGPT 應用:剖析 OpenWeatherMap 的 JSON 天氣資料 05 作業步驟三:BeautifulSoup 剖析和擷取網頁資料 5-1 使用 BeautifulSoup 擷取網頁資料 5-2 使用正規表達式擷取網頁資料 5-3 Selenium+BeautifulSoup 擷取網頁資料 5-4 偽裝成瀏覽器送出 HTTP 請求 5-5 ChatGPT 應用:爬取 Bootstrap 相簿網頁的照片資訊 06 作業步驟四:Pandas 清理爬取資料與儲存 6-1 Pandas 基本使用 6-2 Pandas 資料讀取與儲存 6-3 Pandas 常用的資料處理 6-4 Pandas 資料清理 6-5 ChatGPT 應用:使用字串函式進行資料處理與清理 07 ChatGPT 應用實務:Python X ChatGPT 網路爬蟲實戰 7-1 擷取多筆記錄和 HTML 表格資料 7-2 擷取多頁面的分頁記錄資料 7-3 ChatGPT 應用實務:使用 Selenium 自動登入會員網站 7-4 ChatGPT 應用實務:爬取 PTT BBS 看板討論區的貼文 第三篇:Python X ChatGPT X Excel 資料統計分析「超自動化」實務 08 自動化下載圖檔、圖檔處理與批次檔案操作 8-1 自動化下載網路圖檔 8-2 PIL 影像處理自動化 8-3 os 與 shutil 模組的檔案操作自動化 8-4 ChatGPT 應用:自動批次重新命名和移動檔案 8-5 ChatGPT 應用:自動批次圖檔處理 09 自動化 Excel 活頁簿編輯操作 9-1 Excel 自動化與 openpyxl 套件 9-2 自動化建立 Excel 檔案和工作表 9-3 自動化讀取、更新與走訪 Excel 儲存格資料 9-4 自動化 Excel 工作表管理 9-5 ChatGPT 應用:將 CSV 和 JSON 資料自動匯入 Excel 10 自動化 Excel 資料統計與 VBA 10-1 自動化統計 Excel 工作表的整欄與整列資料 10-2 在 Excel 儲存格自動化套用公式和 Excel 函式 10-3 自動化 Python X Excel 建立樞紐分析表 10-4 使用 Python 程式自動化執行 Excel VBA 10-5 ChatGPT 應用:實作 Python X Excel 自動化工具箱 11 ChatGPT 應用實務:Python X Excel 與 Pandas 資料視覺化 11-1 認識資料視覺化與基本圖表 11-2 在 Excel 工作表自動化繪製統計圖表 11-3 ChatGPT 應用實務:Python X Excel 資料視覺化 11-4 ChatGPT 應用實務:Pandas 資料視覺化 第四篇:Python X ChatGPT X Office 辦公室事務「超自動化」實務 12 自動化處理 Word 文件與 PowerPoint 簡報 12-1 Python 的 Word 文件自動化 12-2 Python 的 PowerPoint 簡報自動化 12-3 ChatGPT 應用:自動調整 Word 標題文字的樣式與對齊 12-4 ChatGPT 應用:自動在 PowerPoint 投影片繪製圖表 13 自動化處理 PDF 文件與 Email 電子郵件 13-1 pywin32 套件:Office 軟體自動化 13-2 自動化 PDF 檔案處理 13-3 自動化寄送 Email 電子郵件 13-4 ChatGPT 應用:Excel X Email 自動寄送開會通知 14 自動化匯整各種表格資料至 SQL 資料庫 14-1 自動化轉換 Word、HTML 和 PDF 表格成 Excel 14-2 SQLite 資料庫的基本使用 14-3 將 CSV、JSON 和 Excel 資料存入 SQLite 資料庫 14-4 ChatGPT 應用:自動合併多個 Excel 檔案 14-5 ChatGPT 應用:產生 SQL 指令與改用 MySQL 資料庫 15 ChatGPT API 自動化撰寫客戶回應與產生 PDF 報表 15-1 使用 Open AI 的 ChatGPT API 15-2 自動化 Word 模版文件處理 15-3 Python X Excel 使用 Word 模版產生 PDF 報表 15-4 ChatGPT 應用:ChatGPT API X Word 模版撰寫客戶回應的 Word 文件 16 ChatGPT 應用實務:ChatGPT API 和 LINE Bot 聊天機器人 16-1 Flask 的基本使用 16-2 使用 Replit 雲端 Python 開發環境 16-3 ChatGPT 應用實務:Flask+SQLite 建立 Web API 16-4 ChatGPT 應用實務:ChatGPT API 和 LINE Bot 聊天機器人 附錄A Python 開發環境與註冊使用 ChatGPT A-1 Python 開發環境:Thonny A-2 註冊使用 ChatGPT

原價: 680 售價: 578 現省: 102元
立即查看
文科生也可以輕鬆學習網路爬蟲:Python+Web Scraper

文科生也可以輕鬆學習網路爬蟲:Python+Web Scraper

類似書籍推薦給您

文科生也可以輕鬆學習網路爬蟲:Python+Web Scraper 系列名:程式設計 ISBN13:9789865029067 出版社:碁峰資訊 作者:陳會安 裝訂/頁數:平裝/464頁 規格:23cm*17cm (高/寬) 出版日:2021/08/25 中國圖書分類:電腦程式語言 內容簡介   ★使用免寫程式的Web Scraper爬蟲工具和Python輕鬆學習網路爬蟲!   *本書使用Web Scraper瀏覽器擴充功能的爬蟲工具,讓你不用撰寫程式碼,就可以建立CSS選擇器的網站爬取地圖從網站擷取資料,不只能夠輕鬆爬取約7~8成網站,更透過Web Scraper工具讓你輕鬆一邊爬一邊學習HTML標籤+CSS選擇器,輕鬆了解Web網頁內容和各種網站巡覽結構。   *Python網路爬蟲程式不只能夠爬取Web Scraper工具爬取的網站內容,對於進階JavaScript動態和使用者互動網站,我們可以配合Python+Selenium爬取各種使用者互動網站,讓你在瀏覽器看得到的資料,就可以爬到資料;最後說明Python的Pandas資料清理和Plotly資料視覺化。 目錄 第一篇:Web Scraper網路爬蟲-免寫程式邊爬邊學HTML+CSS 第1章 認識網路爬蟲、HTML和CSS 第2章 爬取HTML標題、段落與文字格式標籤 第3章 爬取清單項目和表格標籤 第4章 爬取圖片和超連結標籤 第5章 爬取HTML容器和版面配置標籤 第6章 爬取階層選單和上/下頁巡覽網站 第7章 爬取頁碼、更多按鈕和無限捲動頁面巡覽的網站 第8章 Web Scraper爬蟲實戰:新聞、商務和金融數據爬取 第二篇:Python網路爬蟲-網路資料擷取「全方位」實戰 第9章 認識Python網路爬蟲 第10章 使用requests和Selenium取得網路資料 第11章 Beautiful Soup剖析與擷取網頁資料 第12章 使用Python爬取AJAX、互動網頁與Web API 第13章 Python爬蟲實戰(一):爬取清單、表格與分頁資料 第14章 Python爬蟲實戰(二):Web API、AJAX與互動網頁資料爬取 第三篇:Python大數據分析-資料清理與資料視覺化 第15章 Pandas資料清理-pandas 第16章 Python資料視覺化-plotly 附錄 A Python程式設計入門(電子書,請線上下載) 附錄 B 離線安裝本書使用的瀏覽器擴充功能(電子書,請線上下載) 附錄 C Web Scraper 爬蟲網站地圖(電子書,請線上下載)

原價: 520 售價: 442 現省: 78元
立即查看