書名: Python網路文字探勘入門到上手:10堂基礎+5場實戰,搞定網路爬蟲、文本分析的淘金指南
作者: 陳寬裕
ISBN: 9789577637000
出版社: 五南
出版日期: 2019/12
書籍開數、尺寸: 17x23x1.86
重量: 0.66 Kg
頁數: 372
內文印刷顏色: 單色
#資訊
#編程與軟體開發
#Python
定價: 450
售價: 383
庫存: 庫存: 1
LINE US! 詢問這本書 團購優惠、書籍資訊 等

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

詳細資訊

書名:Python網路文字探勘入門到上手:10堂基礎+5場實戰,搞定網路爬蟲、文本分析的淘金指南 作者:陳寬裕 出版社:五南 出版日期:2020/01/00 ISBN:9789577637000 內容簡介   文字探勘,離我們一點都不遙遠。   小至今天吃什麼,大至國際動態趨勢,   想知道風往哪吹熱度怎麼蹭,就是派它上場的時刻!   ✦每位渴望突破的程式設計新手都應該閱讀的一本書✦   隨書附贈光碟:內含範例程式資料檔、習題解答程式檔。從做中學,效果加倍!   翻開程式工具書就頭昏眼花的症頭   ✔口語化的親切教學,不怕你嫌生硬只怕你嫌囉嗦   埋頭學習卻經常找不到方向的迷航學子   ✔範例導引式編排,附習題,示範編碼、驗收成果。   不甘於紙上談兵的實用主義者   ✔豐富多元的探勘實作,PChome 24h、Google 學術、PTT八卦版   到達純文字極限,數位學習上癮的科技人   ✔QRcode影音課程畫龍點睛,針對部份操作重點,加強吸收力度。   ▶▶▶   大數據時代,網路的電子化文本恆河沙數,新聞、google、PTT、部落格、購物網、Facebook、Twitter,無一不是非結構化資料。偏偏在0和1的世界,要想馴服它們,就必須「轉換」為電腦可判讀的結構化資料。   這個「轉換」的過程,就是文字探勘的研究領域,具有高度商業價值。   本書給魚也給竿,帶領我們駕馭這項新興技術。   攜手踏入網路爬蟲的場域,無論你是——   ●程式設計零基礎,想在網路進行資料探勘的初心者   ●統計學一知半解,卻需要時刻關注最新動態的社群小編   ●需要快速調查、統合資源的市調顧問、行銷企劃工作者   ●正好缺乏質性文本分析數據的社會科學研究者   使用最新版本的Python3,易讀、易學且擴展性強的語法特點。   ●從零開始,由安裝教起,快速習得10大基本技巧、萃取有用資訊。   ●現學現賣,5大實戰演練,精進探勘能力:PChome 24h-商品資料、Google學術-論文資料、PTT 八卦版-PO文資料、誠品金石堂-書籍比價系統、PTT 政黑版-文字雲和長條圖。   ▶▶▶   按部就班,嗅得先機。   你,也可以是全新領域的開拓者! 目錄 自 序 Chapter 01 Python 簡介 1-1 何謂程式設計 1-2 Python 程式設計的特點 1-3 選擇 Python 作為第一種程式語言的理由 1-4 安裝Python 與環境設定 1-5 安裝編輯器:Visual Studio Code 1-6 建置Anaconda 開發環境 Chapter 02 資料型態 2-1 Python 處理的資料類型 2-2 數值型態 2-3 字串型態 2-4 變數 2-5 數值和字串間型態的轉換 Chapter 03 流程控制 3-1 流程控制的構成要素 3-2 條件分岐 3-3 input 函式 3-4 條件運算式的組成 3-5 多向的條件分岐 Chapter 04 串列與迴圈 4-1 串列的意義與操作 4-2 for 迴圈 4-3 for 迴圈和if 敘述的組合運用 4-4 range() 函式 4-5 亂數的運用 4-6 break 及continue 命令 4-7 while 迴圈 4-8 進階串列操作 Chapter 05 元組、字典與集合 5-1 元組 5-2 字典 5-3 集合 Chapter 06 函式 6-1 函式的意義 6-2 函式的參數 6-3 函式與變數的作用範圍 Chapter 07 錯誤與例外 7-1 錯誤的型態 7-2 例外 7-3 例外處理 7-4 錯誤的種類 Chapter 08 網頁爬蟲的簡單範例 8-1 網頁爬蟲(Web Scraping) 8-2 網路爬蟲的執行步驟 8-3 向網路伺服器發送請求服務的訊息 8-4 解析網頁資訊 8-5 BeautifulSoup 的運用:於自由時報電子報網站進行爬蟲 Chapter 09 向伺服器發送請求的方式 9-1 網頁爬蟲的基本步驟 9-2 送出簡單的GET 請求 9-3 送出帶有參數的GET 請求 9-4 送出帶有參數的GET 請求至Ajax 網頁 9-5 送出帶有Cookie 的GET 請求 9-6 送出帶有Headers 的GET 請求 9-7 以form 形式發送POST 請求 9-8 送出帶有登入Cookie 的POST 請求 9-9 模擬登入 Chapter 10 萃取有用資訊 10-1 網頁萃取的工作內容 10-2 本章所使用的範例網頁 10-3 走訪DOM 文件樹 10-4 搜尋DOM 文件樹 10-5 CSS 選擇器 Chapter 11 爬取「PChome 24h 購物」的商品資料 11-1 PChome 24h 購物網站 11-2 確認標的網站的URL 網址 11-3 送出 HTTP 請求,取得頁面資料(JSON 格式) 11-4 解析結果頁面資料,獲取商品資訊 11-5 將商品詳細資料,存入Excel 檔案中 11-6 建立主程式 Chapter 12 爬取「Google 學術搜尋」的論文資料 12-1 確認標的網站的URL 網址 12-2 送出HTTP 請求,取得搜尋結果頁面資料 12-3 取得各分頁的連結url 12-4 解析分頁資料,獲取分頁內的論文資料 12-5 彙總所有分頁的論文資料 12-6 將論文詳細資料,存入Excel 檔案中 12-7 建立主程式 12-8 執行爬蟲程式 12-9 使用平行處理技術 12-10 有關爬取Google 學術搜尋的結語 Chapter 13 爬取「PTT 八卦版」的PO 文資料 13-1 確認標的網站的URL 網址 13-2 送出HTTP 請求,取得頁面資料 13-3 取得八卦版目前總頁數 13-4 取得各分頁的連結url 13-5 取得各分頁中的PO 文標題 13-6 彙總所有分頁的PO 文標題 13-7 取得每篇PO 文之發言內容 13-8 彙整所有PO 文的相關資訊 13-9 將PO 文的詳細資料,存入Excel 檔案中 13-10 建立主程式 Chapter 14 書籍比價爬蟲 14-1 確認標的網站的URL 網址 14-2 送出HTTP 請求,取得頁面資料 14-3 取得搜尋結果的總頁數 14-4 取得各分頁的連結 14-5 取得每本書的詳細資料 14-6 取得每本書於誠品、金石堂的價格 14-7 取得分頁中各書籍的其它基本資料與比價資料 14-8 彙整所有書籍資料 14-9 將書籍比價資料,存入Excel 檔案中 14-10 建立主程式 Chapter 15 製作文字雲 15-1 簡介 15-2 建立主程式 15-3 取得所有PO 文的發言內容 15-4 繪製文字雲 15-5 繪製長條圖

為您推薦

統計學 (15版)

統計學 (15版)

其他會員也一起購買

產品介紹 本書內容採用問題情境導向的編寫方式,以解決實務問題為目標,引導出統計方法的介紹與應用。同時提供豐富的個案、範例與習題,闡明統計在商業及經濟領域的廣泛用途。讓讀者可隨時練習將統計方法應用在實務資料的處理上,有助於提升學習興趣。 邊欄、註腳及評註:邊欄註釋是本書的特色之一,將重要的概念標示於邊欄,用以強調內文中所提及的重要觀念。各章節後面附有評註,目的在提供學生對統計的方法及應用有更深入的瞭解。評註包括統計方法在應用上的警告或限制、應用建議、技術性考量的簡要說明等等。 方法習題、應用習題及補充習題:章節後習題分成兩個部分:「方法」和「應用」。「方法」習題要求學生使用公式及進行必要的計算。「應用」習題則要求學生於真實世界的實際情形中使用該章教材。補充習題與個案問題則是讓學生嘗試解決問題,以評估自己對於該單元的了解程度。 本書包含200個以上的Excel檔資料集,可供學生以統計軟體操作練習。附有資料集的練習題可在邊欄看到圖案標示。 目錄 第1章 資料與統計 第2章 敘述統計:表格與圖形法 第3章 敘述統計:數值方法 第4章 機率導論 第5章 離散機率分配 第6章 連續機率分配 第7章 抽樣與抽樣分配 第8章 區間估計 第9章 假設檢定 第10章 兩母體平均數與比例的推論 第11章 母體變異數的推論 第12章 比較多個比例、獨立性與適合度的檢定 第13章 實驗設計與變異數分析 第14章 簡單線性迴歸 第15章 複迴歸 第16章 迴歸分析:模型建立 附錄 A參考文獻與書目 B表格 C總和符號 D以Excel計算p值

原價: 820 售價: 762 現省: 58元
立即查看
Python 函式庫語法範例字典

Python 函式庫語法範例字典

相關熱銷的書籍推薦給您

商品描述 <內容簡介> 彙整最常使用的 Python 函式庫語法 功能索引 + 字母順序查詢, 隨查隨用, 快速解決問題! Python 是近來非常熱門的程式語言, 原因之一就是具有豐富的標準函式庫及第三方套件可以使用, 用途涵蓋字串處理、數值計算、資料壓縮與封存、XML與 JSON 存取等層面。本書集合 Python 常用的函式及模組功能, 依用途分門別類, 提供詳細的使用說明、豐富的語法範例, 讓使用者可以在短時間內找到、學會函式的正確使用方式, 在撰寫程式時更加得心應手! <本書特色> ● 依功能分類, 每個函式都以豐富範例實際演練用法 ● 目錄上列有函式名稱與用途說明, 可依據名稱或是用途查詢 ● 可依字母順序快速查詢想使用的函式功能 ● 本書嚴選的模組功能包括: argparse/array/base64/beautifulsoup4/bisect/bz2/collections/ConfigParser/csv/datetime/dateutil/decimal/doctest/email/enum/fnmatch/glob/gzip/heapg/io/itertools/json/logging/lxml/lzma/math/multiprocessing/openpyxl/os/pathlib/paramiko/pdb/Pillow/pprint/PyCrypto/pydoc/pytest/pytz/random/re/requests/shutil/statistics/subprocess/sys/tartile/tempfile/time/timeit/traceback/unicodedata/unittest/unittest.mock/urllib.parse/weakref/xml.etree.ElementTree/yaml/zipfile/zlib ● 適用 Python 3

原價: 450 售價: 405 現省: 45元
立即查看
精通Python網路開發 (1版)

精通Python網路開發 (1版)

類似書籍推薦給您

【簡介】 使用Python套件與框架完成網路自動化、監控、雲端和管理 👍 台灣旅美資深網路技術專家最新實戰指南 👍 教你用Python點滿網路自動化的技能樹 👍 涵蓋Docker、Python、GitLab與DevOps技術 👍 從基礎技能到建構企業級API全面掌握 🎯 適合所有希望拓展技能並追求網路自動化(NetDevOps)的網路工程師! 「本書書名是《精通Python網路開發》,但涵蓋範圍遠遠超出了Python腳本。我僅使用這本書,就足以讓我經驗豐富、精通CLI的網路安全工程師團隊,快速了解網路自動化及其相關知識。簡言之,尋求專注於自動化的網路工程師,可將本書視為網路工程庫的重要補充。」 --Daniel Luechtefeld -Snowdog 技術和網络首席顧問 在基礎設施中,網路決定了應用程序部署、維護和服務方式。身為一種強大的程式語言,Python為網路工程師提供了許多工具,讓他們能像過去的系統工程師與程式開發者一樣,探索與操作設備。在《精通Python網路開發》一書中,您將開始一段以Python為基礎的旅程,從傳統的網路工程師轉變為能適應下一代網路的網路開發人員。 本書針對新的Python特性和DevOps框架進行全面更新。新增了關於Docker容器和Python3 Async IO的章節,每一章也使用最新的函式庫和範例,以確保相容性與對概念的理解。 從Python的基本概述開始,您將學習與傳統網路設備和支援API的網路設備互動的方法。利用高階Python套件與框架來執行網路自動化任務、監控、管理和強化網路安全,深入研究AWS和Azure雲端服務與運算,使用Git管理程式碼、GitLab實作持續整合,運用基於Python撰寫的測試工具來驗證網路。 您將學到: *使用Python與網路設備互動 *了解Docker開發與部署的方式 *使用Python和各種工具獲取網路資訊 *學習使用ELK執行網路資料分析 *使用Flask並建置一個高階API與企業內部應用程式互動 *發現Python3的新Async IO特性與概念 *探索測試驅動開發的概念並使用PyTest來驅動程式碼測試的覆蓋率 *了解使用GitLab與網路中的DevOps實例 【目錄】 推薦序 第四版 繁體中文序 前言 Chapter 1:TCP/IP 協定套組與 Python 的回顧   網際網路概述   開放式系統互聯(OSI)模型   主從式模型   網路協定套組   Python 語言概述   總結 Chapter 2:底層網路設備互動   使用 CLI 的挑戰   建立虛擬實驗環境   Python 虛擬環境   Python Pexpect 函式庫   Python Paramiko 函式庫   Netmiko 函式庫   Nornir 框架   總結 Chapter 3:應用程式介面(API)與意圖驅動網路開發   基礎設施即程式碼(IaC)   Cisco API 範例   Cisco Meraki 控制器   Python API 與 Juniper Networks 設備互動的方法   Arista Python API 介面   VyOS 範例   其他函式庫   總結 Chapter 4:Python 自動化框架 - Ansible   Ansible - 更具宣告性的框架   我們的第一個 Ansible 網路範例   Ansible 的優點   Ansible 內容集合   更多的 Ansible 網路範例   總結 Chapter 5:面向網路工程師的 Docker 容器   Docker 概述   在 Docker 建立 Python 應用程式   容器聯網   網路工程領域中的容器   Docker 與 Kubernates   總結 Chapter 6:使用 Python 來實現網路安全   實驗環境設置   Python Scapy 工具   存取列表   Syslog 搜尋   其他工具   進一步學習 Python   總結 Chapter 7:使用 Python 來進行網路監控 - 第 1 部分   實驗環境設置   簡單網路管理協定(SNMP)   Python 用於資料視覺化   將 Python 應用於 Cacti   總結 Chapter 8:使用 Python 來執行網路監控 - 第 2 部分   Graphviz 工具   流量式監測   ntop 流量監測   總結 Chapter 9:使用 Python 建立網路網頁伺服器   Python web 框架比較   Flask 與實驗環境設置   Flask 的介紹   網路資源 API   網路動態操作   身分驗證與授權   容器內執行 Flask   總結 Chapter 10:Async IO 介紹   非同步操作概述   Python asyncio 模組   Scrapli 專案   總結 Chapter 11:AWS 雲端網路開發   AWS 設置   AWS 網路概述   虛擬私有雲   專用網路連線(Direct Connect)與 VPN   網路擴充服務   其他 AWS 網路服務   總結 Chapter 12:Azure 雲端網路開發   Azure 與 AWS 網路服務比較   Azure 設置說明   Azure 管理與 API   Azure 全球基礎設施   Azure 虛擬網路   VNet 路由   Azure 虛擬私有網路(Azure VPN)   Azure ExpressRoute 服務   Azure 網路負載平衡器   其他 Azure 網路服務   總結 Chapter 13:利用 Elastic Stack 執行網路資料分析   Elastic Stack 是什麼?   實驗環境拓樸   Elastic Stack 即服務   第一個端到端範例   利用 Python client 與 Elasticsearch 互動   利用 Logstash 進行資料攝取   利用 Beats 進行資料攝取   利用 Elasticsearch 進行搜尋   利用 Kibana 來達到資料視覺化   總結 Chapter 14:Git 的使用   內容管理考量與 Git   Git 介紹   設置 Git   Git 使用範例   Git 分支操作說明   利用 Python 操作 Git   自動組態備份   使用 Git 進行協作   總結 Chapter 15:利用 GitLab 進行持續整合   傳統的變更管理流程   持續整合簡介   安裝 GitLab   GitLab runner 執行器程式   第一個 GitLab 範例   GitLab 網路範例   總結 Chapter 16:網路測試驅動開發   測試驅動開發概述   拓樸即程式碼   為網路編寫測試   pyATS 和 Genie   結論 索引

原價: 980 售價: 833 現省: 147元
立即查看
跟著阿才學Python:從基礎到網路爬蟲應用

跟著阿才學Python:從基礎到網路爬蟲應用

類似書籍推薦給您

書名:跟著阿才學Python:從基礎到網路爬蟲應用 作者:蔡文龍, 蔡捷雲 出版社:碁峰 出版日期:2020/05/00 ISBN:9789865024987 內容簡介   本書從Python基礎程式設計開始,經由流程控制、迴圈、串列、函式、字典、檔案操作等章節,逐漸邁向資料爬蟲技能:存取開放資料、JSON與CSV、爬蟲網頁資訊進行彙整,以120個精選範例讓初學者徹底掌握Python基礎到資料存取與爬蟲應用精髓。   ■ 易學:初學者透過步驟練習可以完整重現書中範例。同時配合大量範例了解Python語法、字典、檔案、動態生成網頁、存取CSV與JSON以及網路爬蟲進行整合運用。   ■ 易懂:範例日常生活化,逐步解說,易學易懂。   ■ 易教:本書經過初學者與開發人員試讀、教師試教,修改內容與作法,去蕪存菁,教師免備課。   書中提供精選實務案例供讀者練習套用,包含:   *產品管理系統-存取檔案   *產品管理系統-以CSV與JSON為資料來源   *模擬遊戲卡牌遊戲   *爬取博客來網站資訊   *動態爬取網路圖片   *爬取Dcard熱門文章   *讀取OpenData農場資訊   *讀取OpenData計算農場數並繪製柱狀圖   *讀取OpenData動態製作農村地方美食小吃網頁   *讀取健保資料開放服務製作口罩剩餘數量查詢網頁 目錄 Ch1 Python簡介與開發環境建置 Ch2 變數資料型別與運算 Ch3 輸出入函式 Ch4 選擇結構 Ch5 串列的應用 Ch6 重複結構 Ch7 函式的應用 Ch8 元組與字典的應用 Ch9 目錄檔案管理與例外處理 Ch10 存取csv Ch11 存取JSON資料 Ch12 網路爬蟲擷取網頁資訊 Ch13 網路爬蟲資料讀取案例實作

原價: 450 售價: 383 現省: 67元
立即查看
Python網路爬蟲與資料視覺化應用實務

Python網路爬蟲與資料視覺化應用實務

類似書籍推薦給您

原價: 650 售價: 585 現省: 65元
立即查看
Python網路爬蟲:大數據擷取、清洗、儲存與分析 王者歸來 (2版)

Python網路爬蟲:大數據擷取、清洗、儲存與分析 王者歸來 (2版)

類似書籍推薦給您

原價: 750 售價: 675 現省: 75元
立即查看
Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術 (1版)

Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術 (1版)

類似書籍推薦給您

原價: 620 售價: 527 現省: 93元
立即查看