為您推薦
類似書籍推薦給您
【簡介】 身處 LLM 時代的必備技能 AI 爬蟲與資料檢索的全本機工作流 你還在用傳統的方法爬取網路資料嗎? 還在手動分析 HTML 網頁結構、逐一定位網頁元素、再手刻爬蟲程式嗎? 身處 AI 世代,是時候該學習更聰明、更高效的資料收集方法, 讓你坐在電腦前,喝著咖啡、悠閒地看著 AI 為你自動爬取網路資料。 在 AI 飆速發展的今天,傳統網路爬蟲技術正迎來全新的變革。 過去,Python 爬蟲程式的開發者必須自行剖析 HTML 網頁結構,撰寫繁瑣複雜的資料擷取規則與步驟;如今,隨著 LLM 的普及,AI 已能協助我們理解 HTML 網頁結構、定位網頁資料,甚至能夠自動化建立整個爬取流程,大幅提升開發效率。 本書從 HTML 結構解析入門,循序講解 BeautifulSoup + CSS 選擇器、lxml + XPath 表達式、正規表達式等核心技術,再深入 Selenium 模擬瀏覽器互動及 Scrapy 爬蟲框架的專業應用,帶領讀者全面掌握靜態與動態網頁擷取技術。更進一步結合 Playwright 自動化瀏覽器、以及 AI 驅動的爬蟲框架 Crawl4AI 和 ScrapeGraphAI,讓 LLM 成為理解與提取網頁資料的主力。 不只如此,本書採用 n8n × Ollama 全本機架構,無需 API Key、無需 Docker,即可整合 SearXNG 搜尋引擎、Crawl4AI API 資料爬取、Qdrant 向量資料庫與 RAG 知識檢索生成,最終打造出 MCP + AI Agent 自動化流程 ⸺ 從搜尋、爬取到資料處理與知識生成一手包辦! 本書特色 用 AI 分析 HTML 結構建立 Python 網路爬蟲 ▸全面掌握靜態與動態 HTML 網頁擷取技術,CSS Selector、XPath 一次上手 ▸實戰演練 BeautifulSoup、Selenium、Scrapy 經典 Python 爬蟲框架 Python × LLM 建立 AI 網路爬蟲 ▸整合 OpenAI、Gemini、Groq、Ollama 等多種 LLM,打造智慧爬蟲系統 ▸運用 AI 驅動的爬蟲技術 Crawl4AI 與 ScrapeGraphAI,自動理解並提取網頁內容 ▸結合非同步程式設計,提升資料抓取效率與彈性 整合 Python × AI 網路爬蟲的 AI 工作流程:n8n ▸以視覺化介面建立自動化流程,輕鬆整合搜尋、爬取與資料處理 ▸結合 Qdrant 向量資料庫 × RAG 技術,打造個人化知識檢索系統 ▸構建全本機 AI Agent 工作流,實現從資料擷取到生成的自動化流程 【目錄】 ▌第 1 章 HTML、JSON 與網路爬蟲的基礎 1-1 網路爬蟲的基礎 1-2 網路爬蟲的相關技術 1-3 HTML 標籤語法與結構 1-4 CSV 與 JSON 1-5 Python × AI 網路爬蟲的相關函式庫 ▌第 2 章 從網路取得資料 2-1 認識 HTTP 標頭與 httpbin.org 服務 2-2 使用 Requests 送出 HTTP 請求 2-3 取得 HTTP 回應內容 2-4 送出進階的 HTTP 請求 2-5 錯誤 / 例外處理與檔案存取 ▌第 3 章 擷取靜態 HTML 網頁資料 3-1 在 HTML 網頁定位目標資料 3-2 使用 BeautifulSoup 剖析 HTML 網頁 3-3 分析靜態 HTML 網頁 3-4 使用 find() 函式搜尋 HTML 網頁 3-5 使用正規表達式搜尋 HTML 網頁 ▌第 4 章 使用 CSS 選擇器爬取資料 4-1 認識 CSS 層級式樣式表 4-2 使用 CSS 選擇器定位 HTML 標籤 4-3 Google Chrome 開發人員工具 4-4 ChatGPT 應用:找出定位 HTML 標籤的 CSS 選擇器 4-5 在 BeautifulSoup 使用 CSS 選擇器 ▌第 5 章 走訪 HTML 網頁取出資料與資料儲存 5-1 如何走訪 HTML 網頁 5-2 走訪 HTML 網頁取得資料 5-3 修改 HTML 網頁來爬取資料 5-4 資料清理 5-5 將取得資料儲存成 CSV 和 JSON 檔案 5-6 從網路下載圖檔 ▌第 6 章 使用 XPath 表達式與 lxml 套件建立爬蟲程式 6-1 XPath 與 lxml 套件的基礎 6-2 使用 Requests 和 lxml 套件 6-3 XPath 資料模型 6-4 XPath 基本語法 6-5 XPath 運算子與函式 6-6 ChatGPT 應用:學習 XPath 表達式查詢 HTML 標籤 ▌第 7 章 Selenium 表單互動與動態網頁擷取 7-1 認識動態網頁 7-2 安裝 Selenium 7-3 Selenium 的基本使用 7-4 定位網頁資料與例外處理 7-5 與 HTML 表單進行互動 7-6 JavaScript 動態網頁擷取 ▌第 8 章 Scrapy 爬蟲框架 8-1 Scrapy 爬蟲框架的基礎 8-2 使用 Scrapy Shell 8-3 建立 Scrapy 專案的爬蟲程式 8-4 在專案使用 Item 和 Item Pipeline 8-5 輸出 Scrapy 爬取的資料 ▌第 9 章 Python × ChatGPT 網路爬蟲 9-1 Python 爬蟲程式的常見問題 9-2 Requests + BeautifulSoup 爬蟲實作案例 9-3 Selenium 爬蟲實作案例 9-4 Scrapy 爬蟲實作案例 ▌第 10 章 在 Python 使用 LLM 大型語言模型 10-1 認識生成式 AI 與 LLM 10-2 使用 OpenAI 的 ChatGPT API 10-3 使用 Google 的 Gemini API 10-4 LLM API 服務:Groq API 10-5 使用 Ollama 打造本機 LLM ▌第 11 章 Python × AI 網路爬蟲(一):非同步程式設計 + Crawl4AI 11-1 Python 非同步程式設計 11-2 Crawl4AI 的基本使用 11-3 內容篩選和客製化 Markdown 輸出 11-4 CSS 與 XPath 的 Schema 資料擷取 11-5 LLM 驅動的 AI 資料篩選與提取 11-6 深度爬取和 JavaScript 動態網頁處理 ▌第 12 章 Python × AI 網路爬蟲(二):ScrapeGraphAI 12-1 ScrapeGraphAI 簡介與環境設定 12-2 基礎 Graph:SmartScraperGraph 與 SmartScraperMultiGraph 12-3 文字轉語音 Graph:SpeechGraph 12-4 腳本生成 Graph:ScriptCreatorGraph 與 ScriptCreatorMultiGraph ▌第 13 章 視覺化 AI 工作流程:n8n 13-1 認識 n8n 與工作流程 13-2 安裝與啟動 n8n 社群版 13-3 建立你的第 1 個工作流程 13-4 建立你的第 1 個 AI 工作流程 13-5 n8n 常用節點的使用 ▌第 14 章 爬取知識庫的資料:SearXNG + Crawl4AI API 14-1 安裝、啟動與使用 Crawl4AI API 14-2 使用 SearXNG API 14-3 爬取 RAG 所需的知識庫資料 14-4 在 n8n 建立爬蟲程式和使用 SearXNG + Crawl4AI API ▌第 15 章 建立你自己的知識庫:Qdrant 向量資料庫 15-1 Embedding 模型:文字資料向量化 15-2 安裝與使用 Qdrant 向量資料庫 15-3 在 Python 程式使用 Qdrant 向量資料庫 15-4 建立你的知識庫:將文本內容存入向量資料庫 15-5 在 n8n 使用 Qdrant 向量資料庫 ▌第 16 章 打造你自己的客製化 LLM:AI Agent、MCP 與 RAG 系統 16-1 認識 AI Assistant、RAG、AI Agent 和 MCP 16-2 使用 Python 手把手打造本機 RAG 系統 16-3 n8n 的 AI Agent 與 Tool 16-4 n8n 的 AI Agent 與 MCP 16-5 在 n8n 建立 RAG 的客製化 LLM ▌附錄 A Python 開發環境:Anaconda 與 WinPython 客製化套件(電子書) A-1 建立 Anaconda 的 Python 開發環境 A-2 安裝本書客製化的 WinPython 可攜式套件 A-3 使用 Thonny 的 Python IDE
類似書籍推薦給您
【簡介】 別讓「內耗」拖垮你的人生! 每一個快撐不下去的時刻,都值得打開這本書! ──52個諮商故事,帶你終結創傷,找回自我── 感覺好累的你,有這些症狀嗎? •容易情緒失控 •擔心別人討厭自己 •總是把「我習慣了」掛嘴邊 •習慣討好每個人 •明知有毒關係卻走不開 •在意別人怎麼看自己 事實上,你不是難搞也不是玻璃心,而是太壓抑了! 過分善良、無法說不、不配得感……,這些都是情緒內耗的徵兆, 也是讓你覺得「好累、很煩、沒力氣」的原因。 身為諮商心理師的作者,她發現許多人之所以有著難解的心理問題, 絕大多數都是因為不了解自己,所以才會一直陷入盲區,進而內耗。 其實,每個人都或多或少害怕面對真實的自己, 因為害怕面對,所以活在舒適區,用習慣的行為生活、做事、交際, 正因如此,才會一再地痛苦、無助、糾結、崩潰、煩惱、迷茫。 因此,作者整理了52個常見的內耗型心理困擾, 從故事出發,陪你看懂情緒盲區,進而理解自己、改變自己。 如果你也有下列症狀,翻開本書,找出對應的方法, 最終,你一定能清醒,走出內耗。 〔症狀1〕過分討好▶▶▶學會自我設限和拒絕 沒有任何一個人、一件事,值得你放棄生活,不留一點愛給自己。 〔症狀2〕情緒失控▶▶▶降低自己的期望值 了解就算把目標定得完美,也無法減少壞事的發生。 〔症狀3〕愛錯成癮▶▶▶甩掉偏見、調整自己 愛情裡沒有最好的人,只有最適合你的人。 〔症狀4〕童年創傷▶▶▶學習與創傷共生 帶著傷痛和障礙努力生活,會讓你和那些坐以待斃的人有所區別。 〔症狀5〕不配得感▶▶▶大膽擁抱美好,你值得更多 信念可以影響行動,行動可以形成習慣,最終你將推翻「我不配」的桎梏。 〔症狀6〕選擇恐懼▶▶▶不是放棄選擇,而是儘快做出選擇 因為只有完成選擇,你才會跨越這道關卡,繼續前進。 當你願意對自己好一點,人生也會開始不同。 國內名家一致推薦 水淼∣《20幾歲就定位》暢銷書作家、心理諮商顧問 王意中│王意中心理治療所所長、臨床心理師 洪仲清│臨床心理師 洪培芸│臨床心理師、作家 胡展誥│諮商心理師 張玉琦│關係溝通講師、作家 盧美妏│人生設計心理諮商所共同創辦人、諮商心理師 (依姓氏筆劃排列) 好評推薦 擺脫虛假自我的束縛,喚醒沉睡的真實自我,欣然迎接理想的人生。──王意中,王意中心理治療所所長、臨床心理師 你才是生命中最需要被款待的貴賓!透過本書深入認識自己,你才能真正做到款待自己。──洪培芸,臨床心理師、作家 你先照顧好自己,才有能力好好照顧別人。你先不委屈,關係能走下去。──胡展誥,諮商心理師【目錄】 【作者序】認識自己,是一輩子的功課 前言 Part1 內耗與痴纏:沉迷在假我的遊戲 第一章 習慣成癮 1〔取悅症〕你對誰都好,就是對自己太差 2〔自證預言〕你擔心的事,總是很容易發生 3〔扭轉受害者心態〕別再認為全世界都與你為敵 4〔受挫敏感〕寧願認輸,也不願行動 5〔選擇恐懼〕陷入選擇,卻總有理由不做決定 6〔冒牌者症候群〕很怕被你發現,我一直在冒充另一個人 第二章 情緒內耗 7〔情緒隔離〕你的悲傷,應該被看見 8〔表達無能〕除了生氣,你什麼都不會 9〔情緒失控〕情緒像一顆不定時炸彈,總會先傷害自己 10〔容貌焦慮〕鏡子裡的你,永遠不完美 11〔假性焦慮〕你已經被「焦慮」害慘了 第三章 關係痴纏 12〔愛錯成癮〕總是愛錯人,也許你是故意的 13〔被動即防禦〕在愛情中被動,是保護自己的方式 14〔寄居蟹人格〕一言不合就封鎖,你可能是「寄居蟹人格」 15〔被動攻擊〕看似妥協,卻一定會還擊 16〔惡性關係循環〕那些分不掉又好不了的戀愛 17〔宿命型婚戀〕有這種婚戀觀的人,可能永遠遇不到合適的人 Part2 醒覺與重塑:初見陌生的真我 第四章 假我覺醒 18〔心理「奶媽(爸)」〕你從未停止哺乳「巨嬰」 19〔自我厭惡的投射〕別為他人的自卑買單 20〔嫉妒的邊界〕小心嫉妒背後的隱性傷害 21〔習慣即創傷〕最怕聽你說「我習慣了」 22〔配得感〕人生怕的三個字是「配不上」 23〔備胎心理〕給不了你現在的人,也給不了你未來 24〔課題分離〕「我很重要」,可能是一種幻覺 25〔恐懼愛情〕有時候無法戀愛,也許並不是愛情的問題 第五章 擊碎假我 26〔告別低自尊〕「迴避」無法解決問題 27〔習得性無助〕嘴上總說「我不要」,身心卻很誠實 28〔創傷的強迫性重複〕難以自拔的畸形戀愛 29〔跟原生家庭的較量〕你是用談戀愛的心態,跟父母相處嗎? 30〔「巨嬰」的愛情〕這不是愛情,是虐戀 31〔尊重真我的內心需求〕你想過自己可能會「孤獨終老」嗎? 第六章 真我重塑 32〔跨越「未完成事件」〕為什麼有些傷,你就是忘不掉? 33〔告別童年創傷〕童年的不愉快,如何讓自己好起來? 34〔重建安全感〕你之所以焦慮的真相 35〔擊碎反事實思考〕後悔也無法改變事實 36〔內向的優勢〕我不是高冷,只是有點內向 37〔「喪失」的意義〕上一季的人都與你無關 38〔終止自我攻擊〕他不愛你,可能就是他沒眼光 39〔升情緒價值〕能相愛多久,要看是否能提供「情緒價值」 40〔用真我去愛〕他沒有以前對你好了?這才是真正戀愛的開始 Part3 秩序與新自由:越醒覺,越自由 第七章 認識全新的自我 41〔與焦慮相處〕社交焦慮,究竟在不安什麼? 42〔應對冷暴力〕遇到冷暴力,如何「救」自己? 43〔彈性認知〕你永遠有犯錯的權力 44〔清醒判斷〕兩個重點,辨別婚戀關係中的危險分子 45〔擺脫束縛〕說你強勢的人,其實是不夠懂你 46〔悅納自我〕無法過自己想要的生活,該怎麼辦? 第八章 掌控真我的新人生 47〔迷惘就是轉機〕你感到迷惘時,是一個絕佳的起點 48〔自給自足的安全感〕所有的安全感,都源於你的蓄謀已久 49〔積極關注真我〕有人對你惡言惡語,也會有人用善意回應你 50〔放下聖母心〕沒有那麼多需要你拯救的人 51〔做隻野猴子〕大多數人的選擇,就代表沒錯? 52〔讓真我進化〕萬箭穿心,也要活得光芒萬丈
類似書籍推薦給您
【簡介】 從現代網頁爬取資料 爬取×解析×轉換──讓資料收集快、準、全,告別繁瑣工作! 從HTML到API、從圖片到文字,使用Python做網頁爬取,能廣泛應用於市場預測、機器翻譯甚至是醫學診斷,實用性極高。因此,無論在哪一個領域,網路爬蟲都可以更有效地應用於商務、分析、提升生產效能,開創新機會。 「本書是內容豐富的傑作,可幫助讀者有意識地、有效地抓取網頁資料,值得推薦給想從網站爬取資料、打算建立網站和分享資料的每一個人。」 —Michael Hopkins P.Geo., PMP 如果說程式設計像魔法一樣,那麼「網站擷取」無疑就是一種巫術,只要寫一個簡單的自動程式,就可以用它來查詢網頁伺服器、請求資料、解析資料,並提取所需資訊。本書第三版經過徹底翻新,不僅介紹網路爬取,也全面性地教你如何從現代網頁抓取幾乎每一種類型的資料。 本書的第一部分專門討論網路爬取機制,包括使用 Python 從網頁伺服器請求資訊、初步處理伺服器的回應,以及自動和網站進行互動。第二部分則探討更具體的工具和應用,以應對可能遇到的各種網頁爬取情境。 本書教你如何: •解析複雜的HTML網頁 •使用Scrapy框架來開發爬蟲 •儲存你抓到的資料 •從文件中讀取和提取資料 •清理格式不嚴僅的資料,以及將之正規化 •讀寫自然語言 •爬取表單與登入網站 •爬取JavaScript和 API •使用和編寫「圖片轉文字」軟體 •避免爬網陷阱和反機器人封鎖 •使用爬蟲來測試自己的網站 【目錄】 第一部分 建構爬蟲 第 1 章 網際網路的運作方式 第 2 章 網頁爬蟲的法律問題與道德原則 第 3 章 網頁爬蟲的應用 第 4 章 寫出你的第一個網路爬蟲 第 5 章 進階 HTML 解析 第 6 章 編寫網路爬蟲 第 7 章 網頁爬取模型 第 8 章 Scrapy 第 9 章 儲存資料 第二部分 進階抓取 第 10 章 讀取文件 第 11 章 處理髒資料 第 12 章 讀寫自然語言 第 13 章 藉由表單與登入來爬網 第 14 章 抓取 JavaScript 第 15 章 透過 API 來爬取資料 第 16 章 圖片處理與文字辨識 第 17 章 避免抓取陷阱 第 18 章 使用爬蟲來測試你的網站 第 19 章 平行爬網 第 20 章 網路爬蟲代理
類似書籍推薦給您
【簡介】 人一出生,就會賦予一個符號,永遠跟隨著這個人的一生,人做的好,可以揚「名」立萬,讓人敬仰,反之,若是無惡不作,那他的名字也將遺臭萬年,可見名字對於人之重要。 名字造就運勢、影響個性 取個好名或改個好名,差別絕對顯而易見 本書以八字之喜用神及六親十神為名字之基本架構,再輔以八十一靈動數,讓整個姓名架構趨近於完善,然後再用生肖姓名學佈局文字,佐以文字字義學,特殊用字,春秋禮數......等等,過濾在姓名學中靈動不佳的用字,希望藉由這樣一個完整的過程,讓讀者亦能幫自己或親人取得一個好名字。所謂先天八字,後天三字,名字必須架構在先天的八字上,而對於未曾研習八字的人,筆者也竭盡所能地以一般人也可以理解並運用的方式來對八字喜用神,跟六親十神,做一個合理的推斷,而建構出優良姓名的結構,從而生出一個能輔佐你(妳)一生的運勢,不管是個性、思考、學業、事業、婚姻、感情、身體健康、賺錢能力與財庫......都能不斷給予加分打氣的好名字。 【目錄】 作者序 陳楹襆.......................................................2 作者序 黃恆堉.......................................................6 第一章 姓名學之迷思..................................................14 第一節 什麼是姓名學.................................................16 第二節 姓名與命運...................................................17 第三節 先天命VS後天運...............................................19 第四節 姓名筆劃吉凶的迷失...........................................22 第五節 改名有用嗎?.................................................26 第二章姓名學的基本常識............................................. 28 第一節 生肖姓名學之原理.............................................31 第二節 生肖姓名學常用部首拆解.......................................38 第三節 姓與名字,如何診斷其屬性.....................................41 第四節 用三才五格法,診斷其屬性.....................................44 第五節 用八十一靈動數,診斷其屬性.....................
類似書籍推薦給您
【簡介】 本書將著名針灸專家楊甲三教授的取穴方法做了整理,用400余幅清晰的圖片將取穴方法準確地呈現給讀者,使讀者能直觀形象地學習楊教授的取穴經驗并運用于臨床。全書分為16章,主要介紹了全身十四經穴,以及經外奇穴等近400個穴位的取穴方法。本書內容翔實,直觀易學,特別適合于中醫院校學生和針灸愛好者學習使用,也可供針灸臨床、教學和科研工作者學習參考。【目錄】 第1章 全身骨度分寸 第2章 手太陰肺經穴 中府(LU1) 云門(LU2) 天府(LU3) 俠白(LU4) 尺澤(LU5) 孔最(LU6) 列缺(LU7) 經渠(LU8) 太淵(LU9) 魚際(LU10) 少商(LU11) 第3章 手陽明大腸經穴 商陽(L11) 二問(L12) 三間(L13) 合谷(L14) 陽溪(L15) 偏歷(L16) 溫溜(L17) 下廉(L18) 上廉(L19) 手三里(L110) 曲池(LI1) 肘髎(LI2) 手五里(LI13) 臂臑(LI14) 肩髃(LI15) 巨骨(LI16) 天鼎(LI17) 扶突(LI18) 口禾髎(LI19) 迎香(L120) 第4章 足陽明胃經穴 承泣(ST1) 四白(ST2) 巨髂(ST3) 地倉(ST4) 大迎(ST5) 頰車(ST6) 下關(ST7) 頭維(ST8) 人迎(ST9) 水突(ST10) 氣舍(ST11) 缺盆(ST12) …… 第5章 足太陰脾經穴 第6章 手少陰心經穴 第7章 手太陽小腸經穴 第8章 足太陽膀胱經穴 第9章 足少陰腎經穴 第10章 手厥陰心包經經穴 第11章 手少陽三焦經穴 第12章 足少陽膽經穴 第13章 足厥陰肝經穴 第14章 督脈經穴 第15章 任脈經穴 第16章 經外奇穴 附錄A 楊甲三教授簡介 附錄B 楊甲三教授針灸臨床經驗 索引
資訊
工程
數學與統計學
機率與統計
自然科學
健康科學
地球與環境
建築、設計與藝術
人文與社會科學
教育
語言學習與考試
法律
會計與財務
大眾傳播
觀光與休閒餐旅
考試用書
研究方法
商業與管理
經濟學
心理學
生活
生活風格商品
參考書/測驗卷/輔材