定價: | ||||
售價: | 425元 | |||
庫存: | 已售完 | |||
LINE US! | 詢問這本書 團購優惠、書籍資訊 等 | |||
此書籍已售完,調書籍需2-5工作日。建議與有庫存書籍分開下單 | ||||
付款方式: | 超商取貨付款 |
![]() |
|
信用卡 |
![]() |
||
線上轉帳 |
![]() |
||
物流方式: | 超商取貨 | ||
宅配 | |||
門市自取 |
為您推薦
類似書籍推薦給您
【簡介】 ⛧⛦ 一本搞定 LLM 看圖說故事與即時影像分析 ⛦⛧ ⛧⛦ 十款熱門模型實際解決生活中 AI Vision 問題 ⛦⛧ ⛧⛦ 用「自己的」資料集在本地端訓練 YOLO 模型 ⛦⛧ ⛧⛦ 無痛設計 Web 互動介面,輕鬆部署 AI 模型 ⛦⛧ 『AI Vision × LLM』劃開多模態應用的新時代 從輸入文字生成圖片,到上傳照片讓 LLM 看圖說故事,AI 電腦視覺技術結合 LLM 的多模態應用正席捲全球。但這些令人驚豔的應用背後,其實倚賴多項核心技術——包含物體偵測、人臉辨識、情緒與年齡分析、或是影像文字識別,以及對於文字的理解與生成,這才賦予 AI 真正「看懂」影像內容的能力。 實際解決現實生活中的 AI Vision 問題 帶領讀者以多款熱門模型如 YOLO、OpenCV DNN、MediaPipe、CVZone 3D、DeepFace、Dlib、LiteRT、EasyOCR,打造刷臉門禁系統、即時口罩偵測、微笑自拍、手勢操控投影片、AI 健身教練、車牌辨識、結帳櫃台人流與高速公路車流分析等多項實用專案,讓讀者親身體驗 AI Vision 在真實場景中的應用價值。 不僅會用,還能自行訓練專屬 AI 模型 讓你不只會活用現成的模型,還能自己動手標註資料並訓練屬於你的 YOLO 模型。並且透過 Streamlit 設計 Web 互動介面,將訓練成果部署為具備即時偵測與辨識功能的 Web 應用程式,實現從標註資料、模型訓練到應用上線的完整流程。 親手打造多模態 AI 應用,收穫滿滿成就感 整合前述 AI Vision 技術與大型語言模型(LLM),或運用 Ollama 的多模態工具 Llama-Vision,再搭配 Streamlit,即可實作出讓 LLM 分析影像內容或情境的 Web 智慧應用,例如路況分析或圖片描述,讓 AI 真正具備視覺理解與語意回應的能力。 零基礎也能無痛入門 本書主打「從做中學」的實作導向,即使沒有深厚的理論基礎,也能快速掌握 Python 的 AI 模型與實用套件。至於不熟悉的語法、函式用法、AI 模型原理,或是特定功能的程式碼編寫與修改,則交由 ChatGPT 給予我們即時協助,讓學習更有效率。 無論你是 AI 初學者還是開發者,本書都能帶你輕鬆入門、快速上手,從零開始打造專屬的 AI 專案,成為 AI Vision × LLM 的超酷玩家!🎉 本書特色 ➢ 精選多款熱門 AI 模型,打造貼近生活情境的 AI Vision 實務應用 ➢ 提供客製化 WinPython 可攜式套件,快速建立與書中一致的開發環境 ➢ 支援 CPU / GPU,完整教學從資料標註到訓練與測試你自己的 YOLO 物體辨識模型 ➢ 使用 LabelImg 工具,以人性化的方式進行影像資料集的標註作業 ➢ 透過 Streamlit 快速打造 Web 互動介面,無需前端技能即可部署 AI 模型 ➢ 整合 Llama-Vision,讓 LLM 在 Web 介面中看圖說故事、回答問題或分析影像內容 ➢ 搭配 OpenCV 電腦視覺套件,實作物體、人臉、文字、車牌等偵測與辨識 ➢ 探索 Mediapipe × CVZone 3D,實現 3D 視角的手勢辨識與姿態評估 【目錄】 ▍第 1 章 使用 Python 虛擬環境建立開發環境 1-1 建立與管理 Python 虛擬環境 1-2 使用 Python 虛擬環境建立本書的開發環境 1-3 安裝本書客製化的 WinPython 可攜式套件 1-4 使用 Thonny 的 Python IDE 1-5 使用 VS Code 的 Python IDE ▍第 2 章 OpenCV 基本使用與 Numpy 2-1 OpenCV 安裝與基本使用 2-2 OpenCV 影像處理 2-3 OpenCV 視訊處理與 Webcam 2-4 OpenCV 影像資料:NumPy 陣列 2-5 OpenCV 影像處理:負片和馬賽克效果 ▍第 3 章 OpenCV DNN電腦視覺與文字識別 3-1 OpenCV 哈爾特徵層級式分類器 3-2 OpenCV DNN 模組與預訓練模型 3-3 OpenCV DNN 影像分類與人臉偵測 3-4 OpenCV DNN 物體偵測與文字區域偵測 3-5 Tesseract-OCR 文字識別 ▍第 4 章 Mediapipe × CVZone:人臉與臉部網格偵測 4-1 Google MediaPipe 機器學習框架 4-2 CVZone 電腦視覺套件與 MediaPipe 4-3 CVZone 人臉偵測 4-4 CVZone 臉部網格 4-5 CVZone 辨識臉部表情:張嘴/閉嘴與睜眼/閉眼 ▍第 5 章 Mediapipe × CVZone:3D 手勢偵測與 3D 姿態評估 5-1 Mediapipe × CVZone 3D 多手勢追蹤 5-2 MediaPipe × CVZone 3D 辨識手勢:剪刀、石頭與布 5-3 MediaPipe × CVZone 3D 辨識手勢:OK 手勢 5-4 MediaPipe × CVZone 3D 人體姿態評估 5-5 MediaPipe × CVZone 3D 辨識人體姿勢:仰臥起坐 5-6 MediaPipe × CVZone 3D 辨識人體姿勢:伏地挺身 ▍第 6 章 LiteRT × Dlib × Deepface 電腦視覺應用 6-1 認識與安裝 LiteRT(TensorFlow Lite) 6-2 LiteRT 影像分類與物體偵測 6-3 Dlib 人臉偵測、臉部網格與特徵提取 6-4 face-recognition 人臉識別 6-5 Deepface 情緒辨識與年齡偵測 6-6 OpenCV DNN 預訓練模型:情緒辨識 ▍第 7 章 YOLO 電腦視覺應用:物體偵測與追蹤 7-1 認識 YOLO 7-2 YOLO 物體偵測 7-3 YOLO 物體追蹤 7-4 YOLO 電腦視覺應用:即時計算視訊的人數和車輛數 7-5 YOLO 電腦視覺應用:繪出視訊的車輛追蹤線 ▍第 8 章 YOLO 電腦視覺應用:影像分類 / 分割與姿態評估 8-1 YOLO 影像分類 8-2 YOLO 影像分割 8-3 YOLO 姿態評估 8-4 YOLO 電腦視覺應用:影像分割的背景替換 8-5 YOLO 電腦視覺應用:辨識人體姿勢 ▍第 9 章 訓練你自己的 YOLO 物體偵測模型 9-1 安裝 GPU 版的 YOLO 9-2 取得訓練 YOLO 模型所需的圖檔資料 9-3 使用 LabelImg 標註影像建立資料集 9-4 整理與瀏覽 Roboflow 取得的資料集 9-5 建立 YAML 檔訓練與驗證你的 YOLO 模型 ▍第 10 章 Streamlit 的 AI 互動介面設計 10-1 認識與安裝 Streamlit 10-2 建立你的 Streamlit 應用程式 10-3 輸出網頁內容 10-4 繪製圖表與地圖 10-5 建立表單介面的互動元件 10-6 佈局、狀態與聊天元件 10-7 使用快取機制與網頁配置設定 10-8 Streamlit 互動介面設計:建立 YOLO 的 AI 互動介面 ▍第 11 章 AI 電腦視覺實戰:刷臉門禁管理、微笑拍照與變臉化妝 11-1 AI 電腦視覺實戰:刷臉門禁管理 11-2 AI 電腦視覺實戰:YOLO 臉部情緒偵測 11-3 AI 電腦視覺實戰:微笑拍照 11-4 AI 電腦視覺實戰:變臉與化妝 ▍第 12 章 AI 電腦視覺實戰:手勢操控與 AI 健身教練 12-1 pywin32 套件:Office 軟體自動化 12-2 AI 電腦視覺實戰:手勢操控 PowerPoint 簡報播放 12-3 AI 電腦視覺實戰:AI 健身教練 ▍第 13 章 AI 電腦視覺實戰:EasyOCR 車牌辨識與車道偵測系統 13-1 AI 電腦視覺實戰:Tesseract-OCR 車牌辨識 13-2 EasyOCR 的安裝與使用 13-3 AI 電腦視覺實戰:EasyOCR 車牌辨識 13-4 AI 電腦視覺實戰:YOLO 車牌偵測 13-5 AI 電腦視覺實戰:OpenCV 車道偵測系統 ▍第 14 章 AI 電腦視覺實戰:YOLO 人流與車流控制 14-1 找出熱區域座標 14-2 判斷目標物體是否進入熱區域 14-3 結帳櫃台的人數控制 14-4 道路的車流控制 14-5 AI 電腦視覺實戰:多個結帳櫃台的人數控制 14-6 AI 電腦視覺實戰:南下 / 北上高速公路的車流控制 ▍第 15 章 AI 電腦視覺實戰:打造自己的 AI 模型與整合應用 15-1 使用 Teachable Machine 訓練機器學習模型 15-2 AI 電腦視覺實戰:LiteRT 識別剪刀、石頭或布 15-3 AI 電腦視覺實戰:建立 YOLO 即時口罩偵測 ▍第 16 章 AI 電腦視覺實戰:本機 LLM Vision 整合應用 16-1 認識生成式 AI 與 LLM 16-2 LLM API 服務:Groq API 16-3 使用 Ollama 打造本機 LLM 16-4 AI 電腦視覺實戰:Llama-Vision 視覺分析助手 16-5 AI 電腦視覺實戰:Llama-Vision 車牌辨識 16-6 AI 電腦視覺實戰:Llama-Vision 路況分析 ▍附錄 A 電子書 Anaconda 開發環境與 Python 程式設計 A-1 建立 Anaconda 的 Python 開發環境 A-2 變數、資料型態與運算子 A-3 流程控制 A-4 函式、模組與套件 A-5 容器型態 A-6 類別與物件
類似書籍推薦給您
【簡介】 在量子VS傳統:電腦競賽,兩個電腦巨頭展開一場精彩的辯論:量子與傳統。透過它們的動態交流,讀者被邀請深入研究這兩種計算範式的關鍵差異。 是什麼賦予了量子電腦令人難以置信的能力,為什麼傳統電腦在我們的現代世界中仍然不可或缺? 本書揭示了每個系統的獨特優勢和局限性,提供了初學者和技術愛好者都可以理解的清晰解釋。也深入討論並揭示哪個系統可能在塑造計算的未來方面,發揮領導作用!
類似書籍推薦給您
【簡介】 依據勞動部勞動力發展署技能檢定中心公告試題編撰,以Office 2021解題 軟體應用乙級術科解題準備,首重資料庫觀念: 1.先熟悉所有考題「資料表名稱」 2.熟悉「每一個資料表欄位」 3.資料表之間的關係 4.練習看著報表,腦中浮現該由哪幾個資料表抓資料 *試題共分六個題組,每一題組有五個子題,解題順序根據題目難易度編排:題組五→四→三→六→二→一。 *解題程序: 1.以Word 建立5 個附件的基本環境 2.以Access 建立資料關聯,做資料整合 3.以Excel 做資料統計、排序、篩選、統計圖 4.以Word 做文書編輯,印出答案報表 *本書解題說明使用DATASET-3資料,提供DATASET-2、DATASET-3的完成檔及關鍵數據檔,可用於檢查答案。 *測試內容要點: ●個人電腦及週邊設備的環境設定與操作。 ●各種軟體的安裝。 ●資料庫、試算表、文書處理、簡報等應用軟體的綜合應用。 本書特色 ●精簡合理的解題程序:檢定考試時除了解題以外,還要能縮短解題時間,把握解題原則及合理性,本書可讓您了解的如何解題外,還懂得正確又有效率的解題方法。 ●關鍵數據資料:關鍵數據資料乃作者研究精華,乙級檢定考試,錯一個就扣50分,如何在處理完所有題目之後,自行檢視作答成果,您一定不能忽略關鍵數據資料。 【目錄】 作者序/改版序 軟體應用乙級檢定準備說明 ch.01 Word、Excel、Access基礎教學 1-01 Word 基礎教學 1-02 Excel 基礎教學 1-03 Access 基礎教學 ch.02 術科試題及解題程序 題組五:試題編號 930205 題組四:試題編號 930204 題組三:試題編號 930203 題組六:試題編號 930206 題組二:試題編號 930202 題組一:試題編號 930201