| 書名: | LLM應用開發 - 業界最實用30個應用現場直擊 (1版) | |||
| 作者: | 李永華,劉宇沛,孫玉江 | |||
| 版次: | 1 | |||
| ISBN: | 9786267757499 | |||
| 出版社: | 深智數位 | |||
| 出版日期: | 2025/11 | |||
| 頁數: | 456 | |||
|
#資訊
#AI人工智慧與機器學習 |
||||
【簡介】 本書共分30章,涵蓋30個實用的大語言模型應用專案。 第一章介紹美食推薦系統,實作隨機推薦功能;第二章為語言學習平台,結合大模型進行語言對話;第三章為戲文生成工具,自動產出劇情內容;第四章為智慧電影推薦,整合演算法與GUI介面;第五章為影像處理應用,包含影像增強與生成;第六章設計職業匹配系統,分析履歷並提供建議;第七章實作簡歷生成工具,自動填寫履歷內容;第八章為產品推薦系統,根據輸入條件推薦商品;第九章開發文字互動小說專案;第十章為小說創作平台,自動續寫故事內容;第十一章為情緒分析工具,可解析用戶情緒傾向;第十二章實作文字轉影像工具;第十三章提供足球賽事資訊;第十四章為圖書館檢索系統;第十五章為音色轉換工具;第十六章實作智慧換臉應用;第十七章協助撰寫留學文書;第十八章開發寵物照護小幫手;第十九章分析使用者評價內容;第二十章為旅遊地點圖鑑查詢;第二十一章為文案生成助手;第二十二章為菜譜推薦平台;第二十三章為文字校正工具;第二十四章提供網球運動員資訊;第二十五章設計職業推薦系統;第二十六章建構職場知識問答平台;第二十七章為手繪圖像辨識;第二十八章為文獻閱讀助手;第二十九章開發法律諮詢小程式;第三十章實作文風模擬應用。 本書特色 ★美食推薦與商品推薦系統整合 ★多輪語言學習與語音互動應用 ★戲文生成與小說創作自動化 ★智慧電影推薦與職業媒合系統 ★履歷生成與留學文書產出流程 ★職涯推薦與工作技能對應模型 ★圖片處理、影像生成與換臉技術 ★情緒分析與使用者評價介面建構 ★文字轉影像與手繪圖辨識系統 ★足球與網球運動員資訊查詢模組 ★菜譜推薦與旅遊圖鑑呈現介面 ★文案生成與文字校正整合應用 ★法律諮詢與知識問答服務實作 ★文風模擬與語體轉換工具開發 ★前端介面設計與Node.js整合流程 ★大模型API串接與多語系應用部署 【目錄】 ▌第1 章 美食推薦 1.1 整體設計 1.1.1 整體框架 1.1.2 系統流程 1.2 開發環境 1.2.1 安裝PyCharm 1.2.2 環境配置 1.2.3 建立專案 1.2.4 大模型API 申請 1.3 系統實現 1.3.1 頭部 1.3.2 背景樣式 1.3.3 主體 1.3.4 App.py 指令稿 1.3.5 random_food.py 指令稿 1.4 功能測試 1.4.1 執行專案 1.4.2 發送問題及回應 1.4.3 美食軟體網頁版跳躍 ▌第2 章 語言學習 2.1 整體設計 2.1.1 整體框架 2.1.2 系統流程 2.2 開發環境 2.2.1 安裝VS Code 2.2.2 安裝Node.js 2.2.3 安裝pnpm 2.2.4 環境配置 2.2.5 建立專案 2.2.6 大模型API 申請 2.3 系統實現 2.3.1 頭部 2.3.2 樣式 2.3.3 主體 2.3.4 main.js 指令稿 2.4 功能測試 2.4.1 執行專案 2.4.2 發送問題及回應 ▌第3 章 生成戲文 3.1 整體設計 3.1.1 整體框架 3.1.2 系統流程 3.2 開發環境 3.2.1 安裝VS Code 3.2.2 安裝Node.js 3.2.3 環境配置 3.2.4 大模型API 申請 3.3 系統實現 3.3.1 頭部 3.3.2 樣式 3.3.3 主體 3.3.4 主體 指令稿 3.3.5 其他介面設計 3.4 功能測試 3.4.1 執行專案 3.4.2 發送問題及回應 ▌第4 章 智慧電影 4.1 整體設計 4.1.1 整體框架 4.1.2 系統流程 4.2 開發環境 4.2.1 安裝PyCharm 4.2.2 安裝Python 4.2.3 軟體套件 4.2.4 建立專案 4.2.5 大模型API 申請 4.3 系統實現 4.3.1 主函式Main 4.3.2 推薦演算法 4.3.3 呼叫大模型 4.3.4 主體及GUI 介面 4.4 功能測試 4.4.1 執行專案 4.4.2 發送問題及回應 ▌第5 章 影像處理 5.1 整體設計 5.1.1 整體框架 5.1.2 系統流程 5.2 開發環境 5.2.1 安裝PyQt5 5.2.2 環境配置 5.2.3 大模型API 申請 5.3 系統實現 5.3.1 PyQt5 組件初始化與綁定機制 5.3.2 PyQt5 槽函式的定義 5.3.3 主函式 5.4 功能測試 5.4.1 影像處理功能測試 5.4.2 影像生成功能測試 ▌第6 章 職業匹配 6.1 整體設計 6.1.1 整體框架 6.1.2 系統流程 6.2 開發環境 6.2.1 安裝Anaconda 6.2.2 建立Git 6.2.3 安裝Streamlit 6.2.4 LangChain 的安裝與使用 6.2.5 環境配置 6.2.6 建立專案 6.2.7 大模型API 申請 6.3 系統實現 6.3.1 PDF 讀取剩餘區塊 6.3.2 樣式 6.3.3 模型互動 6.3.4 主程式邏輯 6.4 功能測試 6.4.1 執行專案 6.4.2 發送問題及回應 ▌第7 章 生成履歷 7.1 整體設計 7.1.1 整體框架 7.1.2 系統流程 7.2 開發環境 7.2.1 安裝Node.js 7.2.2 安裝pnpm 7.2.3 環境配置 7.2.4 建立專案 7.2.5 大模型API 申請 7.3 系統實現 7.3.1 頭部 7.3.2 樣式 7.3.3 主體 7.3.4 main.js 指令稿 7.4 功能測試 7.4.1 執行專案 7.4.2 發送問題及回應 ▌第8 章 產品推薦 8.1 整體設計 8.1.1 整體框架 8.1.2 系統流程 8.2 開發環境 8.2.1 安裝PyCharm 8.2.2 環境配置 8.2.3 大模型API 申請 8.3 系統實現 8.3.1 頭部 8.3.2 樣式 8.3.3 主體 8.3.4 App.py 8.4 功能測試 8.4.1 執行專案 8.4.2 發送問題及回應 ▌第9 章 重生之水滸穿越 9.1 整體設計 9.1.1 整體框架 9.1.2 系統流程 9.2 開發環境 9.2.1 安裝Python 9.2.2 安裝Anaconda 9.2.3 環境配置 9.2.4 大模型API 申請 9.3 系統實現 9.3.1 main.py 9.3.2 utils.py 9.4 功能測試 9.4.1 執行專案 9.4.2 發送問題及回應 ▌第10 章 小說創作 10.1 整體設計 10.1.1 整體框架 10.1.2 系統流程 10.2 開發環境 10.2.1 安裝Python 10.2.2 安裝PyCharm 10.2.3 環境配置 10.2.4 建立專案 10.2.5 大模型API 申請 10.3 系統實現 10.3.1 頭部引入 10.3.2 關鍵函式 10.3.3 視窗實現 10.3.4 Spark API 10.4 功能測試 10.4.1 執行專案 10.4.2 發送問題及回應 ▌第11 章 情緒分析 11.1 整體設計 11.1.1 整體框架 11.1.2 系統流程 11.2 開發環境 11.2.1 安裝Anaconda 11.2.2 安裝Tkinter 和OpenAI 函式庫 11.2.3 編輯器環境配置 11.2.4 大模型API 申請 11.3 系統實現 11.3.1 guitest.ipynb 11.3.2 omgtest.ipynb 11.3.3 omgloop.ipynb 11.3.4 main.py 11.4 功能測試 11.4.1 執行專案 11.4.2 發送問題及回應 ▌第12 章 文字轉影像 12.1 整體設計 12.1.1 整體框架 12.1.2 系統流程 12.2 開發環境 12.2.1 安裝Python 12.2.2 安裝PyCharm 12.2.3 安裝PyWebIO 函式庫 12.2.4 大模型API 申請 12.3 系統實現 12.3.1 獲得驗證參數 12.3.2 主程式 12.4 功能測試 12.4.1 執行專案 12.4.2 發送問題及回應 ▌第13 章 足球資訊 13.1 整體設計 13.1.1 整體框架 13.1.2 系統流程 13.2 開發環境 13.2.1 安裝Python 函式庫 13.2.2 大模型API 申請 13.3 系統實現 13.3.1 soccerhelper.py 13.3.2 mainWindow.py 13.3.3 SparkAPI.py 13.4 功能測試 13.4.1 執行專案 13.4.2 發送問題及回應 ▌第14 章 圖書館檢索 14.1 整體設計 14.1.1 整體框架 14.1.2 系統流程 14.2 開發環境 14.2.1 安裝PyCharm 14.2.2 建立Python 虛擬環境 14.2.3 安裝資料庫 14.2.4 建立專案 14.2.5 大模型API 申請 14.3 系統實現 14.3.1 前端HTML 檔案 14.3.2 視圖檔案views.py 14.4 功能測試 14.4.1 成果展示 14.4.2 後端日誌監控 14.4.3 大模型API 呼叫情況 ▌第15 章 音色轉換 15.1 整體設計 15.1.1 整體框架 15.1.2 系統流程 15.2 開發環境 15.2.1 配置PyCharm 解譯器 15.2.2 安裝Python 套件 15.2.3 環境配置 15.2.4 大模型API 申請 15.3 系統實現 15.3.1 視窗設計 15.3.2 呼叫音色轉換 15.3.3 檔案格式轉換 15.3.4 視窗前端和後端業務邏輯連接 15.4 功能測試 15.4.1 執行專案 15.4.2 專案輸出 ▌第16 章 智慧換臉 16.1 整體設計 16.1.1 整體框架 16.1.2 系統流程 16.2 開發環境 16.2.1 安裝Python 函式庫 16.2.2 建立專案 16.2.3 大模型API 申請 16.3 系統實現 16.3.1 主介面類別DisplayWindow 16.3.2 子介面SecondWindow 16.3.3 子介面ThirdWindow 16.3.4 子介面ForthWindow 類別 16.3.5 執行緒類別VideoThread 16.3.6 執行緒類別APICaller 16.3.7 執行緒類別MonitorThread 16.3.8 其他類別FolderHandler 16.3.9 requests.py 檔案 16.4 功能測試 16.4.1 執行專案 16.4.2 拍照 16.4.3 選擇本地影像 16.4.4 搜尋目標人臉 16.4.5 換臉 ▌第17 章 留學文書 17.1 整體設計 17.1.1 整體框架 17.1.2 系統流程 17.2 開發環境 17.2.1 安裝Node.js 17.2.2 安裝Vue.js 17.2.3 大模型API 申請 17.3 系統實現 17.3.1 API.js 17.3.2 headBar.vue 17.3.3 index.vue 17.3.4 App.vue 17.4 功能測試 17.4.1 執行專案 17.4.2 發送問題及回應 ▌第18 章 寵物幫手 18.1 整體設計 18.1.1 整體框架 18.1.2 系統流程 18.2 開發環境 18.2.1 安裝Node.js 18.2.2 安裝pnpm 18.2.3 環境配置 18.2.4 建立專案 18.2.5 大模型API 申請 18.3 系統實現 18.3.1 頭部 18.3.2 樣式style.css 18.3.3 樣式one.css 18.3.4 主體 18.3.5 其餘檔案的主體 18.3.6 main.js 指令稿 18.4 功能測試 18.4.1 執行專案 18.4.2 發送問題及回應 ▌第19 章 使用者評價 19.1 整體設計 19.1.1 整體框架 19.1.2 系統流程 19.2 開發環境 19.2.1 安裝PyCharm 19.2.2 安裝urllib 19.2.3 環境配置 19.2.4 建立專案 19.3 系統實現 19.3.1 匯入執行函式庫 19.3.2 獲得Stoken 19.3.3 獲得回答 19.3.4 主函式 19.4 功能測試 19.4.1 執行專案 19.4.2 發送問題及回應 ▌第20 章 旅遊圖鑑 20.1 整體設計 20.1.1 整體框架 20.1.2 系統流程 20.2 開發環境 20.2.1 安裝Node.js 20.2.2 安裝pnpm 20.2.3 環境配置 20.2.4 建立專案 20.2.5 大模型API 申請 20.3 系統實現 20.3.1 頭部 20.3.2 樣式 20.3.3 主體 20.3.4 main.js 指令稿 20.4 功能測試 20.4.1 執行專案 20.4.2 發送問題及回應 ▌第21 章 文案助手 21.1 整體設計 21.1.1 整體框架 21.1.2 系統流程 21.2 開發環境 21.2.1 安裝Python 21.2.2 安裝PyCharm 21.2.3 安裝PyWebIO 函式庫 21.2.4 大模型API 申請 21.3 系統實現 21.3.1 主程式 21.3.2 API 通訊 21.4 功能測試 21.4.1 執行專案 21.4.2 發送問題及回應 ▌第22 章 食譜推薦 22.1 整體設計 22.1.1 整體框架 22.1.2 系統流程 22.2 開發環境 22.2.1 安裝Node.js 22.2.2 安裝pnpm 22.2.3 環境配置 22.2.4 建立專案 22.2.5 大模型API 申請 22.3 系統實現 22.3.1 頭部 22.3.2 樣式 22.3.3 主體 22.3.4 main.js 指令稿 22.4 功能測試 22.4.1 執行專案 22.4.2 發送問題及回應 ▌第23 章 文字糾錯 23.1 整體設計 23.1.1 整體框架 23.1.2 系統流程 23.2 開發環境 23.2.1 安裝Node.js 23.2.2 安裝pnpm 23.2.3 環境配置 23.2.4 建立專案 23.2.5 大模型API 申請 23.3 系統實現 23.3.1 頭部 23.3.2 樣式 23.3.3 主體 23.3.4 main.js 指令稿 23.4 功能測試 23.4.1 執行專案 23.4.2 發送問題及回應 ▌第24 章 網球運動員 24.1 整體設計 24.1.1 整體框架 24.1.2 系統流程 24.2 開發環境 24.2.1 安裝Python 24.2.2 安裝PyCharm 24.2.3 環境配置 24.2.4 大模型API 申請 24.3 系統實現 24.3.1 頭部 24.3.2 樣式 24.3.3 主體 24.3.4 main.py 指令稿 24.4 功能測試 24.4.1 執行專案 24.4.2 發送問題及回應 ▌第25 章 職業推薦 25.1 整體設計 25.1.1 整體框架 25.1.2 系統流程 25.2 開發環境 25.2.1 安裝PyCharm 25.2.2 大模型API 申請 25.3 系統實現 25.3.1 頭部 25.3.2 樣式 25.3.3 主體 25.3.4 App.py 25.4 功能測試 25.4.1 執行專案 25.4.2 發送問題及回應 ▌第26 章 職場助手 26.1 整體設計 26.1.1 整體框架 26.1.2 系統流程 26.2 開發環境 26.2.1 安裝微信開發者工具 26.2.2 安裝MySQL 26.2.3 安裝Navicat 26.2.4 環境配置 26.2.5 專案啟動 26.2.6 大模型API 申請 26.3 系統實現 26.3.1 小程式全域配置 26.3.2 spark 26.3.3 user 26.3.4 後端伺服器 26.4 功能測試 26.4.1 發送問題及回應 26.4.2 查詢歷史記錄 ▌第27 章 手繪圖像辨識 27.1 整體設計 27.1.1 整體框架 27.1.2 系統流程 27.2 開發環境 27.2.1 安裝微信開發者工具 27.2.2 安裝偵錯基礎函式庫 27.2.3 大模型API 申請 27.3 系統實現 27.3.1 畫板組件 27.3.2 主介面的.js 檔案 27.3.3 .wxml 檔案和.wxss 檔案 27.4 功能測試 27.4.1 執行專案 27.4.2 繪製影像獲得回答 ▌第28 章 文獻閱讀 28.1 整體設計 28.1.1 整體框架 28.1.2 系統流程 28.2 開發環境 28.2.1 配置伺服器端 28.2.2 環境配置 28.2.3 大模型API 申請 28.3 系統實現 28.3.1 前端程式 28.3.2 後端程式 28.4 功能測試 ▌第29 章 法律諮詢 29.1 整體設計 29.1.1 整體框架 29.1.2 系統流程 29.2 開發環境 29.2.1 安裝微信開發者工具 29.2.2 大模型API 申請 29.3 系統實現 29.3.1 index.js 29.3.2 index.wxml 29.3.3 index.wxss 29.3.4 hotline.wxml 29.3.5 hotline.wxss 29.3.6 consult.js 29.3.7 consult.wxml 29.3.8 consult.wxss 29.3.9 lawfirm.js 29.3.10 lawfirm.wxml 29.3.11 lawfirm.wxss 29.3.12 App.js 29.3.13 App.json 29.3.14 App.wxss 29.3.15 Project.config.json 29.4 功能測試 29.4.1 執行專案 29.4.2 發送問題及回應 ▌第30 章 文風模擬 30.1 整體設計 30.1.1 整體框架 30.1.2 系統流程 30.2 開發環境 30.2.1 安裝Python 30.2.2 安裝函式庫和模組 30.2.3 建立專案 30.2.4 大模型API 申請 30.3 系統實現 30.3.1 匯入模組和初始化 30.3.2 建立文字標籤及文風選擇 30.3.3 設置按鈕樣式及模型版本 30.3.4 執行Tkinter 主迴圈 30.4 功能測試 30.4.1 執行專案 30.4.2 發送問題及回應
還沒有人留下心得,快來搶頭香!
為您推薦
相關熱銷的書籍推薦給您
書名:人工智慧:智慧型系統導論(第三版) 作者:李聯旺 出版社:全華 ISBN:9789862800959
相關熱銷的書籍推薦給您
書名:機器學習:類神經網路、模糊系統以及基因演算法則(第四版) 作者:蘇木春、張孝德 出版社:全華 出版日期:2016/05/00 ISBN:9789864632060 內容簡介 ■ 本書優點特色 1.將三種與機械學習相關的技術-類神經網路、模糊系統及基因演繹法作一通盤介紹。 2.以深入淺出的方式建立類神經網路與生物神經網路的關聯性,以便讓讀者更能發揮想像力。 3.每一種理論都儘可能配合書中範例及圖表加以說明。 ■ 內容簡介 本書將三種與機械學習相關的技術-類神經網路、模糊系統及基因演繹法作一通盤介紹。此外,作者以深入淺出的方式建立類神經網路與生物神經網路的關聯性,以便讓讀者更能發揮想像力。 目錄 第1章 類神經網路之簡介 第2章 感知機 第3章 多層感知機 第4章 非監督式類神經網路 第5章 聯想記憶 第6章 增強式學習 第7章 模糊集合 第8章 模糊關係及推論 第9章 模糊系統 第10章 基因演算法則
類似書籍推薦給您
【簡介】 本書基於 DeepSeek-V3,並涵蓋最新版 DeepSeek-R1 解析與應用。 結合最新研究與實戰經驗,深入解析生成式 AI 技術,內容實用、操作簡單, 讓你立即掌握 DeepSeek 真實戰力! DeepSeek 是一種基於 Transformer 的生成式 AI(Artificial Intelligence)大模型,融合了 MoE 架構、混合精度訓練、分散式優化等先進技術,具備強大的文本生成、多模態處理以及任務客製化能力。 本書系統性地介紹了開源大模型 DeepSeek-V3 的核心技術及其在實際開發中的深度應用,並收錄最新版 DeepSeek-R1 推論大模型架構詳解,帶您緊跟技術發展的脈動。 • 核心技術拆解:從混合專家模型(MoE)、FP8 混合精度訓練,到上下文管理與 API 整合,掌握大模型關鍵技術。 • 應用實例豐富:涵蓋 NLP、程式生成、數學推理、多模態輸出等,案例詳實步驟清楚,學完即可實作。 • 進階提示技巧:教您運用對話前綴、FIM 生成、JSON 輸出等技巧,引導模型高效生成精準內容。 透過深入講解與實用案例,幫助讀者理解 DeepSeek 模型從原理到開發的完整流程, 無論你是剛踏入大語言模型世界的 AI 新手,還是正著手將生成式 AI 落地專案的技術開發者, 本書都能成為你實戰導入、快速上手的最佳攻略。現在就翻開本書,讓 DeepSeek 成為你的 AI 強力助手! 【目錄】 【Part I 生成式 AI 的理論基礎與技術架構】 Chapter 1 Transformer 與注意力機制的核心原理 1.1 Transformer 的基本結構 1.2 注意力機制的核心原理 1.3 Transformer 的擴充與最佳化 1.4 上下文視窗 1.5 訓練成本與運算效能的平衡 1.6 本章小結 Chapter 2 DeepSeek-V3 核心架構及其訓練技術詳解 2.1 MoE 架構及其核心概念 2.2 FP8 混合精度訓練的優勢 2.3 DualPipe 演算法與通訊最佳化 2.4 大模型的分散式訓練 2.5 快取機制與Token 管理 2.6 DeepSeek 系列模型 2.7 本章小結 Chapter 3 基於 DeepSeek-V3 模型的開發導論 3.1 大模型應用場景 3.2 DeepSeek-V3 的優勢與應用方向 3.3 Scaling Laws 研究與實踐 3.4 模型部署與整合 3.5 開發中的常見問題與解決方案 3.6 本章小結 【Part II 生成式AI 的專業應用與 Prompt 設計】 Chapter 4 DeepSeek-V3 大模型初體驗 4.1 對話生成與語意理解能力 4.2 數學推理能力 4.3 輔助程式設計能力 4.4 本章小結 Chapter 5 DeepSeek 開放平台與 API 開發詳解 5.1 DeepSeek 開放平台簡介 5.2 DeepSeek API 的基礎操作與 API 介面詳解 5.3 API 效能最佳化與安全策略 5.4 本章小結 Chapter 6 對話生成、程式碼補全與客製化模型開發 6.1 對話生成的基本原理與實作 6.2 程式碼補全的實作邏輯與最佳化 6.3 基於 DeepSeek 的客製化模型開發 6.4 本章小結 Chapter 7 對話前綴續寫、FIM 與 JSON 輸出開發詳解 7.1 對話前綴續寫的技術原理與應用 7.2 FIM 生成模式解析 7.3 JSON 格式輸出的設計與生成邏輯 7.4 本章小結 Chapter 8 函式回呼與上下文硬碟快取 8.1 函式回呼機制與應用場景 8.2 上下文硬碟快取的基本原理 8.3 函式回呼與快取機制的結合應用 8.4 本章小結 Chapter 9 DeepSeek 提示庫:探索 Prompt 的更多可能 9.1 程式碼相關應用 9.2 內容生成與分類 9.3 內角色扮演 9.4 文學創作 9.5 文案與宣傳 9.6 模型提示詞與翻譯專家 9.7 本章小結 【Part III 實戰與進階整合應用】 Chapter 10 整合實戰 1:基於 LLM 的 Chat 類客戶端開發 10.1 Chat 類客戶端概述及其功能特點 10.2 DeepSeek API 的配置與整合 10.3 多模型支援與切換 10.4 本章小結 Chapter 11 整合實戰 2:AI 助理開發 11.1 AI 助理:AI 時代的啟動器 11.2 DeepSeek API 在 AI 助理中的配置與應用 11.3 智慧助手功能的實作與最佳化 11.4 本章小結 Chapter 12 整合實戰 3:以 VSCode 為基礎的輔助程式設計外掛開發 12.1 輔助程式設計外掛概述及其核心功能 12.2 在 VS Code 中整合 DeepSeekAP 12.3 程式碼自動補全與智慧建議的實作 12.4 使用輔助程式設計外掛提升開發效率 12.5 本章小結 Appendix A DeepSeek-R1 推論大模型架構詳解 A.1 DeepSeek-R1 整體架構解析 A.2 DeepSeek-R1 推論機制與高效運算 A.3 DeepSeek-R1 API 初步開發指南 A.4 DeepSeek-R1 在推論任務中的應用 A.5 DeepSeek-R1 的局限性與未來最佳化方向 A.6 本章小結
類似書籍推薦給您
【簡介】 用GitHub Copilot實現你對AI開發的所有想像! 零基礎輕鬆起步 從環境建置到語法應用,逐步教學帶你打好基礎。就算沒寫過程式,也能跟著學會開發實用的 AI 應用。 真實場景實戰案例 精選貼近生活與工作的案例,學習成果即刻轉化為實用技能。 附屬程式碼 詳細教學搭配完整程式碼資源,學習與實作無縫接軌,操作更便捷。 聚焦 VS Code + GitHub Copilot,快速養成 AI 開發思維 深入剖析 AI 輔助程式編寫的原理與操作方式,讓你理解不只是「怎麼寫」,更知道「為什麼這樣寫」。 本書專為熱愛程式設計的玩家與專業開發者量身打造!全書分為十大章節,以VS Code+GitHub Copilot為核心工具,系統性地帶領讀者探索人工智慧在程式設計領域的無限可能,並聚焦於運用AI輔助程式編寫工具,讓程式設計學習更簡單、開發更高效,即使沒有深厚程式背景,也能輕鬆跨入程式的世界。 從AI輔助程式編寫的基本概念出發,帶領讀者揭開AI程式設計的神秘面紗,並認識GitHub Copilot等工具。這些工具能透過AI輔助完成程式設計與建議,大幅提升程式開發效率與品質。 書中不僅講解理論,更精心設計豐富的實戰案例,如「大量文件翻譯」和「網頁版智慧對話機器人」等。這些案例不僅生動展現AI工具在實際開發中的強大能力,更提供詳細的步驟和程式碼範例,確保讀者不但能輕鬆上手,還能應用到真實專案,最終將所學轉化為解決實際問題的能力。 不論你是學生、工程師,還是轉職中途的學習者,都能透過本書掌握AI輔助程式設計的精髓,將AI技術運用自如,提升自己的程式設計技能和工作效率。【目錄】 第1章 AI輔助程式編寫工具與程式編寫學習 1.1 AI輔助程式編寫工具的介紹 1.2 評估自身程式編寫學習能力 1.3 初學程式編寫的常見障礙 1.4 如何使用AI輔助程式編寫工具解決學習障礙 1.5 本章小結 第2章 初識GitHub Copilot 2.1 GitHub Copilot的發展歷程 2.2 從產品經理的視角探索GitHub Copilot 2.3 GitHub Copilot的技術原理 2.4 GitHub Copilot的功能介紹 2.5 GitHub Copilot作為本書範例工具的原因 2.6 本章小結 第3章 使用GitHub Copilot輔助編寫程式的實戰範例 3.1 互動式學習 3.2 環境設定 3.3 利用GitHub Copilot快速建構Chrome擴充功能 3.4 本章小結 第4章 利用GitHub Copilot快速入門Python 4.1 Python真的那麼難學嗎? 4.2 如何利用GitHub Copilot學Python 4.3 Python的基本概念和語言機制 4.4 本章小結 第5章 利用GitHub Copilot深入瞭解Python函式 5.1 利用GitHub Copilot學習Python函式基礎 5.2 Python函式的核心概念 5.3 會說話就會寫函式 5.4 函式錯誤類型及原因 5.5 排查錯誤問題 5.6 Python模組、第三方函式庫、標準函式庫裡的函式 5.7 本章小結 第6章 提示工程:利用GitHub Copilot快速編寫程式碼 6.1 提示工程概念詳解 6.2 提示工程的最佳實作 6.3 高級提示詞策略 6.4 本章小結 第7章 利用GitHub Copilot探索大型語言模型的開發 7.1 大型語言模型最大的價值 7.2 利用GitHub Copilot解決LLM開發中的問題 7.3 LLM程式編寫的環境準備 7.4 在本機開發一個LLM聊天機器人 7.5 以魔搭創空間部署LLM應用 7.6 本章小結 第8章 利用GitHub Copilot編寫單元測試和偵錯 8.1 單元測試是測試金字塔的基礎 8.2 為什麼要學習單元測試 8.3 利用GitHub Copilot輔助開發單元測試 8.4 單元測試和偵錯 8.5 GitHub Copilot在單元測試中的作用 8.6 利用GitHub Copilot偵錯錯誤 8.7 本章小結 第9章 案例一:Python呼叫LLM實作大量檔案翻譯 9.1 背景設定 9.2 準備工作 9.3 Python腳本初體驗 9.4 第一版:實作翻譯功能 9.5 第二版:實作檔案讀寫 9.6 第三版:實作大量翻譯 9.7 功能完善與最佳化 9.8 LLM應用開發技巧 9.9 本章小結 第10章 案例二:網頁版智慧對話機器人 10.1 專案背景 10.2 準備工作 10.3 介面設計與實作 10.4 實作對話互動 10.5 呼叫大型語言模型 10.6 功能強化:多輪對話 10.7 功能強化:流動輸出 10.8 功能強化:自訂設定 10.9 專案收尾 10.10 本章小結
類似書籍推薦給您
【簡介】 想打造自己的AI助手,卻不知道從何開始? 用最熱門的LLM技術,打造真正會思考、會執行任務的AI Agent。 從零開始也不怕,帶你完整實作七種不同任務的AI應用,掌握開發實戰與最新技術趨勢! 準備好和AI Agent一起開啟智慧新時代了嗎? 本書將帶你深入探索AI Agent的開發關鍵。 從技術框架、開發工具到應用趨勢,通通幫你整理到位。 打造能聽懂人話、會主動幫你解決問題的超強AI夥伴! 從GPT-4到LangChain、LlamaIndex、MetaGPT,一步步做出真正「會理解、會規劃、會執行任務」的智慧型AI Agent。 書中以中小企業需求為場景,帶領讀者從零開始打造七種強大實用的AI應用,包括智慧排程、辦公自動化、知識整合、RAG、……等熱門任務。 不論你是工程師、研究人員、產品PM,還是AI新手,只要對AI Agent有興趣,都能在本書中找到清晰的技術架構與實用的開發步驟。 全書實作導向,讓AI不只聊天,更能主動幫你工作! 人工智慧時代,一種全新的技術——Agent正在崛起。 這是一種能夠理解自然語言並生成對應回覆,並且執行具體行動的人工智慧體,它不僅是內容生成工具,更是串聯複雜任務的關鍵樞紐。 本書將探索Agent的奧祕,內容包括從技術框架到開發工具,從實際操作專案到第一線發展,在帶著讀者動手打造7個功能強大Agent的同時,深入解析Agent的設計與實作,最後並展望Agent的發展性和未來趨勢。 適合對Agent技術感興趣或致力於該領域的研究人員、開發人員、產品經理或公司負責人,以及大專院校的相關領域師生。 內容以兩位虛擬角色互動的方式,帶領讀者進入極富趣味的Agent開發之旅,零距離接觸GPT-4模型、OpenAI Assistants API、LangChain、LlamaIndex 和MetaGPT 等關鍵技術,在辦公自動化、智慧排程、知識整合以及檢索增強生成(RAG)等領域,親身體會Agent的非凡表現,並攜手開啟AI時代的無限可能! 本書特色 .從零開發AI Agent,人人都能輕鬆上手 .詳解LLM×Agent的技術架構與開發流程 .精選熱門技術GPT-4、LangChain、LlamaIndex一次掌握 .七大實戰應用任務,涵蓋智慧排程、RAG、文件處理等 .對應企業需求,實作情境貼近真實工作場景 【目錄】 前言 第1章 何謂 Agent,為何選擇 Agent 1.1 讓人大開眼界的演講:Life 3.0 1.2 所以,到底 Agent 是什麼? 1.3 Agent 的大腦:大模型的通用推理能力 1.4 Agent 的感知力:語言交互能力和多模態能力 1.5 Agent 的行動力:語言輸出能力和工具使用能力 1.6 Agent 對各行業的效能提升 1.7 Agent 帶來新的商業模式和變革 1.8 小結 第2章 基於大模型的 Agent 技術框架 2.1 Agent 的四大要素 2.2 Agent 的規劃和決策能力 2.3 Agent 的各種記憶機制 2.4 Agent 的核心技能:調用工具 2.5 Agent 的推理引擎:ReAct 框架 2.6 其他 Agent 認知框架 2.7 小結 第3章 OpenAI API、LangChain 和 LlamaIndex 3.1 何謂 OpenAI API 3.2 何謂 LangChain 3.3 何謂 LlamaIndex 3.4 小結 第4章 Agent 1:自動化辦公的實現——透過 Assistants API和 DALL·E3 模型創作 PPT 4.1 OpenAI 公司的 Assistants 是什麼 4.2 不寫程式碼,在Playground 中玩 Assistants 4.3 Assistants API 的簡單範例 4.4 創建一個簡短的虛構 PPT 4.5 小結 第5章 Agent 2:多功能選擇的引擎——透過 Function Calling 調用函數 5.1 OpenAI 中的 Functions 5.2 在 Playground 中定義 Function 5.3 透過 Assistants API 實現 Function Calling 5.4 透過 ChatCompletion API來實現 Tool Calls 5.5 小結 第6章 Agent 3:推理與行動的協同——透過 LangChain 中的 ReAct 框架實現自動定價 6.1 複習ReAct框架 6.2 LangChain 中 ReAct Agent 的實現 6.3 LangChain 中的工具和工具包 6.4 透過 create_react_agent 創建鮮花定價 Agent 6.5 深入 AgentExecutor 的執行機制 6.6 小結 第7章 Agent 4:計劃和執行的解耦——透過 LangChain 中的 Plan-and-Execute 實現智慧排程庫存 7.1 提出 Plan-and-Solve 策略 7.2 LangChain 中的 Plan-and-Execute Agent 7.3 透過 Plan-and-Execute Agent 實現物流管理 7.4 從單 Agent 到多 Agent 7.5 小結 第8章 Agent 5:知識的提取與整合——透過 LlamaIndex 實現檢索增強生成 8.1 何謂檢索增強生成 8.2 RAG 和 Agent 8.3 透過 LlamaIndex 的 ReAct RAG Agent 實現花語祕境財報檢索 8.4 小結 第9章 Agent 6:GitHub 的熱門開發——AutoGPT、BabyAGI 和 CAMEL 9.1 AutoGPT 9.2 BabyAGI 9.3 CAMEL 9.4 小結 第10章 Agent 7:多 Agent 框架——AutoGen 和 MetaGPT 10.1 AutoGen 10.2 MetaGPT 10.3 小結 附錄A 下一代 Agent 的誕生地:科學研究論文中的新思維 參考文獻 後記 創新與變革的交會點
類似書籍推薦給您
【簡介】 ☆Transformer 架構與 MoE 專家路由解析 ☆DeepSeek 系列模型架構與優化策略 ☆FP8 混合精度與 DualPipe 平行算法實作 ☆多頭注意力與跨節點通訊技術最佳化 ☆程式自動生成、自動補全與偵錯技術 ☆Prompt 工程與 Few-shot、Soft Prompt 設計 ☆多工任務調度與跨領域特化模型應用 ☆零售、製造等行業的訂製化實戰案例 ☆資料構建、自監督學習與模型微調 ☆DeepSeek-R1 自回歸快取與長上下文推理 ☆分散式訓練與推理部署策略 ☆API 呼叫設計、吞吐調校與系統整合 本書共分為十一章,涵蓋大模型核心技術與實務應用。第一章介紹大模型的演進歷程與基礎概念,說明深度學習、Transformer 與 MoE 架構的發展脈絡。第二章深入解析 DeepSeek 的核心設計,包括多頭注意力、FP8 混合精度與跨節點通訊技術。第三章建立大模型開發基礎,從 API 調用到資料準備與模型訓練。第四章聚焦對話生成與語義理解,實作多輪對話與語意分析。第五章實作從文字到程式的智慧開發流程,包含程式補全與錯誤偵測。第六章說明多工學習與跨領域應用,包括少樣本調適與領域特化。第七章系統介紹 Prompt 工程設計與調優策略。第八章探討模型最佳化與分散式部署。第九章解析資料構建與自監督學習流程。第十章展示訂製化模型開發在零售與製造業的應用案例。第十一章專章說明 DeepSeek-R1 的推理引擎與最新優化技術。全書內容完整銜接理論與實踐,適合開發者快速掌握 DeepSeek 的開發核心。 【目錄】 ▌第1部分 理論基礎與技術實現 ►第1章 大模型技術導論 1.1 深度學習與大模型的演進 1.1.1 深度學習的歷史背景 1.1.2 Transformer 架構的崛起與影響 1.1.3 MoE 模型簡介 1.2 大模型的核心概念 1.2.1 參數規模與計算複雜度 1.2.2 資料驅動的模型最佳化 1.2.3 架構創新的推動作用 1.3 生態系統與開放原始碼框架 1.3.1 開放原始碼模型的價值 1.3.2 DeepSeek 系列模型生態概述 1.3.3 應用場景與案例 1.4 應用導向的智慧模型建構 1.4.1 從理論到實踐的轉換 1.4.2 應用程式開發中的常見挑戰 1.4.3 DeepSeek 在工業中的應用 1.5 本章小結 1.6 思考題 ►第2章 DeepSeek 核心架構解析 2.1 Transformer 與多頭注意力機制 2.1.1 基礎架構複盤 2.1.2 深度注意力最佳化 2.1.3 高效解碼策略 2.2 MoE 模型的深入剖析 2.2.1 動態路由機制詳解 2.2.2 專家負載平衡策略 2.2.3 高效通訊最佳化 2.3 FP8 混合精度計算 2.3.1 精度與性能的平衡 2.3.2 FP8 的實現與實踐 2.3.3 經濟成本導向的設計原則 2.4 深度最佳化技術 2.4.1 DualPipe 雙管道平行算法 2.4.2 上下文視窗擴充技術 2.4.3 資料與模型並行的協作最佳化 2.5 跨節點通訊技術詳解 2.5.1 跨節點通訊機制:All-to-All 2.5.2 InfiniBand 最佳化 2.5.3 NVLink 頻寬最佳化 2.6 本章小結 2.7 思考題 ►第3章 基於DeepSeek 的大模型開發基礎 3.1 開發環境與工具鏈 3.1.1 API 配置與呼叫流程 3.1.2 開放原始碼工具與開發框架整合 3.1.3 專案化部署與最佳化 3.2 資料準備與前置處理 3.2.1 資料清洗與標注 3.2.2 多語言處理與相容性 3.3 模型訓練與調優 3.3.1 超參數選擇與調整 3.3.2 訓練過程的監控與偵錯 3.3.3 訓練瓶頸與解決方案 3.4 模型評估與上線 3.4.1 模型的性能測試與最佳化指標 3.4.2 部署前驗證流程 3.4.3 即時服務與持續改進 3.5 本章小結 3.6 思考題 ►第4章 對話生成與語義理解 4.1 對話模型的輸入與輸出設計 4.1.1 對話上下文管理 4.1.2 多輪對話生成最佳化 4.1.3 對話品質評估方法 4.2 DeepSeek 在對話任務中的表現 4.2.1 問答系統的實現 4.2.2 情景模擬與角色扮演 4.2.3 個性化對話的實現 4.3 語義理解的技術路徑 4.3.1 基於深度學習的文字分析 4.3.2 深層語義建模 4.3.3 領域調配與語義特化 4.4 基於DeepSeek 的對話模型創新 4.4.1 填空生成技術 4.4.2 首碼續寫與創意生成 4.4.3 特殊格式輸出 4.5 本章小結 4.6 思考題 ▌第 2 部分 開發實踐與技術應用 ►第5章 智慧開發:從文字到程式 5.1 程式設計智慧幫手的核心技術 5.1.1 程式生成的基礎邏輯 5.1.2 多語言程式設計支援 5.1.3 演算法輔助與最佳化 5.2 DeepSeek 在程式設計任務中的表現 5.2.1 自動補全與錯誤檢測 5.2.2 演算法問題求解 5.2.3 專案開發的輔助能力 5.3 高效程式生成與偵錯 5.3.1 生成過程的控制技巧 5.3.2 偵錯能力的技術實現 5.3.3 專案化專案整合 5.4 開發環境整合實戰 5.4.1 基於VS Code 的外掛程式開發 5.4.2 API 與IDE 的無縫銜接 5.5 本章小結 5.6 思考題 ►第6章 DeepSeek 的多工與跨領域應用 6.1 多工學習的技術架構 6.1.1 多工模型的基本原理 6.1.2 多工學習的權重共用策略 6.1.3 DeepSeek 在多工場景下的最佳化 6.2 任務特化模型的開發與微調 6.2.1 模型微調的核心技術 6.2.2 基於少樣本學習的任務調配 6.3 跨領域任務的實際應用 6.3.1 文字生成與內容創作 6.3.2 程式生成與演算法最佳化 6.3.3 科學計算與公式推理 6.4 DeepSeek 跨領域應用的案例分析 6.4.1 教育領域的智慧問答系統 6.4.2 金融領域的文字挖掘與分析 6.4.3 專案領域的高效文件生成 6.5 本章小結 6.6 思考題 ►第7章 Prompt 設計 7.1 提示工程基礎 7.1.1 Prompt 最佳化的基本原理 7.1.2 Prompt 格式設計與控制 7.2 高級Prompt 設計與應用 7.2.1 長上下文的提示最佳化 7.2.2 複雜指令的執行路徑 7.2.3 模型堅固性提示 7.3 Prompt 調優技術探索 7.3.1 Few-Shot 與Zero-Shot 最佳化 7.3.2 Soft Prompt 與Embedding Tuning 7.4 本章小結 7.5 思考題 ▌第 3 部分 行業應用與訂製化開發 ►第8章 模型深度最佳化與部署 8.1 資源最佳化與成本控制 8.1.1 模型輕量化技術 8.1.2 顯示記憶體與記憶體最佳化 8.2 分散式部署技術 8.2.1 資料並行與模型並行 8.2.2 混合並行 8.3 本章小結 8.4 思考題 ►第9章 資料建構與自監督學習 9.1 高品質訓練資料的建構:以醫院門診資料為例 9.1.1 醫療資料的擷取與標注 9.1.2 資料特化:門診資料去重與清洗 9.2 自監督學習技術 9.2.1 自監督學習任務的設計與實現 9.2.2 模型的自我調整學習能力 9.3 本章小結 9.4 思考題 ►第10 章 工業導向的訂製化模型開發 10.1 企業需求分析與場景辨識 10.1.1 業務場景的智慧化需求 10.1.2 不同行業的應用特點 10.2 訂製化模型開發流程 10.2.1 資料模型設計 10.2.2 任務特化微調與訓練 10.2.3 模型整合與系統部署 10.3 訂製化案例分析 10.3.1 零售行業的需求預測系統 10.3.2 製造行業的生產效率最佳化:服裝倉庫排程問題 10.4 本章小結 10.5 思考題 ►第11 章 全新推理大模型DeepSeek-R1 11.1 DeepSeek-R1 的推理能力與計算最佳化 11.1.1 自回歸推理的執行機制與快取加速策略 11.1.2 長文字上下文追蹤:視窗注意力與KV 快取 11.1.3 低功耗裝置上的模型壓縮與輕量化推理 11.2 DeepSeek-R1 的核心架構解析 11.2.1 計算圖最佳化與Transformer 結構改進 11.2.2 MoE 動態路由機制與負載平衡 11.2.3 高效訓練框架:管線並行與分散式運算 11.3 API 呼叫與應用程式開發指南 11.3.1 API 請求參數詳解 11.3.2 高級API 能力:流式推理、多工指令與函式呼叫 11.3.3 API 吞吐量最佳化與併發呼叫管理 11.4 DeepSeek-R1 在多工推理中的表現 11.4.1 數學符號推理、代數計算與公式解析 11.4.2 事實性知識檢索:RAG 增強與模型幻覺抑制 11.4.3 多輪對話與長程推理:上下文視窗裁剪與動態記憶 11.5 本章小結 11.6 思考題
類似書籍推薦給您
【簡介】 ★人工智慧的起源與發展歷程 ☆機器學習的基本概念與分類方法 ★神經網路的基礎結構與演化歷程 ☆自然語言處理技術的發展與應用 ★大型語言模型的構建原理與應用範疇 ☆互動格式種類與ChatGPT介面詳解 ★提示工程的原理、組成與實用技巧 ☆工作記憶與長短期記憶的管理策略 ★外部工具的整合方法與應用實例 ☆ChatGPT擴充功能與Assistants API解析 ★自主Agent系統的架構設計與案例分析 ☆大型語言模型的安全技術與防護措施 【內容簡介】 本書涵蓋人工智慧的起源與發展,從達特茅斯會議探討機器思考,到現代大型語言模型的構建與應用,深入解析機器學習的概念、分類及運作,並介紹神經網路的結構與演變。自然語言處理技術部分展示NLP在科技中的應用,大型語言模型章節探討文字生成、自回歸模型與訓練過程,並指出其局限。入門部分介紹Completion、ChatML和Chat Completion等互動格式,詳解ChatGPT介面運作。提示工程章節涵蓋提示原理、組成與技巧,提升AI模型表現。工作記憶與長短期記憶管理探討減輕記憶負擔的方法及其對AI效率的影響。外部工具整合與應用實例展示如何增強AI功能,介紹基於提示和微調的工具如Self-ask、ReAct及Toolformer。ChatGPT擴充功能與Assistants API解析讓讀者了解如何定制和擴展AI應用,自主Agent系統章節通過案例展示其設計與應用潛力。進階部分探討無梯度最佳化、自主Agent系統及微調技術,提供深入研究與開發AI的知識。最後,大型語言模型的安全技術與防護措施闡述提示注入攻擊、防禦策略、越獄攻擊、資料投毒及模型浮水印方法,保障AI系統安全。 【目錄】 ▌第1 篇 基礎 第1 章 從人工智慧的起源到大型語言模型 1.1 人工智慧的起源 1.1.1 機器能思考嗎 1.1.2 達特茅斯會議 1.2 什麼是機器學習 1.2.1 演繹推理與歸納推理 1.2.2 人工程式設計與自動程式設計 1.2.3 機器學習的過程 1.2.4 機器學習的分類 1.3 什麼是神經網路 1.3.1 還原論與湧現性 1.3.2 神經網路的發展歷史 1.3.3 神經網路基礎 1.3.4 神經網路的三要素 1.4 自然語言處理的發展歷程 1.4.1 什麼是自然語言處理 1.4.2 文字的向量化 1.4.3 神經網路中的自監督學習 1.5 大型語言模型 1.5.1 什麼是大型語言模型 1.5.2 語言模型中的token 1.5.3 自回歸模型與文字生成 1.5.4 統一自然語言任務 1.5.5 大型語言模型的訓練過程 1.5.6 大型語言模型的局限性 ▌第2篇 入門 第2章 互動格式 2.1 Completion 互動格式 2.2 ChatML 互動格式 2.3 Chat Completion 互動格式 第3 章 提示工程 3.1 什麼是提示工程 3.2 提示的組成 3.3 提示的基礎技巧 3.3.1 在提示的末尾重複關鍵指令 3.3.2 使用更清晰的語法 3.3.3 儘量使用範例 3.3.4 明確要求大型語言模型回覆高品質的回應 3.4 Chat Completion 互動格式中的提示 3.5 提示範本與多輪對話 第4 章 工作記憶與長短期記憶 4.1 什麼是工作記憶 4.2 減輕工作記憶的負擔 4.2.1 Chain-of-Thought 4.2.2 Self-Consistency 4.2.3 Least-to-Most 4.2.4 Tree-of-Tought 和Graph-of-Tought 4.2.5 Algorithm-of-Tought 4.2.6 Chain-of-Density 4.3 關於大型語言模型的思考能力 4.4 長短期記憶 4.4.1 什麼是記憶 4.4.2 短期記憶 4.4.3 長期記憶 第5 章 外部工具 5.1 為什麼需要外部工具 5.2 什麼是外部工具 5.3 使用外部工具的基本原理 5.4 基於提示的工具 5.4.1 Self-ask 框架 5.4.2 ReAct 框架 5.4.3 改進ReAct 框架 5.5 基於微調的工具 5.5.1 Toolformer 5.5.2 Gorilla 5.5.3 function calling 第6 章 ChatGPT 介面與擴充功能詳解 6.1 OpenAI 大型語言模型簡介 6.2 ChatGPT 擴充功能原理 6.2.1 網頁即時瀏覽 6.2.2 執行Python 程式 6.2.3 影像生成 6.2.4 本地檔案瀏覽 6.3 Chat Completion 介面參數詳解 6.3.1 模型回應傳回的參數 6.3.2 向模型發起請求的參數 6.4 Assistants API 6.4.1 工具 6.4.2 執行緒 6.4.3 執行 6.4.4 Assistants API 整體執行過程 6.5 GPTs 與GPT 商店 6.5.1 GPTs 功能詳解 6.5.2 GPT 商店介紹 6.5.3 案例:私人郵件幫手 ▌第3 篇 進階 第7 章 無梯度最佳化 7.1 單步最佳化 7.2 強化學習入門 7.3 多步最佳化中的預測 7.4 多步最佳化中的訓練 7.5 多步最佳化中的訓練和預測 第8 章 自主Agent 系統 8.1 自主Agent 系統簡介 8.2 自主Agent 系統的基本組成 8.3 自主Agent 系統案例分析(一) 8.3.1 BabyAGI 8.3.2 AutoGPT 8.3.3 BeeBot 8.3.4 Open Interpreter 8.3.5 MemGPT 8.4 自主Agent 系統案例分析(二) 8.4.1 CAMEL 8.4.2 ChatEval 8.4.3 Generative Agents 第9 章 微調 9.1 三類微調方法 9.2 Transformer 解碼器詳解 9.2.1 Transformer 的原始輸入 9.2.2 靜態編碼和位置編碼 9.2.3 Transformer 層 9.3 高效參數微調 9.3.1 Adapter 高效微調 9.3.2 Prompt 高效微調 9.3.3 LoRA 高效微調 9.3.4 高效微調總結 9.4 微調RAG 框架 9.4.1 RAG 框架微調概述 9.4.2 資料準備和參數微調 9.4.3 效果評估 第10 章 大型語言模型的安全技術 10.1 提示注入攻擊 10.1.1 攻擊策略 10.1.2 防禦策略 10.2 越獄攻擊與資料投毒 10.2.1 衝突的目標與不匹配的泛化 10.2.2 對抗樣本 10.2.3 資料投毒 10.3 幻覺和偏見問題 10.4 為大型語言模型增加浮水印 ▌第4 篇 展望 第11 章 大型語言模型的生態與未來 11.1 多模態大型語言模型 11.1.1 什麼是多模態 11.1.2 GPT-4V 簡介 11.1.3 Gemini 簡介 11.2 大型語言模型的生態系統 11.3 大型語言模型的第一性原理:Scaling Law 11.3.1 什麼是Scaling Law 11.3.2 Scaling Law 的性質 11.3.3 Scaling Law 的未來 11.4 通向通用人工智慧:壓縮即智慧 11.4.1 編碼與無失真壓縮 11.4.2 自回歸與無失真壓縮 11.4.3 無失真壓縮的極限 11.5 圖靈機與大型語言模型:可計算性與時間複雜度 11.5.1 圖靈機與神經網路 11.5.2 智慧的可計算性 11.5.3 邏輯推理的時間複雜度 參考文獻