書名:	更少GPU卻更強 - LLM輕量化壓縮及加速訓練 (1版)
作者:	梁志遠
版次:	1
ISBN:	9786267757604
出版社:	深智數位
出版日期:	2025/12
頁數:	552
#資訊 #AI人工智慧與機器學習

定價:	~~980~~元
折扣:	9 折
售價:	882 元
庫存:	現貨: 1
查看店內位置
LINE US!	詢問這本書團購優惠、書籍資訊等

更少GPU卻更強 - LLM輕量化壓縮及加速訓練 (1版)

官網限定: 882 蝦皮價格 930 現省: 48

付款方式:	超商取貨付款
	信用卡
	線上轉帳
物流方式:	超商取貨
	宅配
	門市自取

詳細資訊
閱讀心得

【簡介】 【內容特點】 ★Transformer與MoE架構計算特性 ★模型壓縮技術：量化、剪枝、蒸餾 ★混合精度訓練與分散式訓練架構 ★ONNX與TensorRT格式轉換流程 ★運算圖最佳化：融合、重寫、記憶體配置 ★端側學習與聯邦學習通訊機制 ★IR中介表示與計算圖優化策略 ★動態Batch與記憶體排程機制 ★cuDNN與MKLDNN運算元庫應用 ★CUDA核心函數與GPU記憶體管理 ★Vulkan推理加速與圖形並行整合 ★OpenCL與AVX跨平台加速 ★DeepSeek-V3訓練與推理結構 ★FP8精度訓練與Sigmoid路由演算法【內容簡介】本書從工程實作與架構設計的角度出發，系統地整理了大模型在實際部署中的資源瓶頸與解決方案。從Transformer與MoE架構切入，解析其帶來的計算與儲存壓力，並延伸至量化、剪枝、知識蒸餾等主流模型壓縮技術的原理與實作要點。書中不僅整理了各類加速方法，如混合精度訓練、分散式架構與推理引擎建構，還提供跨框架的模型格式轉換範例，涵蓋ONNX、TensorRT等工具鏈整合流程。進一步深入端側學習、IR最佳化與動態Batch記憶體管理等核心技術，並透過cuDNN、MKLDNN、CUDA與Vulkan等元件展示運算元優化的具體實作。本書最大特點是涵蓋理論與部署細節，並以DeepSeek-V3為案例展現整體技術鏈條如何協同降本增效。對於實際從事大模型研發、推理部署或系統最佳化的工程人員而言，是一本兼顧理論深度與實務操作的實用指南。 【目錄】 ▌第一部分大模型概述與核心最佳化技術 ►第1章大模型基本概念 1.1 大模型的興起與發展 1.1.1 大規模神經網路 1.1.2 Transformer 編碼器－解碼器 1.1.3 MoE 架構 1.2 運算資源與性能瓶頸 1.2.1 GPU 簡介 1.2.2 TPU 簡介 1.2.3 網路頻寬約束與分散式訓練 1.2.4 大模型的訓練時間與運算資源消耗問題 1.3 資料與隱私問題 1.3.1 急劇增加的資料量 1.3.2 資料隱私保護與符合規範性 1.4 模型部署與運行維護 1.4.1 模型部署基本概念 1.4.2 雲端運算與邊緣計算 1.4.3 端側部署 1.4.4 大模型執行與維護 1.5 本章小結 1.6 思考題 ►第2 章模型壓縮、訓練與推理 2.1 模型壓縮概述 2.1.1 模型壓縮簡介 2.1.2 常見的模型壓縮方法分類 2.2 訓練加速基礎 2.2.1 資料並行與模型並行 2.2.2 混合精度訓練 2.2.3 分散式訓練框架：Horovod 2.3 推理加速基礎 2.3.1 硬體加速與推理引擎 2.3.2 低延遲與高輸送量平衡 2.3.3 推理最佳化實戰：批次推理 2.4 性能評估指標 2.4.1 計算複雜度與性能指標 2.4.2 延遲、輸送量與精度之間的權衡 2.4.3 評估工具與基準測試 2.5 本章小結 2.6 思考題 ►第3 章模型格式轉換 3.1 模型格式的定義與轉換 3.1.1 常見的模型格式：ONNX、TensorFlow 的SavedModel 3.1.2 模型格式轉換實現 3.1.3 模型的相容性問題 3.2 跨框架模型轉換 3.2.1 TensorFlow 到PyTorch 的模型轉換 3.2.2 ONNX 與TensorFlow、PyTorch 的相容性 3.2.3 轉換時的精度損失問題 3.3 硬體相關的格式轉換 3.3.1 從PyTorch 到TensorRT 3.3.2 ONNX 模型與NVIDIA TensorRT 的相容性 3.3.3 模型格式與硬體加速的關係 3.4 模型格式轉換的工具與函式庫 3.4.1 使用ONNX 進行跨平臺轉換 3.4.2 TensorFlow Lite 與Edge 模型最佳化 3.5 本章小結 3.6 思考題 ►第4 章圖最佳化 4.1 運算子融合技術 4.1.1 運算子融合的原理 4.1.2 典型運算子融合演算法的實現 4.1.3 實驗：運算子融合對推理性能的提升 4.2 布局轉換與最佳化 4.2.1 張量布局的原理 4.2.2 記憶體存取最佳化與布局選擇 4.3 運算子替換技術 4.3.1 用低消耗運算子替換高消耗運算子 4.3.2 常見的運算子替換策略 4.4 顯示記憶體最佳化 4.4.1 顯示記憶體佔用分析與最佳化 4.4.2 梯度檢查點與顯示記憶體共用 4.4.3 動態顯示記憶體分配與記憶體池管理 4.5 本章小結 4.6 思考題 ►第5 章模型壓縮 5.1 量化 5.1.1 定點量化與浮點量化的區別 5.1.2 量化演算法與工具：TensorFlow Lite 5.1.3 量化帶來的精度損失問題 5.2 知識蒸餾 5.2.1 知識蒸餾的基本概念與應用場景 5.2.2 知識蒸餾的損失函式與訓練過程 5.2.3 如何選擇蒸餾－教師網路模型 5.3 剪枝 5.3.1 網路剪枝基本原理 5.3.2 基於權重剪枝與結構化剪枝 5.3.3 剪枝後的精度恢復方案 5.4 二值化與極端壓縮 5.4.1 二值化網路的建構與訓練 5.4.2 二值化對計算與儲存的影響 5.5 本章小結 5.6 思考題 ▌第二部分端側學習與高效計算引擎最佳化 ►第6 章端側學習、端側推理及計算引擎最佳化 6.1 聯邦學習概述 6.1.1 聯邦學習的基本概念與應用 6.1.2 聯邦學習中的隱私保護機制、通訊與聚合演算法 6.2 資料處理與前置處理 6.2.1 資料清洗與增廣技術 6.2.2 資料均衡與過採樣策略 6.2.3 端側資料處理的資源限制 6.3 Trainer 與最佳化器設計 6.3.1 端側訓練的挑戰與策略 6.3.2 高效最佳化器（如SGD、Adam）的選擇 6.3.3 動態調整學習率與訓練過程監控 6.4 損失函式的設計與選擇 6.4.1 常見的損失函式與應用場景 6.4.2 多工學習中的損失函式設計 6.4.3 損失函式的數值穩定性 6.5 Benchmark 設計與性能評估 6.5.1 經典Benchmark 與訂製Benchmark 6.5.2 推理與訓練性能的綜合評估 6.5.3 性能瓶頸的辨識與最佳化 6.6 IR 的作用與最佳化 6.6.1 IR 的定義及作用 6.6.2 IR 轉換與最佳化策略 6.7 Schema 的設計與規範 6.7.1 資料格式與模型介面的設計 6.7.2 資料流程與計算圖的規範化 6.8 動態Batch 與記憶體排程 6.8.1 動態Batch 的選擇與調整 6.8.2 記憶體排程與性能最佳化 6.8.3 最佳化記憶體使用率與減少記憶體溢位 6.9 異質執行與最佳化 6.9.1 GPU 與CPU 的異質計算模式原理 6.9.2 多核心與多節點並行最佳化 6.9.3 異質計算中的任務排程 6.10 裝箱操作與計算圖最佳化 6.10.1 透過裝箱減少計算消耗 6.10.2 裝箱最佳化對計算圖的影響 6.11 本章小結 6.12 思考題 ►第7 章高性能運算子函式庫簡介 7.1 cuDNN 運算子函式庫概述 7.1.1 cuDNN 的主要功能 7.1.2 常用運算子（卷積、池化等）的實現 7.1.3 運算子加速實戰：cuDNN 在深度學習中的應用 7.2 MKLDNN 運算子函式庫概述 7.2.1 MKLDNN 與Intel 硬體的最佳化 7.2.2 MKLDNN 中的高效運算子實現 7.2.3 多核心支援與平行計算最佳化 7.3 運算子函式庫的選擇與性能比較 7.3.1 cuDNN 與MKLDNN 的應用場景對比 7.3.2 在不同硬體平臺上的表現 7.4 運算子函式庫的高效利用 7.4.1 如何選擇合適的運算子函式庫 7.4.2 最佳化運算子函式庫介面與記憶體管理 7.4.3 演算法重構：提高運算子性能 7.5 本章小結 7.6 思考題 ▌第三部分高性能運算子與深度學習框架應用 ►第8 章常用高性能運算子開發實戰 8.1 NEON 與ARM 架構最佳化 8.1.1 NEON 指令集與深度學習加速 8.1.2 ARM 架構上的平行計算最佳化 8.1.3 使用NEON 實現卷積等運算子加速 8.2 CUDA 與GPU 最佳化 8.2.1 CUDA 程式設計模型與記憶體管理 8.2.2 CUDA 串流與核心函式最佳化 8.2.3 高效利用GPU 平行計算資源 8.3 Vulkan 與圖形加速 8.3.1 Vulkan 的低階控制與最佳化 8.3.2 使用Vulkan 進行推理加速 8.3.3 圖形與計算並行加速的結合 8.4 AVX 與OpenCL 的最佳化 8.4.1 AVX 與CPU 最佳化的基本原理 8.4.2 OpenCL 與跨平臺加速 8.5 本章小結 8.6 思考題 ►第9 章 TIK、YVM 運算子原理及其應用 9.1 TIK 運算子函式庫的應用 9.1.1 TIK 運算子函式庫與TensorFlow Lite 的整合 9.1.2 使用TIK 進行卷積與矩陣乘法加速 9.2 YVM 運算子函式庫的應用 9.2.1 YVM 在深度學習推理中的高效應用 9.2.2 YVM 的硬體調配與最佳化 9.3 本章小結 9.4 思考題 ►第10 章基於DeepSeek-V3 分析大模型訓練降本增效技術 10.1 DeepSeek-V3 架構概述 10.1.1 DeepSeek-V3 的架構設計與創新 10.1.2 模型參數共用與層次結構最佳化 10.2 DeepSeek-V3 的訓練降本技術分析 10.2.1 FP8 精度訓練、混合精度訓練與分散式訓練 10.2.2 動態計算圖 10.2.3 自我調整批次處理與梯度累積技術 10.2.4 Sigmoid 路由機制 10.2.5 無輔助損失負載平衡演算法 10.2.6 DualPipe 演算法 10.2.7 All-to-All 跨節點通訊 10.3 DeepSeek-V3 的推理加速技術 10.3.1 量化與蒸餾在DeepSeek-V3 中的應用 10.3.2 模型壓縮與推理速度提升 10.4 本章小結 10.5 思考題

大家的想法

還沒有人留下心得，快來搶頭香！

撰寫您的閱讀心得

為您推薦

人工智慧：智慧型系統導論 (3版)

書名：人工智慧：智慧型系統導論(第三版) 作者：李聯旺出版社：全華 ISBN：9789862800959

原價: ~~590~~ 售價: 531 現省: 59元

立即查看

機器學習：類神經網路、模糊系統以及基因演算法則 (4版)

書名：機器學習：類神經網路、模糊系統以及基因演算法則(第四版) 作者：蘇木春、張孝德出版社：全華出版日期：2016/05/00 ISBN：9789864632060 內容簡介 ■ 本書優點特色 1.將三種與機械學習相關的技術-類神經網路、模糊系統及基因演繹法作一通盤介紹。 2.以深入淺出的方式建立類神經網路與生物神經網路的關聯性，以便讓讀者更能發揮想像力。 3.每一種理論都儘可能配合書中範例及圖表加以說明。 ■ 內容簡介本書將三種與機械學習相關的技術-類神經網路、模糊系統及基因演繹法作一通盤介紹。此外，作者以深入淺出的方式建立類神經網路與生物神經網路的關聯性，以便讓讀者更能發揮想像力。目錄第1章類神經網路之簡介第2章感知機第3章多層感知機第4章非監督式類神經網路第5章聯想記憶第6章增強式學習第7章模糊集合第8章模糊關係及推論第9章模糊系統第10章基因演算法則

原價: ~~390~~ 售價: 351 現省: 39元

立即查看

別再跳脫舒適圈：以更少的壓力和更持久的心流狀態，創造真正熱愛的人生 (1版)

【簡介】 ★ 破解「跳出舒適圈」的迷思 ★ 　　舒適圈並非危險的地方！這本改變典範的指南要告訴你如何利用快樂、創造力和輕鬆自在的力量，為打造最美好的生活奠定基礎。　　內附線上別冊【留在舒適圈更成功的27個簡單練習】，一步步讓你邁向真正熱愛的人生　　＊打開本書前，請準備好忘掉大家告訴你關於「舒適圈」的一切！　　1. 舒適圈是你懶得採取行動而自滿待著的地方。（x）　　2. 舒適圈會阻礙你實現夢想生活。（x）　　3. 你處於舒適的狀態，就不會成長。（x）　　4. 「跳脫舒適圈」，得用奮力、痛苦、堅忍去生活，才能成功。（x）　　5. 沒有痛苦就沒有收穫，沒有踏出舒適圈的成功是可恥的。（x）　　6. 你待在舒適圈裡就不可能做到高生產力。（x）　　7. 你要先跨出舒適圈，才會意識到自己的潛力。（x）　　8. 如果你感到舒適，表示你是在欺騙自己。（x）　　9. 待在舒適圈裡，你的夢想就會死去。（x）　　10. 如果你想擁有美好人生，就一定要跨出舒適圈。（x）　　＊上述的說法若是錯的，那舒適圈的真面目是什麼呢？　　作者克莉絲汀認為，舒適圈是成長、可能性與喜悅的真正源頭，而且待在舒適圈的心態，是健康、自信、快樂、信念、放鬆、成功……。　　→只要透過3個步驟、27個練習，我們就可以運用舒適圈所獲得的能量，取得巨大的成功。　　＊大家都說，待在舒適圈就是不知長進，為何要待在舒適圈裡？　　作者要告訴你，「沒有什麼地方會比在舒適圈時更快、更省力的取得成功。」她寫道：「我在舒適圈內生活，因此取得比想像中更多的成功，而且我沒有因此感到過於勞累或因此妥協，你也可以。」　　→待在舒適圈，你會充滿安全感、信心、愉悅，且自然地展現自己，這時的你力量最大，嘗試新事物成功的動力最滿，能順利取得更多的成功。　　＊用「舒適圈流程」3步驟，更快成功！　　步驟1：定義你所在的地方　　我們的人生狀態有三種圈子，依序是舒適圈、生存圈和自滿圈。作者認為，我們待在舒適圈，才能將自己的力量發揮到最大。首先，要找出自己現居在哪一個圈子，再找到自己的舒適圈，逐漸往舒適圈移動。　　在這步驟，一旦進入舒適圈，你會感受到「安全感」「展現力（充分展現自己）」「愉快感」「勇氣」。　　步驟2：擬定你前往的地方　　居處「舒適圈」，你將會獲得上述四種感受。那你要怎麼前往「自己想去的地方/夢想」（擴展舒適圈）。作者認為，先想像「擴展的自我」，然後製作「舒適圈願景板」去一步步實現。　　在這步驟，要善用「言詞」與引導「內心的情緒」，才能幫助自己實現夢想或擴展舒適圈。　　步驟3：指引抵達的方式　　就空間看來，步驟3其實不在最後，它是連結步驟1和2的橋梁，因為指引抵達的地方，需要先知道出發點和終點。當你清楚自己的所在地與前往地，步驟3就會出現有成效的行動，把你帶到內心真正渴望的目的地。　　在這步驟，要特別關注自己的「心理習慣」！它會影響你的念頭與現實。　　特別注意：依循這三大步驟，做練習的時候，請千萬注意，不要指責自己！　　＊知道留在舒適圈更快成功的步驟後，你需要更多練習　　作者用自身的經驗出發，在每章節後附上練習，共27個，從信念、目標、畫下界線、對焦習慣、養成良好思維等，無一缺漏。跟著這27個練習，你將會迎來自己真正熱愛的美好人生。　　＊隨時檢驗你的狀態：總有痛苦、恐懼的時候，這時我離開了舒適圈嗎？　　有五種情緒可以用來判斷我們是否離開舒適圈，如果你感受到其中一種情緒，就該知道你的鏡頭要向內轉，審視內在狀態，好讓自己返回舒適圈。　　這五種情緒分別是：困惑、嫉妒、身體的疼痛或損傷、不堪負荷和焦慮。　　你若想成為「過著快樂又圓滿生活的成功人士」，這本書將會是你的人生指南。【目錄】序言 Part I為什麼舒適感很重要？第 1 章「一定要跨出舒適圈」是錯的第 2 章你的信念讓你感到不適第 3 章人生狀態有三種圈子第 4 章跨出舒適圈的後果第 5 章夠舒適才能邁向成功 Part II 用「舒適圈流程」來創造人生步驟1：定義你所在的地方第 6 章找到舒適圈，就能找回自我第 7 章舒適圈裡有安全感第 8 章舒適圈裡可展現真實樣貌第 9 章舒適圈裡充滿愉快感第10章舒適圈裡蓄滿勇氣步驟2：擬定你前往的地方第11章你希望自己成為什麼樣貌？第12章製作舒適圈版本的願景板第13章利用言詞的力量打造美好人生第14章微調內心情緒以留在舒適圈內步驟3：指引「抵達的方式」第15章適應新事物、擴展舒適圈的方式第16章利用「身分認同」改變習慣第17章善用「心理習慣」前往你想去的地方第18章發揮「關係」的力量續留舒適圈 Part III 成為舒適圈專家第19章兩方法加強愈來愈舒適的動力流第20章用「內在的確知」在舒適圈中站穩第21章掌握舒適圈兩區域就掌握成功的祕訣第22章待在舒適圈裡活出美好人生參考資料致謝

原價: ~~450~~ 售價: 383 現省: 67元

立即查看

為什麼不愛了：更多自由卻更少承諾，社會學家的消極關係報告 (1版)

原價: ~~560~~ 售價: 476 現省: 84元

立即查看

以少創多：我們如何用更少的資源創造更多產出？ (1版)

原價: ~~500~~ 售價: 425 現省: 75元

立即查看

如何循序漸進撐起自己的野心（破萬紀念版）：這世上，比賺得少更可怕的，是迷茫，這本書一定可以給你意想不到的答案。

原價: ~~390~~ 售價: 332 現省: 58元

立即查看

懂一點法律2 勞資少糾紛，經營更輕鬆：釐清聘雇、薪資、工時到解雇等管理問題，勞資不對立、不吃虧 (1版)

【簡介】 30 個人事管理最常遇到的問題，超白話釐清勞動法規紅線解決中小企業、新創團隊、小型工作室經營者難自理的勞資爭議　　老闆要求員工打疫苗、快篩合法嗎？　　居家工作期間能在員工電腦上裝監視程式嗎？颱風假也要照放嗎？　　員工每天早到晚退留在公司處理私事，老闆還必須給加班費？　　美髮店員工每天遲到，可以用扣薪處罰她嗎？　　老闆應徵「廚房阿姨」、「保全大叔」居然就觸法？　　這樣管理居然會出事？　　過去沒問題的管理方式，現在卻可能出大事。　　老闆每天拚業績還要管人事，哪有時間研究這麼多？　　一本讀懂人事管理的法令紅線，老闆不犯錯，員工更懂自保。　　★《勞動事件法》實施後，最符合簡明實務的解說，不懂法律、新手人資也能快速掌握勞資雙方權益與權力　　2020 年 1 月 1 日，《勞動事件法》（以下簡稱《勞事法》）正式上路，加上新冠疫情衝擊，工作環境面臨前所未有的改變，勞資雙方都面臨全新挑戰，許多規範與傳統管理模式相牴觸，而且舉證責任落在資方身上，若雇主、人資或主管對此毫無認識誤觸紅線，很有可能使公司人財兩失；而作為勞方，也該多瞭解這部特別的勞動法令，遇到「職場惡霸」就不用擔心權益受損。　　本書作者陳業鑫是台灣唯一同時具有法官、勞動局長、訴願審議委員會主委、金控公司董事、公司治理委員會委員經驗的律師。他運用扎實的勞資背景與經驗，透過勞動事件法上路一年後，最接近勞動現場的案例分享，幫助勞資雙方了解自己的權益，共創雙贏局面。本書特色　　●不用懂法律、缺乏人資背景也能快速掌握勞資權益：透過 30 個實務案例，從招募、工時與薪資管理、懲戒獎勵到解僱，幫助雇主避開勞資爭議，更能保護公司權益。　　●蒐集經營者最頭痛的管理問題，一一提供安全合法的處理方法：遠距工作如何製作出勤紀錄、管理營業祕密？能以受疫情衝擊為由資遣員工嗎？等，中小型企業，老闆、老闆娘兼人資的經營者最常遇到的管理難題，並於每篇最後提供安全實用的行動建議。　　●法條圖表化，一眼掌握重點，秒懂基礎勞動法令：將複雜難懂的法條表格化，幫助老闆省下爬梳法條的時間，更快、更妥善處理勞資問題，避免不必要的資源損耗。　　組織發展不容易，留住人才更困難。　　透過30個職場常見勞資糾紛加上行動指南，　　讓老闆守住錢財留下人才，員工守護權益不吃虧。專文推薦　　勞動部長　許銘春　　全國律師聯合會理事長　陳彥希　　社團法人中華人力資源管理協會理事長　薛光揚　　遵守勞動法，健全公司勞動規範，就是企業經營成功的不二法門。感謝陳律師的分享與努力，相信此書將能協助企業落實勞動法，正面看待勞動法，進而增進勞工權益，提升企業實力。——勞動部長　許銘春　　陳律師把寶貴的經驗收入本書，讓原來對於勞資問題陌生的讀者，可以很快掌握爭議的精髓，對於已有處理勞資問題經驗的讀者，也可以在本書中發現不同的解決方式，獲得啟發。——全國律師聯合會理事長　陳彥希　　本書可做為企業經營者、管理者及人力資源工作者的隨身寶典。透過陳律師難能可貴的實務分享，可學習如何免除勞資的爭議，也可以提升企業管理的層次，增加經營的效能，可謂一舉數得。——社團法人中華人力資源管理協會理事長　薛光揚【目錄】推薦序一建立勞動法規意識，勞資關係雙贏共榮推薦序二勞資關係的簡明實用指引推薦序三讓法律從「限制」變「助力」，勞資雙方都獲益作者序預防重於治療，勞資糾紛皆可避寫於書前強化企業體質、勞資關係重開機的最佳契機第一章從招聘到面試——漏財又容易觸法的魔鬼細節做智力測驗、問犯罪紀錄錯了嗎？壓力測試沒做成，反引發歧視糾紛？可以雇用外籍生或外籍配偶嗎？遇到惡意求職者，不必自認倒楣別拿試用期當藉口「拗」員工第二章差勤與工資的計算——勞資最敏感的神經工資跟你想得不一樣遲到扣薪，小心違法！早到遲退，難道都算加班嗎？在家上班，工時怎麼計算？颱風假其實不是「假」在同屬家族事業的不同企業工作，年資可合併嗎？調動員工，須符合五大原則小型工作室也要應開勞資會議嗎？第三章人資地雷區——懂一點法律，員工利益與公司權益可兩全別讓「愛之深，責之切」演變為職場霸凌過度追求，到底算不算職場性騷擾？上網爆料有風險，丟飯碗外還可能吃上官司 Line 上提離職，結果無法回收可以要求員工打疫苗或做特定篩檢嗎？斜槓兼職，要看老闆准不准解僱有身孕的勞工，可能導致更大損失可以限制員帶槍投靠敵營嗎？慫恿同事離職，小心下個打包的是你第四章結束僱傭關係——好聚好散的方法員工做不好，就可以直接炒了他嗎？搞「狼性」競爭，小心誤踩紅線黑天鵝出現，就能要求員工「共體時艱」？紅線畫清楚，開鍘犯規員工才有底氣

原價: ~~430~~ 售價: 366 現省: 64元

立即查看

大家的想法

撰寫您的閱讀心得

書籍分類

您的購物車