搜尋建議
書名: 資料庫內部原理|深入了解分散式資料系統的運作方式 (1版) (1版)
作者: Alex Petrov
譯者: 何宜玲
版次: 1
ISBN: 9786263248649
出版社: OREILLY歐萊禮
出版日期: 2024/08
書籍開數、尺寸: 23*18.5
頁數: 376
#資訊
#資料庫與資料管理
定價: 780
折扣: 8.5
售價: 663
庫存: 已售完
此書籍已售完,調書籍需2-5工作日。建議與有庫存書籍分開下單
查看店內位置
LINE US! 詢問這本書 團購優惠、書籍資訊 等

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

【簡介】 「為了選擇適合的工具來完成工作,我們必須了解其設計背後的概念和演算法。本書是由業界從業者為初學者撰寫的入門書籍,涵蓋了許多相關主題。」 -Michael Klishin RabbitMQ長期貢獻者 「對於任何從事資料庫技術有關的人來說,這是一本必備的書籍,尤其是在需要做出使用哪些系統的決策時。」 -Nate McCall Apache Cassandra貢獻者及PMC主席 在選擇、使用和維護資料庫時,了解其內部原理是必不可少的。然而,隨著當今有許多分散式資料庫和工具可供選擇,往往很難了解每個資料庫提供的功能和它們之間的差異。在這本實用指南中,Alex Petrov將引導開發人員深入了解現代資料庫和儲存引擎內部的概念。 在整本書中,您將探索從眾多書籍、論文、部落格文章及幾個開源資料庫的原始碼中所獲取的相關資料。您將發現,許多現代資料庫中,最重要的區別在於決定儲存結構和資料分散方式的子系統中。 您將深入探討以下內容: ‧儲存引擎:了解儲存分類和分類法,深入研究基於B樹(B-tree-based)和不可變的日誌(immutable log-structured)結構儲存引擎。 ‧儲存建構塊:了解如何使用輔助資料結構組織資料庫檔案,如頁面快取和緩衝池,來建立高效的儲存系統。 ‧分散式系統:逐步學習節點和進程如何連接並建立複雜的通訊模式。 ‧資料庫叢集:探索現代資料庫常用的一致性模型,以及分散式儲存系統如何實現一致性。 【目錄】 前言 【第一篇 儲存引擎】   第 01 章 簡介和概述   第 02 章 B 樹基礎   第 03 章 檔案格式   第 04 章 實施 B 樹   第 05 章 交易處理和恢復   第 06 章 B 樹變體   第 07 章 日誌結構化儲存 第一部分結論 【第二篇 分散式系統】   第 08 章 簡介和概述   第 09 章 故障檢測   第 10 章 領導者選舉   第 11 章 複製和一致性   第 12 章 反熵與傳播   第 13 章 分散式交易   第 14 章 共識 第二部分結論 附錄 A 參考文獻 索引

大家的想法

還沒有人留下心得,快來搶頭香!

撰寫您的閱讀心得

為您推薦

資料庫解剖學:從內部深解MySQL運作原理

資料庫解剖學:從內部深解MySQL運作原理

類似書籍推薦給您

原價: 880 售價: 792 現省: 88元
立即查看
RAG再深入研究 - 向量資料庫智慧檢索及應用 (1版)

RAG再深入研究 - 向量資料庫智慧檢索及應用 (1版)

類似書籍推薦給您

【簡介】 【書籍特點】 ★解構高維資料儲存與「維度詛咒」問題 ★比較向量資料庫與傳統關聯式資料庫設差異 ★探索靜態與動態向量嵌入的生成與應用 ★分析距離度量失效與高維相似度計算方法 ★實作HNSW與LSH等近似最近鄰搜尋演算法 ★評估Annoy與BallTree在不同檢索場景的效能 ★解析FAISS向量索引類型與GPU加速技術 ★建構Milvus系統並實現分散式與容器化部署 ★支援中繼資料條件查詢與多維混合檢索 ★結合語義嵌入技術進行語義搜尋系統開發 ★完整實作自動駕駛場景的資料檢索系統 ★導入預訓練模型與微調生成高品質語義向量 ★實現RESTful API與雲端語義檢索服務整合 ★全面覆蓋語義搜索性能調校與異常診斷模組   【內容簡介】 這是一本針對高維向量資料檢索技術所編寫的系統性實務指南,涵蓋從理論基礎、核心演算法到主流工具與應用部署的完整脈絡。內容不僅說明向量資料庫的設計必要性,也具體分析傳統資料庫在高維資料處理上的限制,進而引入HNSW、LSH、Annoy等近似最近鄰搜尋演算法的實作方法。對於工程應用層面,書中詳細介紹FAISS與Milvus兩大系統的架構設計、索引建構、GPU最佳化與容器化部署流程,並輔以自動駕駛、語義檢索等真實場景的完整案例。實作細節包括語義嵌入生成、向量預處理、多條件查詢與RESTful介面開發,對需要建構語義搜索或高效推薦引擎的開發者而言具有極高參考價值。本書適合AI開發者、搜尋系統工程師、推薦系統實作者及研究高維向量檢索的學術人員使用,是串接模型應用與資料系統的關鍵橋樑。  【目錄】 ▌第一部分 理論基礎 ►第1 章 為何需要向量資料庫 1.1 大語言模型的缺陷 1.1.1 高維向量表示中的資訊遺失問題 1.1.2 嵌入空間對語義相似度的誤差影響 1.2 高維資料儲存與檢索的技術瓶頸 1.2.1 高維資料的特性與儲存困難分析 1.2.2 高維空間中的「維度詛咒」問題簡介 1.2.3 高效檢索:索引結構與搜尋演算法簡介 1.3 傳統資料庫與向量資料庫的對比分析 1.3.1 傳統資料庫的設計原理與局限性 1.3.2 高維向量檢索在傳統資料庫中的實現困難 1.3.3 傳統資料庫與向量資料庫的性能對比分析 1.4 向量資料庫的優勢 1.5 本章小結 1.6 思考題   ►第2 章 向量資料庫基礎 2.1 向量資料庫的核心概念與基本資料結構 2.1.1 向量資料庫的定義與發展背景 2.1.2 向量資料庫常見的資料結構:倒排索引、圖索引與分區技術 2.1.3 向量資料庫與傳統資料庫邏輯對比 2.2 特徵提取與向量表示:從資料到高維座標系 2.2.1 特徵提取的基本方法 2.2.2 嵌入向量生成 2.2.3 資料前置處理對向量品質的影響 2.3 高維空間特性與「維度詛咒」問題解析 2.3.1 高維空間中的稀疏性與資料分佈特性 2.3.2 距離度量的退化:歐幾里得距離與餘弦相似度 2.3.3 維度詛咒:降維與索引最佳化 2.4 本章小結 2.5 思考題   ▌第二部分 核心技術與演算法原理 ►第3 章 向量嵌入 3.1 靜態向量嵌入 3.1.1 傳統詞向量模型:Word2Vec 與GloVe 3.1.2 靜態嵌入的局限性:語義多義性與上下文缺失 3.1.3 靜態向量嵌入在特定領域的應用 3.2 動態向量嵌入 3.2.1 動態詞向量的生成:BERT 與GPT 的嵌入機制 3.2.2 動態嵌入的優勢:上下文敏感性與語義一致性 3.2.3 動態向量嵌入的即時生成與最佳化 3.3 均勻分佈與空間覆蓋率 3.3.1 高維向量分佈分析 3.3.2 嵌入向量的均勻性測量方法 3.3.3 空間覆蓋率對檢索性能的影響 3.4 嵌入向量最佳化 3.4.1 主成分分析與奇異值分解的降維應用 3.4.2 t-SNE 與UMAP 降維技術 3.4.3 降維對嵌入語義保留與性能的權衡分析 3.5 本章小結 3.6 思考題   ►第4 章 向量相似性搜尋初步 4.1 基於暴力搜尋的向量相似性檢索 4.1.1 暴力搜尋的原理與實現 4.1.2 暴力搜尋最佳化 4.2 歐幾里得距離與餘弦相似度 4.2.1 距離與相似度的數學定義 4.2.2 不同相似度指標的適用場景分析 4.3 向量搜尋的精度與召回率 4.3.1 精度、召回率與F1 評分的計算方法 4.3.2 向量搜尋性能提升方案 4.4 本章小結 4.5 思考題   ►第5 章 分層定位與局部敏感雜湊 5.1 HNSW 的核心原理:圖結構與分層搜尋路徑最佳化 5.1.1 基於圖結構的近鄰搜尋模型 5.1.2 分層搜尋路徑的建構與更新 5.1.3 HNSW 索引時間複雜度分析 5.2 局部敏感雜湊的設計與性能調優 5.2.1 雜湊函式的設計與向量分區原理 5.2.2 LSH 桶化與參數調優 5.2.3 LSH 的記憶體佔用與計算性能分析 5.3 HNSW 與LSH 的具體應用 5.3.1 HNSW 在推薦系統中的應用 5.3.2 LSH 在文字和影像檢索中的應用 5.3.3 HNSW 與LSH 的組合應用:多模態檢索實例 5.4 本章小結 5.5 思考題   ►第6 章 LSH 搜尋最佳化 6.1 BallTree 演算法的工作原理 6.1.1 BallTree 的節點分割與索引建構 6.1.2 BallTree 查詢過程與複雜度分析 6.2 Annoy 搜尋演算法 6.2.1 Annoy 的索引結構設計與分區原理 6.2.2 Annoy 在大規模向量檢索中的性能最佳化 6.3 隨機投影在LSH 中的應用 6.3.1 隨機投影的數學基礎 6.3.2 隨機投影在高維資料降維與檢索中的實際應用 6.3.3 隨機投影在人物誌降維與檢索中的應用 6.4 本章小結 6.5 思考題   ▌第三部分 工具與系統建構 ►第7 章 相似性測量初步 7.1 從曼哈頓距離到切比雪夫距離 7.1.1 曼哈頓距離的幾何意義與公式推導 7.1.2 切比雪夫距離在棋盤模型中的應用 7.1.3 不同距離度量的適用場景分析 7.2 相似性測量的時間複雜度與最佳化 7.2.1 向量間距離計算的時間複雜度分析 7.2.2 減少距離計算的分區最佳化技術 7.2.3 並行化與硬體加速在相似性測量中的應用 7.2.4 廣告分發系統案例:基於相似性測量的高效推薦 7.3 本章小結 7.4 思考題   ►第8 章 測量進階:點積相似度與雅卡爾相似係數 8.1 點積相似度測量 8.1.1 點積相似度測量實現 8.1.2 點積相似度在推薦系統中的應用案例 8.1.3 點積相似度在醫療領域的應用案例:患者治療方案匹配 8.2 雅卡爾相似係數在稀疏向量中的應用 8.2.1 稀疏向量的構造與稀疏性分析 8.2.2 雅卡爾相似係數案例分析 8.2.3 基於雅卡爾相似係數的犯罪嫌犯關係網絡分析 8.3 跨模態醫療資料相似性分析與智慧診斷系統 8.4 本章小結 8.5 思考題   ►第9 章 中繼資料過濾與犯罪行為分析系統 9.1 中繼資料與向量檢索 9.1.1 中繼資料在混合檢索中的作用 9.1.2 中繼資料標籤的定義與標準化 9.1.3 智慧多條件推薦系統 9.2 多條件檢索實現 9.2.1 多維度條件組合檢索 9.2.2 基於中繼資料優先順序的排序演算法 9.2.3 基於中繼資料的酒店智慧化推薦案例分析 9.3 中繼資料索引的建構與最佳化 9.3.1 中繼資料索引建構 9.3.2 動態中繼資料的更新與重建 9.4 即時檢索與中繼資料快取 9.4.1 基於快取的高性能檢索架構 9.4.2 中繼資料快取失效與一致性管理 9.5 基於中繼資料的犯罪行為分析與即時預警系統 9.5.1 模組開發劃分 9.5.2 逐模組開發 9.5.3 犯罪分析與預警系統綜合測試 9.6 本章小結 9.7 思考題   ►第10 章 FAISS 向量資料庫開發基礎 10.1 FAISS 庫的安裝與快速上手 10.1.1 FAISS 初步開發以及CPU、GPU 的版本差異 10.1.2 載入資料與基本查詢範例 10.2 基於FAISS 的索引建構與參數調整 10.2.1 不同索引類型:Flat、IVF 與HNSW 10.2.2 參數調整對搜尋精度與速度的影響 10.3 大規模向量搜尋的分片與分散式實現 10.3.1 資料分片與動態分片 10.3.2 基於分散式框架的FAISS 部署 10.4 FAISS 中的記憶體最佳化與GPU 加速 10.4.1 壓縮索引與量化技術 10.4.2 多GPU 的並行處理 10.5 本章小結 10.6 思考題   ►第11 章 Milvus 向量資料庫開發基礎 11.1 Milvus 的架構設計與功能模組解析 11.1.1 Milvus 的初步使用及叢集架構與元件通訊 11.1.2 資料分區與高可用設計 11.2 使用Milvus 進行向量插入、檢索與過濾 11.2.1 向量資料前置處理與批次插入 11.2.2 複雜查詢準則實現 11.3 Milvus 的索引類型與性能調優 11.3.1 索引類型的選擇與適用場景分析 11.3.2 並行最佳化與索引更新 11.4 Milvus 在企業級應用中的部署與擴充方案 11.4.1 基於容器化的高可用部署 11.4.2 動態擴充與監控整合方案 11.5 本章小結 11.6 思考題   ▌第四部分 實戰與案例分析 ►第12 章 基於FAISS 的自動駕駛泊車資料檢索系統 12.1 項目背景介紹 12.1.1 系統架構 12.1.2 應用流程 12.1.3 案例特色 12.2 模組劃分 12.3 模組化開發 12.3.1 資料前置處理模組 12.3.2 向量生成模組 12.3.3 索引建構與儲存模組 12.3.4 即時檢索模組 12.3.5 動態更新模組 12.3.6 系統監控與最佳化模組 12.4 系統綜合測試 12.5 API 介面開發與雲端部署 12.5.1 API 介面開發 12.5.2 雲端部署完整系統 12.6 本章小結 12.7 思考題   ►第13 章 基於語義搜尋的向量資料庫開發實戰 13.1 語義嵌入生成與最佳化 13.1.1 使用預訓練模型生成語義向量嵌入 13.1.2 動態分詞與文字前置處理 13.1.3 領域微調技術 13.2 建構向量索引與語義檢索框架 13.2.1 選擇合適的向量索引類型 13.2.2 建構Milvus 向量索引 13.2.3 語義向量檢索與關鍵字過濾 13.2.4 結合中繼資料與篩選條件實現多維度語義搜尋 13.3 語義搜尋系統的性能調優 13.3.1 GPU 加速最佳化檢索 13.3.2 批次查詢與非同步IO 技術 13.3.3 實現基於分散式架構的語義搜尋系統 13.4 企業級語義搜尋應用整合與部署 13.4.1 建構語義搜尋RESTful 介面 13.4.2 使用Docker 與Kubernetes 實現語義搜尋系統的容器化 13.4.3 日誌監控與錯誤診斷模組 13.4.4 基於語義搜尋的文件檢索系統集成與部署 13.4.5 大型圖書館圖書檢索的測試案例 13.5 本章小結 13.6 思考題          

原價: 880 售價: 792 現省: 88元
立即查看
Neo4j技術手冊|從規劃到正式部署的圖資料庫實戰 (1版)

Neo4j技術手冊|從規劃到正式部署的圖資料庫實戰 (1版)

類似書籍推薦給您

【簡介】 「這一本最佳指南將帶你打造可正式部署的 Neo4j 系統。深諳 Neo4j 的實踐專家在書中展示 Neo4j 的優勢,以及潛在陷阱的因應之道。這是圖資料庫專業人員的必讀之作。」 ——Jim Webber,Neo4j 首席科學家 想要提升 Cypher 指令的效能,或利用關聯資料模型來支援實際的商業需求嗎?領先全球的原生圖資料庫 Neo4j 會是你的好幫手!Neo4j 已被廣泛用於偵測詐欺、支援推薦系統、建構知識圖譜,並且支援大規模的資料密集型應用程式。 本書將帶你從概念驗證,一路邁入正式部署。經驗老到的作者 Luanne Misquitta 與 Christophe Willemsen 將協助你在實作過程中做出明智決策。 無論你是開發者、架構師,還是資料專業人員,本書都能讓你做出基於事實的選擇,並避免常見陷阱。互聯的資料與 AI 的重要性正日益增加,現在非常適合打造具備洞察力與長期價值的圖系統。看完本書後,你將學會如何: ? 設計既能提升效能,又清楚易懂的資料模型 ? 在概念驗證階段做出明智的技術選擇 ? 在進入正式環境時重新評估系統設定,並進行必要的調整 ? 設定 Neo4j,讓它更可靠、更方便監視與觀察 ? 將圖資料整合進企業架構中 【目錄】 推薦序 前言 第一章 如何在五天內,從圖獲得價值? ElectricHarmony 的困境 為什麼要選擇圖資料庫? 圖應用場景 Neo4j Cypher 歌曲推薦系統:概念驗證 總結 第二章 匯入更多資料(多很多) 資料庫交易 探索其他資料匯入工具 總結 第三章 檢討建模決策 視情況而定 建模原則 屬性 vs. 節點 跨共同點走訪 將概念做成標籤 節點扇出 超級節點 關係的精細度 量化關係 雙向關係 總結 第四章 模型建立與重構模式 超邊:n 方關係 time-based versioning 表示序列 重構模式 總結 第五章 查詢指令分析與調整 執行查詢 比對不相連的模式 提升錨點選擇性 存取屬性 節點度數 不要過於「急切」! 排序 我想脫離(規劃器)的束縛 Cypher runtimes 將查詢參數化 監視與測量查詢時間 總結 第六章 保護你的資料庫 偽裝 竄改 否認 資訊洩漏 阻斷服務攻擊 權限提升 總結 第七章 搜尋 什麼是搜尋? 搜尋資料 TEXT 索引 全文索引 關於索引與查詢的其他考量 總結 第八章 進階圖模式 子查詢 細膩的關係類型 在圖中表達整併後的實體 量化路徑模式:實體解析應用場景 安全建模:標籤 vs. 屬性 總結 第九章 備份與還原 寫入路徑 備份 還原備份 雲端備份 遠端備份與虛擬機器分離 設計備份策略 總結 第十章 叢集與分片 為了實現高妥善率而使用叢集 部署叢集 使用 secondaries 來擴展讀取能力 使用 secondary 伺服器來備份 因果一致性 傳說中的 1+1 叢集 分片與聯邦式查詢 總結 第十一章 觀察機制 發揮日誌的力量 展現指標的威力 全部整合起來:使用 Grafana、Loki 與 Prometheus 的日誌與指標 總結 第十二章 實用圖資料科學 Graph Data Science 程式庫導論 AI 驅動的播放清單社群 社群偵測的現實應用 總結 第十三章 生成式 AI 與圖的未來發展 知識圖譜 GraphRAG 代理式 AI 架構 建立知識圖譜 實際範例:從自然語言生成播放清單推薦 總結 索引

原價: 780 售價: 702 現省: 78元
立即查看
公職考試2026試題大補帖【資料結構(含資料結構與資料庫及資料探勘)】(106~114年試題)(申論題型) (1版)

公職考試2026試題大補帖【資料結構(含資料結構與資料庫及資料探勘)】(106~114年試題)(申論題型) (1版)

類似書籍推薦給您

【簡介】 1. 此書為提供報考就業考試考生使用的歷屆試題書: 此書適用於公職考試(關務、高考、地特),想要成為資訊處理相關領域的公職人員,大多會選擇報考此類國家考試,作為進入國家機關工作的首要門檻。 公職考試試題大補帖系列提供報考這類考試的考生,精選多年度公職考試歷屆試題演練書,考生只需購買一本書,即可抓住各公職考試科目的重點題型。 2. 收錄多年度完整試題(今年度收錄106~114年度試題)。 3. 建議搭配新試界線上測驗平台,登入並註冊會員,即可享有隨時隨地備考的考試利器!線上線下皆可學習 4. 題題附有解析,讓考生一邊刷題,同時精準汲取解題脈絡與思維,助考生增進備考實力。 5. 補班名師解題,不用三顧茅廬立即獲得考題解析。 內容簡介 1. 內文特色: 公職考試的考科組合多元,書籍依不同類科囊括報考重點科目並按照年度排列,分申論題型與測驗題型出版成書,本書收錄考試包含: 關務人員考試、高等考試三級、技師考試、地方政府公務人員考試 本書收錄科目包含:資料結構、資料結構與資料庫及資料探勘 不需費力上網爬文找歷屆試題,只要一本試題大補帖在手,便能立即實戰演練,並有效了解該考試考科重點,為考前模擬與衝刺複習。 2. 適用族群: 公職工作內容會依據類科不同有不同專業性,有資訊考科相關背景的考生,或是對於資訊處理領域相關的工作有興趣的就業族群,可透過演練歷屆試題,快速瞭解出題方向。 3. 題題有解析,最有效的複習:在實戰演練的同時,在瞭解解題脈絡與方法的基礎上,活用該科常考重點,達到考前最有效率的複習狀態。 【目錄】 三等 【資料結構】 ◎關務三等 114年 113年 112年 111年 110年 109年 108年 106年 ◎高考三級 114年 113年 112年 111年 110年 109年 108年 107年 106年 ◎技師考試 111年(資料結構與資料庫及資料探勘) 110年(資料結構與資料庫及資料探勘) 109年(資料結構與資料庫及資料探勘) 108年(資料結構與資料庫及資料探勘) 107年(資料結構與資料庫及資料探勘) 106年(資料結構與資料庫及資料探勘) ◎地方三等 113年 112年 111年 110年 109年 108年 107年 106年

原價: 380 售價: 323 現省: 57元
立即查看
公職考試2026試題大補帖【資料庫應用】(106~114年試題)(申論題型) (1版)

公職考試2026試題大補帖【資料庫應用】(106~114年試題)(申論題型) (1版)

類似書籍推薦給您

原價: 360 售價: 306 現省: 54元
立即查看
書籍資訊 詳細資訊 & 心得 為您推薦

書籍分類

  • 資訊 資訊
  • 工程 工程
  • 數學與統計學 數學與統計學
  • 機率與統計 機率與統計
  • 自然科學 自然科學
  • 健康科學 健康科學
  • 地球與環境 地球與環境
  • 建築、設計與藝術 建築、設計與藝術
  • 人文與社會科學 人文與社會科學
  • 教育 教育
  • 語言學習與考試 語言學習與考試
  • 法律 法律
  • 會計與財務 會計與財務
  • 大眾傳播 大眾傳播
  • 觀光與休閒餐旅 觀光與休閒餐旅
  • 考試用書 考試用書
  • 研究方法 研究方法
  • 商業與管理 商業與管理
  • 經濟學 經濟學
  • 心理學 心理學
  • 生活 生活
  • 生活風格商品 生活風格商品
  • 參考書/測驗卷/輔材 參考書/測驗卷/輔材
您的購物車
貼心提醒:中文書超過5本,原文書超過3本超商容易超重,建議選擇宅配或分開下單