搜尋建議
書名: Hey Siri及Ok Google原理:AI語音辨識專案真應用開發(二版) (2版)
作者: 楊學銳,晏超,劉雪松
版次: 2
ISBN: 9786267569795
出版社: 深智數位
出版日期: 2025/05
頁數: 464
#資訊
#AI人工智慧與機器學習
定價: 880
折扣: 9
售價: 792
庫存: 已售完
此書籍已售完,調書籍需2-5工作日。建議與有庫存書籍分開下單
查看店內位置
LINE US! 詢問這本書 團購優惠、書籍資訊 等

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

【簡介】 \\好評再版//   ★語音前端處理,語音辨識   ★語者自動分段標記演算法原理   ★基於WebRTC,Kaldi和gRPC,從零建構穩定、高性能、可商用的語音服務   ★前端演算法完整介紹   ★語音活動檢測、語音降噪、回聲消除、波束形成   ★WebRTC和Kaldi最佳化處理流程   ★形成語音演算法SDK   ★微服務建構的RPC遠端呼叫框架和SDK   本書從語音辨識的概要談起,並且介紹了目前市場概況及常用的工具包括WebRTC及技術人最愛的Kaldi。接下來說明了語音訊號的聲學基和數位化、時頻變換的原理。語音技術中最重要的演算法也有說明,包括了各種VAD、單通道降噪、回聲消除等濾波器、波束形成的介紹。重點部分包括了語音辨識中最重要的特徵提取和聲學模型,如傳統及神經網路基礎的實作法。   在了解原理之後,即開始建立真正專案,包括使用Kaldi實作一個國語的模型。最近流行的語者自動分段標記在本書中也有實作,大量應用了深度學習的模型及音訊庫、函數庫等。如使用了CNCeleb的聲紋資料當作訓練集。在Kaldi的進階應用方面,也實作了其SDK的音訊特徵提取及WebRTC的語音活動檢測。   本書的收尾之作就是使用了gRPC進行一個完整的語音識別服務實作,使用了現在最好用的ProtoBuf的協定進行運作,完成了伺服器/客戶端應用開發,可以說是目前市面上最完整的語音辨識中文圖書。  【目錄】 Chapter 01 語音辨識概述 ▌1.1 語音辨識發展歷程 ▌1.2 語音辨識產業與應用 1.2.1 消費級市場 1.2.2 企業級市場 ▌1.3 常用語音處理工具 1.3.1 WebRTC 1.3.2 Kaldi 1.3.3 點對點語音辨識工具套件 Chapter 02 語音訊號基礎 ▌2.1 語音訊號的聲學基礎 2.1.1 語音產生機制 2.1.2 語音訊號的產生模型 2.1.3 語音訊號的感知 ▌2.2 語音訊號的數位化和時頻變換 2.2.1 語音訊號的採樣、量化和編碼 2.2.2 語音訊號的時頻變換 ▌2.3 本章小結 Chapter 03 語音前端演算法 ▌3.1 語音前端演算法概述 ▌3.2 VAD 3.2.1 基於門限判決的VAD 3.2.2 基於高斯混合模型的VAD 3.2.3 基於神經網路的VAD ▌3.3 單通道降噪 3.3.1 譜減法 3.3.2 維納濾波法 3.3.3 音樂雜訊和參數譜減法 3.3.4 貝氏準則下的MMSE 3.3.5 雜訊估計 3.3.6 基於神經網路的單通道降噪 ▌3.4 回音消除 3.4.1 回音消除概述 3.4.2 線性自我調整濾波 3.4.3 分區塊頻域自我調整濾波器 3.4.4 雙邊對話檢測 3.4.5 延遲估計 3.4.6 殘留回音消除 3.4.7 基於神經網路的回音消除 ▌3.5 麥克風陣列與波束形成 3.5.1 麥克風陣列概述 3.5.2 延遲求和波束形成 3.5.3 最小方差無失真回應波束形成 3.5.4 廣義旁波瓣對消波束形成 3.5.5 後置濾波 3.5.6 基於神經網路的波束形成 ▌3.6 聲源定位 3.6.1 GCC-PHAT 3.6.2 基於自我調整濾波的聲源定位 3.6.3 SRP-PHAT 3.6.4 子空間聲源定位演算法 3.6.5 基於神經網路的聲源定位 ▌3.7 其他未盡話題 ▌3.8 本章小結 Chapter 04 語音辨識原理 ▌4.1 特徵提取 4.1.1 特徵前置處理 4.1.2 常見的語音特徵 ▌4.2 傳統聲學模型 4.2.1 聲學建模單元 4.2.2 GMM-HMM 4.2.3 強制對齊 ▌4.3 DNN-HMM 4.3.1 語音辨識中的神經網路基礎 4.3.2 常見的神經網路結構 ▌4.4 語言模型 4.4.1 n-gram 語言模型 4.4.2 語言模型的評價指標 4.4.3 神經語言模型 ▌4.5 WFST 解碼器 4.5.1 WFST 原理 4.5.2 常見的WFST 運算 4.5.3 語音辨識中的WFST 解碼器 4.5.4 權杖傳遞演算法 4.5.5 Beam Search ▌4.6 序列區分性訓練 4.6.1 MMI 和bMMI 4.6.2 MPE 和sMBR 4.6.3 詞圖 4.6.4 LF-MMI ▌4.7 點對點語音辨識 4.7.1 CTC 4.7.2 Seq2Seq ▌4.8 語音辨識模型評估 ▌4.9 本章小結 Chapter 05 中文漢語模型訓練-- 以multi_cn 為例 ▌5.1 Kaldi 安裝與環境設定 ▌5.2 Kaldi 中的資料格式與資料準備 ▌5.3 語言模型訓練 ▌5.4 發音詞典準備 ▌5.5 特徵提取 ▌5.6 Kaldi 中的Transition 模型 ▌5.7 預對齊模型訓練 5.7.1 單音素模型訓練 5.7.2 delta 特徵模型訓練 5.7.3 lda_mllt 特徵變換模型訓練 5.7.4 語者自我調整訓練 ▌5.8 資料增強 5.8.1 資料清洗及重分割 5.8.2 速度增強和音量增強 5.8.3 SpecAugment ▌5.9 I-Vector 訓練 5.9.1 對角UBM 5.9.2 I-Vector 提取器 5.9.3 提取訓練資料的I-Vector ▌5.10 神經網路訓練 5.10.1 Chain 模型 5.10.2 Chain 模型態資料準備 5.10.3 神經網路設定與訓練 ▌5.11 解碼圖生成 ▌5.12 本章小結 ▌5.13 附錄 5.13.1 xconfig 中的描述符及網路設定表 5.13.2 Chain 模型中的egs 5.13.3 Kaldi nnet3 中迭代次數和學習率調整 Chapter 06 基於Kaldi 的語者自動分段標記 ▌6.1 語者自動分段標記概述 6.1.1 什麼是語者自動分段標記 6.1.2 語者自動分段標記技術 6.1.3 語者自動分段標記評價指標 ▌6.2 聲紋模型訓練-- 以CNCeleb 為例 6.2.1 聲紋資料準備 6.2.2 I-Vector 訓練 6.2.3 X-Vector 訓練 6.2.4 LDA/PLDA 後端模型訓練 6.2.5 語者自動分段標記後端模型訓練 ▌6.3 本章小結 Chapter 07 基於Kaldi 的語音SDK 實現 ▌7.1 語音特徵提取 7.1.1 音訊讀取 7.1.2 音訊特徵提取 ▌7.2 基於WebRTC 的語音活動檢測 ▌7.3 語者自動分段標記模組 7.3.1 I-Vector 提取 7.3.2 X-Vector 提取 7.3.3 語者自動分段標記演算法實現 ▌7.4 語音辨識解碼 ▌7.5 本章小結 Chapter 08 基於gRPC 的語音辨識服務 ▌8.1 gRPC 語音服務 ▌8.2 ProtoBuf 協定定義 ▌8.3 基於gRPC 的語音服務實現 8.3.1 gRPC Server 實現 8.3.2 gRPC Client 實現 8.3.3 gRPC 語音服務的編譯與測試 ▌8.4 本章小結 Appendix A 參考文獻  

大家的想法

還沒有人留下心得,快來搶頭香!

撰寫您的閱讀心得

為您推薦

人工智慧:智慧型系統導論 (3版)

人工智慧:智慧型系統導論 (3版)

相關熱銷的書籍推薦給您

書名:人工智慧:智慧型系統導論(第三版) 作者:李聯旺 出版社:全華 ISBN:9789862800959

原價: 590 售價: 531 現省: 59元
立即查看
機器學習:類神經網路、模糊系統以及基因演算法則 (4版)

機器學習:類神經網路、模糊系統以及基因演算法則 (4版)

相關熱銷的書籍推薦給您

書名:機器學習:類神經網路、模糊系統以及基因演算法則(第四版) 作者:蘇木春、張孝德 出版社:全華 出版日期:2016/05/00 ISBN:9789864632060 內容簡介 ■ 本書優點特色 1.將三種與機械學習相關的技術-類神經網路、模糊系統及基因演繹法作一通盤介紹。 2.以深入淺出的方式建立類神經網路與生物神經網路的關聯性,以便讓讀者更能發揮想像力。 3.每一種理論都儘可能配合書中範例及圖表加以說明。 ■ 內容簡介 本書將三種與機械學習相關的技術-類神經網路、模糊系統及基因演繹法作一通盤介紹。此外,作者以深入淺出的方式建立類神經網路與生物神經網路的關聯性,以便讓讀者更能發揮想像力。 目錄 第1章 類神經網路之簡介 第2章 感知機 第3章 多層感知機 第4章 非監督式類神經網路 第5章 聯想記憶 第6章 增強式學習 第7章 模糊集合 第8章 模糊關係及推論 第9章 模糊系統 第10章 基因演算法則

原價: 390 售價: 351 現省: 39元
立即查看
Hey Siri及Ok Google原理:AI語音辨識專案真應用開發 (1版)

Hey Siri及Ok Google原理:AI語音辨識專案真應用開發 (1版)

類似書籍推薦給您

原價: 880 售價: 792 現省: 88元
立即查看
電子書 Boron-Based Compounds: Potential and Emerging Applications in Medicine Hey-Hawkins 9781119275558  2018 <JW>

電子書 Boron-Based Compounds: Potential and Emerging Applications in Medicine Hey-Hawkins 9781119275558 2018 <JW>

類似書籍推薦給您

原價: 4070 售價: 4070 現省: 0元
立即查看
電子書 Smart Inorganic Polymers: Synthesis, Properties, and Emerging Applications in Materials and Life Sciences Hey-Hawkins 978352

電子書 Smart Inorganic Polymers: Synthesis, Properties, and Emerging Applications in Materials and Life Sciences Hey-Hawkins 978352

類似書籍推薦給您

原價: 3841 售價: 3841 現省: 0元
立即查看
Hey There 4 (3 CDs)

Hey There 4 (3 CDs)

類似書籍推薦給您

原價: 690 售價: 656 現省: 34元
立即查看
Hey There 4

Hey There 4

類似書籍推薦給您

原價: 530 售價: 504 現省: 26元
立即查看
書籍資訊 詳細資訊 & 心得 為您推薦

書籍分類

  • 資訊 資訊
  • 工程 工程
  • 數學與統計學 數學與統計學
  • 機率與統計 機率與統計
  • 自然科學 自然科學
  • 健康科學 健康科學
  • 地球與環境 地球與環境
  • 建築、設計與藝術 建築、設計與藝術
  • 人文與社會科學 人文與社會科學
  • 教育 教育
  • 語言學習與考試 語言學習與考試
  • 法律 法律
  • 會計與財務 會計與財務
  • 大眾傳播 大眾傳播
  • 觀光與休閒餐旅 觀光與休閒餐旅
  • 考試用書 考試用書
  • 研究方法 研究方法
  • 商業與管理 商業與管理
  • 經濟學 經濟學
  • 心理學 心理學
  • 生活 生活
  • 生活風格商品 生活風格商品
  • 參考書/測驗卷/輔材 參考書/測驗卷/輔材
您的購物車
貼心提醒:中文書超過5本,原文書超過3本超商容易超重,建議選擇宅配或分開下單