定價: 350
售價: 315
庫存: 庫存: 2
LINE US! 詢問這本書 團購優惠、書籍資訊 等

付款方式: 超商取貨付款
信用卡
線上轉帳
物流方式: 超商取貨
宅配
門市自取

詳細資訊

內容簡介   動輒十萬字、甚至數十萬字的小說,其中人物錯綜複雜的關係、心境轉折與環境的變遷;廣大的網路訊息與文件,其中有多少潛藏的訊息等待我們發掘。文本探勘,就是要在大量文字中萃取出我們所需要的資訊。   本書之撰寫,是針對完全不具備R語言能力之初學者為主要對象,以手把手的方式進行教學,讀者只要跟隨書本的章節和範例,一步一步地練習,相信必能在最短的時間內學會文本探勘的基本技術,並應用在自身所屬的領域上。包括語料庫的建立與相關套件的使用;利用文本探勘對中、英文小說進行各種分析;以及利用文本探勘進行網路爬蟲。全書由淺入深、按部就班地指導讀者學會文本探勘技術,進而能從各類非結構化的文字當中擷取有用的資訊,以做為後續進行下決定(decision-making)或形成政策(policy-making)之用。 本書特色   1. 利用R語言的文本探勘能力做中、英文小說的情感分析。   2. 利用R語言進行網路爬蟲,在非結構化的文字中擷取資訊。   3. 學習上列的技術後,能從各類非結構化的文字中擷取有用的資訊,以利未來決定與決策之用。 目錄 Chapter 1 - R語言的下載與安裝 1.1 R語言 1.2 RStudio 1.3 R語言的套件 Chapter 2 - 學習文字探勘前的R基礎 2.1 變數 2.2 資料型態與資料結構 2.3 缺失值 2.4 管線運算子 2.5 正規表達式(Regular expression) 2.6 基本字符串函數 2.7 stringr套件 2.8 資料的讀取與匯出 2.9 建立R函數 2.10 條件執行 2.11 迴圈 2.12 apply相關函數 Chapter 3 - 文本探勘 3.1 文字探勘的基本概念 3.2 套件介紹 3.3 英文語料庫 3.4 中文語料庫 Chapter 4 - 中、英文小說 4.1 套件介紹 4.2 認識Gutenberg Project 4.3 tidy文本格式 4.4 情感詞庫 4.5 英文小說分析 - Little Women 4.6 英文小說 - n元語法 4.7 中文小說分析 - 三國演義 Chapter 5 - 網路爬蟲與文字探勘 5.1 網路爬蟲介紹 5.2 靜態擷取網頁 5.3 動態擷取網頁