書名: 大數據分析實務: RapidMiner之應用 (1版)
作者: 邢厂民著
版次: 1
ISBN: 9786263245921
出版社: 碁峰
出版日期: 2023/08
書籍開數、尺寸: 19x26x1.69
頁數: 336
內文印刷顏色: 雙色
#資訊
#資料庫與資料管理
定價: 500
售價: 425
庫存: 已售完
LINE US! 詢問這本書 團購優惠、書籍資訊 等
此書籍已售完,調書籍需2-5工作日。建議與有庫存書籍分開下單

付款方式: 超商取貨付款 line pay
信用卡 全支付
線上轉帳 Apple pay
物流方式: 超商取貨
宅配
門市自取

詳細資訊

內容特色: 本書使用免費下載的「RapidMiner」軟體,該軟體使用圖形化界面,不需編寫程式、操作簡易、功能強大且應用廣泛,適合初學與進階資料分析人士使用。 本書從基礎的資料取得、事前處理到模型的建置、評分、驗證與實例分析等,以實作方式,循序漸進的介紹大數據分析的操作步驟與流程。 全書提供30個案例,內容包含金融、製造、銷售、管理、醫療、休閒、氣象與情感分析文字探勘等諸多領域的應用實例,除了對現有結構與非結構式資料進行分析外,同時利用訓練模型預測未來,提升數據分析的實用價值。 本書除提供數據資料檔Data File外,亦附有各章節之程式/流程檔供讀者參考。 章節目錄: Chapter 00 RapidMiner 軟體下載、介面說明與注意事項 Chapter 01 基礎篇 本章介紹使用RapidMiner平台的基礎知識,涵蓋內容從如何取得與過濾資料到改變資料的類型與角色以及對各類型檔案的讀取與儲存等。本章同時涵蓋如何建置一個基本模型,以及認識變數的結合、分類、新增與選擇等功能。 Chapter 02 資料處理 本章介紹資料的前置處理,內容包含遺漏值的處理、資料的常態化與刪除離群值以及變數的樞紐轉換與重新命名等;同時涵蓋使用巨集、迴圈與分支等運算式進行抽樣以及多個資料檔案的讀入、儲存、合併、運算與結合等。在時間序列資料的前置處裡部分,會介紹如何將日資料轉換為月平均以及季平均資料的方式。 Chapter 03 模型之建置、評分與驗證 本章介紹分類模型之建置、預測、績效評估以及驗證方式,內容包含分割資料與交叉驗證的差異。使用之演算法包含決策樹、簡單貝式法、規則歸納法以及羅吉斯回歸等。在比較不同演算法績效表現方面,除了常用之準確率、精確率與召回率等指標外,更介紹以視覺化模型(ROC曲線)進行分析。 Chapter 04 多元實例練習 本章涵蓋實例練習的第一部分,主題包含國人赴國外旅遊人數分析、台灣50的股票價格分群、參數最佳化及對交易對手信用違約預測、調整不平衡資料及對客戶流失預測、建置增益圖找出最可能流失的客戶群集中行銷、依據基地台號碼與座標位置找出距離最近的基地台、使用回歸模型預測二手車售價以及依據羅吉斯回歸模型最佳變數預測新生嬰兒體重是否過輕。 Chapter 05 進階實例練習 本章涵蓋實作練習的第二部分,主題包含根據民眾就醫資料偵測醫療詐欺行為、使用關聯性法則判斷那些商品經常同時購買、針對連續未達測試績效的預測模型郵寄警訊至相關人員、依據機器各部位感應器記錄找出發生故障的主要來源、使用K-NN模型預測機器是否將發生故障以預先安排維修工作、檢視S&P 500的移動平均以及線性與非線性趨勢、使用視窗與滑動視窗驗證根據公司財報資料預測股價、處裡視窗資料、使用交叉驗證與時間序列滑動視窗驗證以及單變量ARIMA模型進行溫度預測、使用單變量Holt-Winters模型預測貿易出口值以及計算並根據顧客之RFM值進行顧客分群與執行問卷回覆分析。 Chapter 06 中英文文字探勘 本章介紹如何執行中英文文字探勘並據以分析,英文文字探勘的主題包含利用書籍名稱預測圖書主題、尋找程式設計師徵才廣告所列之主要條件、分析顧客對藍芽耳機的文字評價以及檢視正負評價中的主要詞彙。中文探勘結合了Python的Jieba套件進行中文斷字,涵蓋主題包含尋找2012年以及2020年總統就職演說使用的主要詞彙、消費者情緒分析以及對網路新聞的文字探勘。

為您推薦

Power BI金融大數據分析應用--貼近產業實務,掌握決策效率 (1版)

Power BI金融大數據分析應用--貼近產業實務,掌握決策效率 (1版)

類似書籍推薦給您

Power BI金融大數據分析應用:貼近產業實務,掌握決策效率 ISBN13:9789865026905 出版社:碁峰資訊 作者:謝邦昌;蘇志雄;蕭育仁;宋龍華 裝訂/頁數:平裝/296頁 規格:26cm*19cm*1.5cm (高/寬/厚) 版次:1 出版日:2021/01/27 中國圖書分類:電腦系統資料相關處理 內容簡介   王道銀行策略長 蕭至佑 誠摯推薦!   ‧使用Power BI最新版!運用金融業數據,完整介紹Power BI模組,實作資料視覺化   ‧主題式分析 + 實戰演練逐步操作,強化學習效率,全面提升強化大數據分析能力   *完整闡述金融大數據分析應用模式!以金融領域資料為主,說明Power BI的實際運用,範疇涵蓋Power Query、Power Pivot、Power View三大模組,以及Power BI雲端服務。     *資料視覺化Power View:數據分析問題的圖表歸納、操作Power View技巧和設計視覺化互動分析儀表板。   *數據工程Power Query:線上資料蒐集、資料清理招式、資料合併,建立半自動化數據工程作業流程。   *資料建模Power Pivot:使用DAX函數新增資料行及管理量值、建置資料關聯模型。   *Power BI雲端服務:部署Power BI儀表板至雲端環境及設定公開分享給他人瀏覽。   *主題式實戰分析演練,包含:客群分析、產品銷售分析、信用卡主題消費分析。 目錄 CH1 金融大數據概論 1-1 大數據與精準行銷 1-2 金融大數據實務應用8 1-3 智慧金融 CH2 淺談資料視覺化分析觀念 2-1 資料視覺化分析 2-2 視覺化分析程序 2-3 用戶型商業智慧 CH3 認識Power BI 3-1 大數據分析的重要性 3-2 Power BI對使用者的價值 3-3 Power BI工作流程 3-4 為何選擇Power BI 3-5 安裝Power BI與註冊帳號 3-6 Power BI 三大模組與服務 CH4 資料視覺化(Data Visualization)- Power View *本章彩色印刷* 4-1 儀表板(Dashboard)工作區介紹 4-2 操作報表物件的技巧 4-3 數據問題的圖表歸納 4-4 視覺效果模板 4-5 欄位選取、格式潤飾與分析 4-6 圖表資料三大篩選 4-7 建立資料階層下鑽 CH5 數據工程(Data Engineer)- Power Query 5-1 何謂Power Query編輯器 5-2 Power Query編輯器工作區 5-3 可以取得哪些資料來源 實戰演練1:以處理金融刷卡消費資料為例 實戰演練2:更多資料處理案例解說 5-4 Power Query自動化作業及常見問題排除 CH6 資料建模(Data Modeling)- Power Pivot 6-1 何謂資料建模Power Pivot 實戰演練1:設定關聯模型 6-2 數據分析語言 - DAX 實戰演練2:關聯函數 實戰演練3:日曆維度動態表 實戰演練4:列計算函數 實戰演練5:安全除法 6-3 DAX量值管理 實戰演練6:創建初階彙總量值 實戰演練7:進階彙總量值 實戰演練8:條件判斷 實戰演練9:排名函數應用 實戰演練10:聚合迭代函數 6-4 常見的時間智慧函數 6-5 介面式快速量值 實戰演練11:常用快速量值 CH7 Power BI管理服務 7-1 從Power BI Desktop發行儀表板 7-2 Power BI雲端工作區介紹 7-3 一般用戶公開分享儀表板(發行至Web)設定 實戰演練1:一般用戶分享儀表板(發行至Web)限制排除 7-4 商業智慧系統儀表板權限管理情境設計 CH8 金融大數據實戰應用儀表板 *本章彩色印刷* 8-1 客群分析類 8-2 信用卡主題消費分析 Appendix A 參考文獻

原價: 620 售價: 527 現省: 93元
立即查看
大數據分析之資料庫理論與實務(SQL SERVER 2017版) (1版)

大數據分析之資料庫理論與實務(SQL SERVER 2017版) (1版)

類似書籍推薦給您

書名:大數據分析之資料庫理論與實務(SQL Server 2017版) 作者:曾守正, 周韻寰 出版社:華泰 出版日期:2018/03/00 ISBN:9789574353583 內容簡介   一、訓練初學者在資料處理、資料庫設計,與應用方面的造詣。   二、了解關聯式資料庫系統與NoSQL的概念,做為邁向大數據分析之基礎。   三、讓同學們從技術與管理層面去了解資料庫管理師(DBA)的角色。   四、讓同學們具有獨立完成分析、規劃中、大型軟體專案的基本能力。   五、藉由SQL Server實務與理論的驗證,培養大數據分析的就業基礎能力。   六、幫助同學們準備高、普考,以及研究所入學考。 目錄 第零章 資料庫進化史與技術總覽 基礎篇 第1章 資料庫系統 第2章 資料模式 第3章 關聯式資料庫管理系統 第4章 關聯式資料模式的資料結構 第5章 關聯式資料模式的整合限制條件 第6章 關聯式資料模式的資料運算 第7章 結構化查詢語言SQL 第8章 視界 第9章 邏輯資料庫設計:關聯表的正規化 進階篇 第10章 Transact-SQL 在XML與JSON方面的支援 第11章 異動管理 第12章 分散式資料庫系統 第13章 異質性分散式資料庫系統 第14章 商業智慧與資料倉儲

原價: 700 售價: 665 現省: 35元
立即查看
商務大數據分析:案例分析與AI應用趨勢 (1版)

商務大數據分析:案例分析與AI應用趨勢 (1版)

類似書籍推薦給您

本書特色 1.深入大數據世界:從核心概念到廣泛應用,揭示大數據的精髓,並深度探討大數據在商業中的應用,包括創新商業模式。 2.擴展豐富實例:透過案例分析與範例實作,理解大數據帶來的行業價值,如:YouBike空位查詢、房價預測、股市漲跌預測、星際大戰人物網路關係描繪、圖像生成以及製造、零售、醫療等行業案例。 3.學習多元數據分析技術:掌握多種大數據分析技術,如決策樹、時間序列、爬蟲、協同過濾、貝氏定理、隱馬可夫模型、社會網路等。 4.展開AI的探索之旅:探索人工智慧,包括機器學習、深度學習、自然語言、圖像辨識、生成式 AI 概念及 OpenAI 生成。 5.練習實際程式範例:透過 Google Colab 的 Python 進行實作,體驗大數據和AI的魅力,並加贈R語言範例程式碼。 內容簡介 本書共十五章,涵蓋了商務大數據分析的基礎知識、分析工具、案例探討和人工智慧應用的趨勢。 前四章聚焦於大數據理論基礎,從大數據的發展沿革、價值、商業模式創新到管理方面進行探討。隨後深入介紹大數據分析的主題,包括概念、流程和數據準備的方法。此外,書中詳述了大數據分析工具,並提供了實際範例以幫助讀者更深入地了解和應用這些技術。 最後,介紹人工智慧的基礎概念,包括機器學習、深度學習、自然語言處理、圖像辨識、生成式 AI 概念及 ChatGPT實作,了解大數據與 AI 密不可分的關連性。 目錄 Ch01 大數據發展沿革 1-1 企業資料管理演進 1-2 大數據源起 1-3 大數據定義 1-4 大數據特性 1-5 小結 Ch02 大數據行業價值 2-1 大數據價值 2-2 大數據行業應用機會 2-3 大數據企業應用案例 2-4 小結 Ch03 大數據商業模式創新 3-1 數據化與創新 3-2 大數據開放資料 3-3 大數據生態系與商業模式創新 3-4 小結 Ch04 企業大數據管理 4-1 企業數位資料管理演進 4-2 大數據資料處理發展 4-3 大數據資料分析發展 4-4 大數據管理架構 4-5 大數據規劃與實施類型 4-6 大數據企業實施案例 4-7 企業採用趨勢與挑戰 4-8 小結 Ch05 大數據分析:概念與程序 5-1 數據分析是智慧決策基礎 5-2 從商業分析到預測分析 5-3 預測分析程序 5-4 預測分析工具 5-5 Python 工具安裝 5-6 小結 Ch06 大數據分析:數據的理解 6-1 問題解決方向 6-2 數據組織實作 6-3 數據擷取實作- 網頁爬蟲抓取 6-4 小結 Ch07 大數據分析:數據的準備 7-1 問題解決方向 7-2 數據探索與視覺化 7-3 探索性資料分析 7-4 小結 Ch08 大數據分析:聚類與分類 8-1 問題解決方向 8-2 聚類分析實作 8-3 分類分析實作 8-4 小結 Ch09 大數據分析:迴歸與趨勢 9-1 問題解決方向 9-2 迴歸分析實作 9-3 時間趨勢實作 9-4 小結 Ch10 大數據分析:相似與推薦 10-1 問題解決方向 10-2 異常與相似性判定實作 10-3 相似性推薦實作 10-4 小結 Ch11 大數據分析:關聯與關係 11-1 問題解決方向 11-2 關聯分析與實作 11-3 貝氏網路分析與實作 11-4 小結 Ch12 大數據分析:連結與網路 12-1 問題解決方向 12-2 隱馬可夫模型與實作 12-3 社會網路分析與實作 12-4 小結 Ch13 數據驅動的人工智慧發展 13-1 人工智慧沿革 13-2 人工智慧方法演進 13-3 機器學習方法 13-4 深度學習方法 13-5 生成式AI 發展 13-6 ChatGPT 實作 13-7 小結 Ch14 AI探索:文本挖掘分析 14-1 自然語言發展沿革 14-2 問題解決方向 14-3 文本挖掘分析- 文字雲 14-4 文本挖掘分析-TFIDF 文本相似查詢 14-5 小結 Ch15 AI探索:圖像辨識分析 15-1 電腦視覺發展沿革 15-2 問題解決方向 15-3 圖像辨識分析-CNN 深度學習 15-4 小結

原價: 420 售價: 370 現省: 50元
立即查看
一行指令學PYTHON-用PANDAS掌握商務大數據分析(第二版)(附範例光碟) 2/E 2022 <全華>2/e (2版)

一行指令學PYTHON-用PANDAS掌握商務大數據分析(第二版)(附範例光碟) 2/E 2022 <全華>2/e (2版)

類似書籍推薦給您

一行指令學Python-用Pandas掌握商務大數據分析 ISBN13:9786263280922 出版社:全華圖書 作者:徐聖訓 裝訂/頁數:平裝/480頁 規格:26cm*19cm*1.8cm (高/寬/厚) 重量:845克 版次:2 出版日:2022/03/11 中國圖書分類:電腦程式語言 內容簡介   在Python裡,最重要的套件應該是pandas。非資訊專長的初學者要學Python,一定要學pandas,因為它容易入手,而且功能強大。pandas具有強大的資料分析、繪圖能力,甚至能做網路爬蟲。將pandas分析結果回存到Excel也是輕而易舉!本書就是著重在pandas的介紹。   本書旨在引導讀者用Python來解決問題。研究發現,問題導向學習有助提升學習熱情和學習成效。藉由在實際問題中引發學習動機和熱情,並且親自操作,來尋找問題答案並解決問題!Boud(1987)就主張,學習的起點應該始於學習者想要解決的問題、疑問或困擾。因此,筆者設計的這些問題只是起點,更希望讀者能將這些知識與生活或工作遭遇的問題做連結,進一步提出屬於自己的問題,並累積解決問題的技巧。   本次改版,作者新加入了「pandas禪」的概念,協助讀者發展兼具結構與易讀性的程式寫作風格,讓寫程式如文章寫作般行雲流水,進入「禪」的意境。 本書特色   ●我們強調的不只Python,也是pandas。   ●我們強調用pandas來解決在資料分析中實際遇到的問題。   ●作者拆解大數據分析中的每一個步驟,配合Python直譯器的特性,讓學習者馬上動手實作,即時理解學習重點。   ●如果一個範例的解法不只一種,作者會提供不同的方法,引導學習者嘗試不同的解題方法。

原價: 550 售價: 484 現省: 66元
立即查看
大數據分析與應用實戰:統計機器學習之資料導向程式設計

大數據分析與應用實戰:統計機器學習之資料導向程式設計

類似書籍推薦給您

書名:大數據分析與應用實戰:統計機器學習之資料導向程式設計 作者:鄒慶士 出版社:東華 出版日期:2019/04/01 ISBN:9789574363407 內容簡介 本書特色   •文字說明、程式碼與執行結果等交叉呈現,有助於閱讀理解。   •來自不同領域的資料處理與分析範例。   •同時掌握資料分析兩大主流工具 - R 與 Python。   •凸顯第四代與第三代程式語言不同之處。   •深入淺出地介紹統計機器學習理論與實務。   •符合 iPAS 經濟部產業人才能力鑑定巨量資料分析師各科評鑑主題。 目錄 第一章資料導向程式設計 1.1 套件管理 1.1.1 基本套件 1.1.2 建議套件 1.1.3 貢獻套件 1.2 環境與輔助說明 1.3 R 語言資料物件 1.3.1 向量 1.3.2 矩陣 1.3.3 陣列 1.3.4 串列 1.3.5 資料框 1.3.6 因子 1.3.7 R 語言原生資料物件取值 1.3.8 R 語言衍生資料物件 1.4 Python 語言資料物件 1.4.1 Python 語言原生資料物件操弄 1.4.2 Python 語言衍生資料物件取值 1.4.3 Python 語言類別變數綸碼 1.5 向量化與隱式迴圈 1.6 編程範式與物件導向概念 1.6.1 R 語言 S3 類別 1.6.2 Python 語言物件導向 1.7 控制敘述與自訂函數 1.7.1 控制敘述 1.7.2 自訂函數 1.8 資料匯入與匯出 1.8.1 R 語言資料匯入及匯出 1.8.2 Python 語言資料匯入及匯出 1.9 程式除錯與效率監測 第二章資料前處理 2.1 資料管理 2.1.1 R 語言資料組識與排序 2.1.2 Python 語言資料排序 2.1.3 R 語言資料變形 2.1.4 Python語言資料變形 2.1.5 R 語言資料清理 2.1.6 Python 語言資料清理 2.2 資料摘要與彙總 2.2.1 摘要統計量 2.2.2 R 語言群組與摘要 2.2.3 Python 語言群組與摘要 2.3 屬性工程 2.3.1 屬性轉換與移除 2.3.2 屬性萃取之主成份分析 2.3.2.1奇異值矩陣分解 2.3.3 屬性挑選 2.3.4 小結 2.4 巨量資料處理概念 2.4.1 文字資料處理 2.4.2 Hadoop 分散式檔案系統 2.4.3 Spark 叢集訓計算框架 第三章統計機器學習基礎 3.1 隨機誤差模型 3.1.1 統計機器學習類型 3.1.2 過度配適 3.2 模型績效評量 3.2.1 迴歸模型績效指標 3.2.2 分類模型績效指標 3.2.2.1 模型預測值 3.2.2.2 混淆矩陣 3•2.2.3 整體指標 3.2.2.4 類別相關指標 3.2.3 模型績效視覺化 3.3 模型選擇與評定 3.3.1 重抽樣與資料切分方法 3.3.2 單類模型參數調校 3.3.2.1 多個參數待調 3.3.2.2 客製化參數調校 3.3.3 比較不同類的模型 3.4 相似性與距離 3.5 相關與獨立 3.5.1 數值變數與順序尺度類別變數 3.5.2 名目尺度類別變數 3.5.3 類別變數視覺化關聯檢驗 第四章非監督式學習 4.1 資料視覺化 4.1.1 圖形文法繪圖 4.2 關聯型態探勘 4.2.1 關聯型態評估準則 4.2.2 線上音樂城關聯規則分析 4.2.3 結語 4.3 集群分析 4.3.1 k 平均數集群 4.3.1.1 青少年市場區隔案例 4.3.2 階層式集群 4.3.3 密度集群 4.3.3.1 密度集群案例 4.3.4 集群結果評估 4.3.5 結語 第五章監督式學習 5.1 線性迴歸與分類 5.1.1 多元線性迴歸 5.1.2 偏最小平方法迴歸 5.1.3 脊迴歸、LASSO 迴歸與彈性網罩懲罰模型 5.1.4 線性判別分析 5.1.4.1 貝氏法 5.1.4.2 費雪法 5.1.5 羅吉斯迴歸分類與廣義線性模型 5.2 非線性分類與迴歸 5.2.1 天真貝式分類 5.2.1.1手機簡訊過濾案例 5.2.2 k 近鄰法分類 5.2.2.1 電離層無線電訊號案例 5.2.3 支援向量機分類 5.2.3.1 光學手寫字元案例 5.2.4 分類與迴歸樹 5.2.4.1 銀行貸款風險管理案例 5.2.4.2 酒品評點迴歸樹預測 5.2.4.3 小結 第六章其它學習方式 6.1 薈萃式學習 6.1.1 拔靴集成法 6.1.2 多模激發法 6.1.2.1 房價中位數預測案例 6.1.3 隨機森林 6.1.4 小結 6.2 深度學習 6.2.1 類神經網路簡介 6.2.2 多層感知機 6.2.2.1 混凝土強度佔計案例 6.2.3 卷積神經網路 6.2.4 遞歸神經網路 6.2.5 自動編碼器 6.2.6 受限波茲曼機 6.2.7 深度信念網路 6.2.8 深度學習參數調校 6.3 強化式學習

原價: 800 售價: 752 現省: 48元
立即查看