為您推薦
類似書籍推薦給您
【簡介】 本書內容主要係針對SAS應用軟體的資料處理部份(DATA STEP)進行介紹,其共分為15章,由SAS的起動運作與作業流程開始說起,經由語言基本結構、資料集命名、資料輸入輸出、變數修飾、資料的組合與連結、變數的指標控制、程式的條件與流程控制、陣列宣告等,最後再談判到遺失值的表示與處理、常用函數、以及巨集變數與指命等,無一不深入淺出地加以說明與舉例。 書中在多處以錯誤的範例來提醒讀者可能發生的問題與其之訊息,使讀者在撰寫程式時,不致發生相同的問題。因此,本書的特點有:(1)全書以教學性、基礎性和實用性觀點說明SAS資料處理的內容;(2)以許多範例輔助說明,有助於讀者完全瞭解書中的內容;(3)書內完整的範例皆附於光碟內,可方便讀者綀習與修改;(4)適合於以SAS應用軟體進行處理或執行分析者參考之用。 【目錄】
類似書籍推薦給您
【簡介】 「這本書正是我當年提出『資料科學家』這個職稱時,所希望能擁有的一本書。如果您希望投身資料科學/工程、人工智慧,或機器學習領域,就該從這裡開始。」 ── DJ Patil 博士,美國首任首席資料科學家 身為一位有志成為資料科學家的讀者,能夠理解各類組織為何仰賴資料來做出關鍵決策──無論是公司在設計網站、還是市政府在改善公共服務,或者是科學家在致力於阻止疾病擴散。而您也希望具備將雜亂資料整理為可行洞見的能力。我們將這整個過程稱為「資料科學生命週期」:也就是從資料的收集、整理、分析,到導出結論的完整流程。 本書是第一本涵蓋程式設計與統計兩大基礎技能、並貫穿整個資料科學生命週期的書籍。本書的對象包括希望成為資料科學家的人、與資料科學家共事的專業人士,以及希望跨越「技術/非技術」界線的資料分析師。只要具備基本的 Python 程式設計知識,便可學習如何透過業界標準工具(如 pandas)來處理資料: .將感興趣的問題精煉為可透過資料探究的研究問題 .執行資料蒐集,其中可能涉及文字處理、網頁爬蟲等技術 .透過資料清理、探索與視覺化,萃取出有價值的洞見 .學會使用建模來描述資料特性 .推廣研究結果,進行超出資料本身的推論 【目錄】 前言 【第一部分 資料科學生命週期】 第一章 資料科學生命週期 生命週期的各個階段 生命週期的範例 總結 第二章 問題與資料範疇 大數據與新機會 研究母體、抽樣架構與樣本 儀器與操作程序 自然現象的量測 準確度 總結 第三章 模擬與資料設計 抽籤模型 範例:模擬選舉民調的偏誤與變異性 範例:模擬疫苗的隨機試驗 範例:空氣品質測量 總結 第四章 以摘要統計量建構模型 常數模型 最小化損失 總結 第五章 個案研究:為什麼我的公車總是拖班? 問題與範疇 資料整理 探索公車時間 建立等車時間模型 總結 【第二部分】 矩形資料 第六章 使用pandas操作資料框架 子集合選取(Subsetting) 匯總 合併 轉換 資料框架與其他資料表達法有何不同? 總結 第七章 使用SQL操作關係 子集合選取(Subsetting) 匯總 合併 轉換與共通表格運算式 總結 【第三部分】 理解資料 第八章 整理檔案 資料來源範例 檔案格式 檔案編碼 檔案大小 殼層與命令行工具 表格形狀與粒度 總結 第九章 整理資料框架 範例:整理冒納羅亞觀測站的CO2測量資料 品質檢查 缺漏的值與紀錄 轉換與時間戳記 修改結構 範例:處理餐廳安全違規資料 總結 第十章 探索性資料分析 特徵類型 觀察分布的重點 在關係中應注意的事項 多變數情境下的比較 探索準則 範例:房屋售價 總結 第十一章 資料視覺化 選擇合適的刻度以揭示結構 資料的平滑化與匯總 促進有意義的比較 融入資料設計 加入情境資訊 使用plotly繪製圖表 其他視覺化工具 總結 第十二章 案例研究:空氣品質測量有多準確? 問題、設計與範疇 尋找共址感測器 整理與清洗 AQS感測器資料 整理PurpleAir感測器資料 探索PurpleAir與AQS測量值 建立校準PurpleAir測量值之模型 總結 【第四部分】 其他資料來源 第十三章 處理文字資料 文字與任務的範例 字串處理 正規表達式 文字分析 總結 第十四章 資料交換 NetCDF資料 JSON資料 HTTP REST XML、HTML與XPath 總結 【第五部分】 線性建模 第十五章 線性模型 簡單線性模型 範例:空氣品質的簡單線性模型 擬合簡單線性模型 多元線性模型 擬合多元線性模型 範例:哪裡是機會之地? 數值型測量值之特徵工程 類別型測量值的特徵工程 總結 第十六章 模型選擇 過度擬合 訓練-測試切分 交叉驗證 正則化 模型偏誤與變異性 總結 第十七章 推論與預測的理論基礎 分布:母體、經驗、抽樣 假設檢定的基本概念 以自助法推論 信賴區間的基本概念 預測區間的基本概念 用於推論與預測的機率理論 總結 第十八章 案例研究:如何幫驢子秤體重? 驢子研究的問題與範圍 資料整理與轉換 探索 建立驢子體重的模型 總結 【第六部分】 分類 第十九章 分類 範例:風災倒木 建模與分類 對比例(與機率)建模 邏輯斯模型的損失函數 從機率到分類 總結 第二十章 數值最佳化 梯度下降法基礎 最小化Huber損失 凸形且可微分的損失函數 梯度下降法的變體 總結 第二十一章 個案研究:偵測假新聞 問題與範疇 取得與整理資料 探索資料 建模 總結 延伸資料 資料來源 索引
類似書籍推薦給您
【簡介】 1. 此書為提供報考就業考試考生使用的歷屆試題書: 此書適用於公職考試(高普考、地特),想要成為資訊處理相關領域的公職人員,大多會選擇報考此類國家考試,作為進入國家機關工作的首要門檻。 公職考試試題大補帖系列提供報考這類考試的考生,精選多年度公職考試歷屆試題演練書,考生只需購買一本書,即可抓住各公職考試科目的重點題型。 2. 收錄多年度完整試題(今年度收錄106~114年度試題)。 3. 建議搭配新試界線上測驗平台,登入並註冊會員,即可享有隨時隨地備考的考試利器!線上線下皆可學習 4. 題題附有解析,讓考生一邊刷題,同時精準汲取解題脈絡與思維,助考生增進備考實力。 5. 補班名師解題,不用三顧茅廬立即獲得考題解析。 內容簡介 1. 內文特色: 公職考試的考科組合多元,書籍依不同類科囊括報考重點科目並按照年度排列,分申論題型與測驗題型出版成書,本書收錄考試包含: 高等考試三級、普通考試、地方政府公務人員考試 本書收錄科目包含:資料處理、資料處理概要 不需費力上網爬文找歷屆試題,只要一本試題大補帖在手,便能立即實戰演練,並有效了解該考試考科重點,為考前模擬與衝刺複習。 2. 適用族群: 公職工作內容會依據類科不同有不同專業性,有資訊考科相關背景的考生,或是對於資訊處理領域相關的工作有興趣的就業族群,可透過演練歷屆試題,快速瞭解出題方向。 3. 題題有解析,最有效的複習: 在實戰演練的同時,在瞭解解題脈絡與方法的基礎上,活用該科常考重點,達到考前最有效率的複習狀態。 【目錄】 四等 【資料處理概要】 ◎普通考試 114年(統計) 113年(統計) 112年(統計、資訊處理) 111年(統計、資訊處理) 110年(統計、資訊處理) 109年(統計、資訊處理) 108年(統計、資訊處理) 107年(統計、資訊處理) 106年(統計、資訊處理) ◎地方四等 113年(統計) 112年(資訊處理) 111年(統計、資訊處理) 110年(統計、資訊處理) 109年(統計、資訊處理) 108年(統計、資訊處理) 107年(統計、資訊處理) 106年(資訊處理) 106年(統計) 三等 【資料處理】 ◎高考三級 114年 113年 112年 111年 110年 109年 108年 107年 106年 ◎地方三等 113年 112年 111年 110年 109年 108年 107年 106年
資訊
工程
數學與統計學
機率與統計
自然科學
健康科學
地球與環境
建築、設計與藝術
人文與社會科學
教育
語言學習與考試
法律
會計與財務
大眾傳播
觀光與休閒餐旅
考試用書
研究方法
商業與管理
經濟學
心理學
生活
生活風格商品
參考書/測驗卷/輔材