注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡數(shù)據庫數(shù)據庫設計/管理Python數(shù)據分析與挖掘實戰(zhàn)

Python數(shù)據分析與挖掘實戰(zhàn)

Python數(shù)據分析與挖掘實戰(zhàn)

定 價:¥69.00

作 者: 張良均 王路 譚立云 蘇劍林等
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 計算機/網絡 數(shù)據倉庫與數(shù)據挖掘 數(shù)據庫

購買這本書可以去


ISBN: 9787111521235 出版時間: 2015-12-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內容簡介

  10余位數(shù)據挖掘領域資深專家和科研人員,10余年大數(shù)據挖掘咨詢與實施經驗結晶。從數(shù)據挖掘的應用出發(fā),以電力、航空、醫(yī)療、互聯(lián)網、生產制造以及公共服務等行業(yè)真實案例為主線,深入淺出介紹Python數(shù)據挖掘建模過程,實踐性極強。本書共15章,分兩個部分:基礎篇、實戰(zhàn)篇?;A篇介紹了數(shù)據挖掘的基本原理,實戰(zhàn)篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得數(shù)據挖掘項目經驗,同時快速領悟看似難懂的數(shù)據挖掘理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模數(shù)據,借助相關的數(shù)據挖掘建模工具,通過上機實驗,以快速理解相關知識與理論?;A篇(第1~5章),第1章的主要內容是數(shù)據挖掘概述;第2章對本書所用到的數(shù)據挖掘建模工具Python語言進行了簡明扼要的說明;第3章、第4章、第5章對數(shù)據挖掘的建模過程,包括數(shù)據探索、數(shù)據預處理及挖掘建模的常用算法與原理進行了介紹。實戰(zhàn)篇(第6~15章),重點對數(shù)據挖掘技術在電力、航空、醫(yī)療、互聯(lián)網、生產制造以及公共服務等行業(yè)的應用進行了分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最后完成模型構建的順序進行的,在建模過程的關鍵環(huán)節(jié),穿插程序實現(xiàn)代碼。最后通過上機實踐,加深讀者對數(shù)據挖掘技術在案例應用中的理解。

作者簡介

  張良均 資深大數(shù)據挖掘專家和模式識別專家,高級信息項目管理師,有10多年的大數(shù)據挖掘應用、咨詢和培訓經驗。為電信、電力、政府、互聯(lián)網、生產制造、零售、銀行、生物、化工、醫(yī)藥等多個行業(yè)上百家大型企業(yè)提供過數(shù)據挖掘應用與咨詢服務,實踐經驗非常豐富。此外,他精通Java EE企業(yè)級應用開發(fā),是廣東工業(yè)大學、華南師范大學、華南農業(yè)大學、貴州師范學院、韓山師范學院、廣東技術師范學院兼職教授,著有《神經網絡實用教程》、《數(shù)據挖掘:實用案例分析》、《MATLAB數(shù)據分析與挖掘實戰(zhàn)》《R語言數(shù)據分析與挖掘實戰(zhàn)》等暢銷書。

圖書目錄

前 言
基 礎 篇
第1章 數(shù)據挖掘基礎2
1.1 某知名連鎖餐飲企業(yè)的困惑2
1.2 從餐飲服務到數(shù)據挖掘3
1.3 數(shù)據挖掘的基本任務4
1.4 數(shù)據挖掘建模過程4
1.4.1 定義挖掘目標4
1.4.2 數(shù)據取樣5
1.4.3 數(shù)據探索6
1.4.4 數(shù)據預處理7
1.4.5 挖掘建模7
1.4.6 模型評價7
1.5 常用的數(shù)據挖掘建模工具7
1.6 小結9
第2章 Python數(shù)據分析簡介10
2.1 搭建Python開發(fā)平臺12
2.1.1 所要考慮的問題12
2.1.2 基礎平臺的搭建12
2.2 Python使用入門13
2.2.1 運行方式14
2.2.2 基本命令15
2.2.3 數(shù)據結構17
2.2.4 庫的導入與添加20
2.3 Python數(shù)據分析工具22
2.3.1 Numpy23
2.3.2 Scipy24
2.3.3 Matplotlib24
2.3.4 Pandas26
2.3.5 StatsModels27
2.3.6 Scikit-Learn28
2.3.7 Keras29
2.3.8 Gensim30
2.4 配套資源使用設置31
2.5 小結32
第3章 數(shù)據探索33
3.1 數(shù)據質量分析33
3.1.1 缺失值分析34
3.1.2 異常值分析34
3.1.3 一致性分析37
3.2 數(shù)據特征分析37
3.2.1 分布分析37
3.2.2 對比分析40
3.2.3 統(tǒng)計量分析41
3.2.4 周期性分析44
3.2.5 貢獻度分析45
3.2.6 相關性分析47
3.3 Python主要數(shù)據探索函數(shù)50
3.3.1 基本統(tǒng)計特征函數(shù)50
3.3.2 拓展統(tǒng)計特征函數(shù)53
3.3.3 統(tǒng)計作圖函數(shù)54
3.4 小結59
第4章 數(shù)據預處理60
4.1 數(shù)據清洗60
4.1.1 缺失值處理60
4.1.2 異常值處理64
4.2 數(shù)據集成64
4.2.1 實體識別64
4.2.2 冗余屬性識別65
4.3 數(shù)據變換65
4.3.1 簡單函數(shù)變換65
4.3.2 規(guī)范化66
4.3.3 連續(xù)屬性離散化68
4.3.4 屬性構造70
4.3.5 小波變換71
4.4 數(shù)據規(guī)約74
4.4.1 屬性規(guī)約74
4.4.2 數(shù)值規(guī)約77
4.5 Python主要數(shù)據預處理函數(shù)80
4.6 小結81
第5章 挖掘建模83
5.1 分類與預測83
5.1.1 實現(xiàn)過程83
5.1.2 常用的分類與預測算法84
5.1.3 回歸分析85
5.1.4 決策樹89
5.1.5 人工神經網絡95
5.1.6 分類與預測算法評價100
5.1.7 Python分類預測模型特點103
5.2 聚類分析104
5.2.1 常用聚類分析算法104
5.2.2 K-Means聚類算法105
5.2.3 聚類分析算法評價111
5.2.4 Python主要聚類分析算法111
5.3 關聯(lián)規(guī)則113
5.3.1 常用關聯(lián)規(guī)則算法114
5.3.2 Apriori算法114
5.4 時序模式119
5.4.1 時間序列算法120
5.4.2 時間序列的預處理120
5.4.3 平穩(wěn)時間序列分析122
5.4.4 非平穩(wěn)時間序列分析124
5.4.5 Python主要時序模式算法132
5.5 離群點檢測134
5.5.1 離群點檢測方法135
5.5.2 基于模型的離群點檢測方法136
5.5.3 基于聚類的離群點檢測方法138
5.6 小結141
實 戰(zhàn) 篇
第6章 電力竊漏電用戶自動識別144
6.1 背景與挖掘目標144
6.2 分析方法與過程147
6.2.1 數(shù)據抽取148
6.2.2 數(shù)據探索分析148
6.2.3 數(shù)據預處理151
6.2.4 構建專家樣本156
6.2.5 模型構建157
6.3 上機實驗161
6.4 拓展思考162
6.5 小結163
第7章 航空公司客戶價值分析164
7.1 背景與挖掘目標164
7.2 分析方法與過程166
7.2.1 數(shù)據抽取168
7.2.2 數(shù)據探索分析168
7.2.3 數(shù)據預處理169
7.2.4 模型構建173
7.3 上機實驗177
7.4 拓展思考178
7.5 小結179
第8章 中醫(yī)證型關聯(lián)規(guī)則挖掘180
8.1 背景與挖掘目標180
8.2 分析方法與過程181
8.2.1 數(shù)據獲取183
8.2.2 數(shù)據預處理186
8.2.3 模型構建190
8.3 上機實驗193
8.4 拓展思考194
8.5 小結194
第9章 基于水色圖像的水質評價195
9.1 背景與挖掘目標195
9.2 分析方法與過程195
9.2.1 數(shù)據預處理197
9.2.2 模型構建199
9.2.3 水質評價201
9.3 上機實驗202
9.4 拓展思考202
9.5 小結203
第10章 家用電器用戶行為分析與事件識別204
10.1 背景與挖掘目標204
10.2 分析方法與過程205
10.2.1 數(shù)據抽取206
10.2.2 數(shù)據探索分析207
10.2.3 數(shù)據預處理207
10.2.4 模型構建217
10.2.5 模型檢驗219
10.3 上機實驗220
10.4 拓展思考221
10.5 小結222
第11章 應用系統(tǒng)負載分析與磁盤容量預測223
11.1 背景與挖掘目標223
11.2 分析方法與過程225
11.2.1 數(shù)據抽取226
11.2.2 數(shù)據探索分析226
11.2.3 數(shù)據預處理227
11.2.4 模型構建229
11.3 上機實驗235
11.4 拓展思考236
11.5 小結237
第12章 電子商務網站用戶行為分析及服務推薦238
12.1 背景與挖掘目標238
12.2 分析方法與過程240
12.2.1 數(shù)據抽取242
12.2.2 數(shù)據探索分析244
12.2.3 數(shù)據預處理251
12.2.4 模型構建256
12.3 上機實驗266
12.4 拓展思考267
12.5 小結269
第13章 財政收入影響因素分析及預測模型270
13.1 背景與挖掘目標270
13.2 分析方法與過程272
13.2.1 灰色預測與神經網絡的組合模型273
13.2.2 數(shù)據探索分析274
13.2.3 模型構建277
13.3 上機實驗294
13.4 拓展思考295
13.5 小結296
第14章 基于基站定位數(shù)據的商圈分析297
14.1 背景與挖掘目標297
14.2 分析方法與過程299
14.2.1 數(shù)據抽取299
14.2.2 數(shù)據探索分析299
14.2.3 數(shù)據預處理301
14.2.4 模型構建304
14.3 上機實驗308
14.4 拓展思考309
14.5 小結309
第15章 電商產品評論數(shù)據情感分析310
15.1 背景與挖掘目標310
15.2 分析方法與過程310
15.2.1 評論數(shù)據采集311
15.2.2 評論預處理314
15.2.3 文本評論分詞320
15.2.4 模型構建320
15.3 上機實驗333
15.4 拓展思考334
15.5 小結335
參考文獻336

本目錄推薦

掃描二維碼
Copyright ? 讀書網 leeflamesbasketballcamps.com 2005-2026, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號