注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫設計/管理Python數(shù)據(jù)分析與挖掘實戰(zhàn)

Python數(shù)據(jù)分析與挖掘實戰(zhàn)

Python數(shù)據(jù)分析與挖掘實戰(zhàn)

定 價:¥69.00

作 者: 張良均 王路 譚立云 蘇劍林等
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 計算機/網(wǎng)絡 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787111521235 出版時間: 2015-12-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  10余位數(shù)據(jù)挖掘領域資深專家和科研人員,10余年大數(shù)據(jù)挖掘咨詢與實施經(jīng)驗結晶。從數(shù)據(jù)挖掘的應用出發(fā),以電力、航空、醫(yī)療、互聯(lián)網(wǎng)、生產(chǎn)制造以及公共服務等行業(yè)真實案例為主線,深入淺出介紹Python數(shù)據(jù)挖掘建模過程,實踐性極強。本書共15章,分兩個部分:基礎篇、實戰(zhàn)篇?;A篇介紹了數(shù)據(jù)挖掘的基本原理,實戰(zhàn)篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得數(shù)據(jù)挖掘項目經(jīng)驗,同時快速領悟看似難懂的數(shù)據(jù)挖掘理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模數(shù)據(jù),借助相關的數(shù)據(jù)挖掘建模工具,通過上機實驗,以快速理解相關知識與理論?;A篇(第1~5章),第1章的主要內(nèi)容是數(shù)據(jù)挖掘概述;第2章對本書所用到的數(shù)據(jù)挖掘建模工具Python語言進行了簡明扼要的說明;第3章、第4章、第5章對數(shù)據(jù)挖掘的建模過程,包括數(shù)據(jù)探索、數(shù)據(jù)預處理及挖掘建模的常用算法與原理進行了介紹。實戰(zhàn)篇(第6~15章),重點對數(shù)據(jù)挖掘技術在電力、航空、醫(yī)療、互聯(lián)網(wǎng)、生產(chǎn)制造以及公共服務等行業(yè)的應用進行了分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最后完成模型構建的順序進行的,在建模過程的關鍵環(huán)節(jié),穿插程序實現(xiàn)代碼。最后通過上機實踐,加深讀者對數(shù)據(jù)挖掘技術在案例應用中的理解。

作者簡介

  張良均 資深大數(shù)據(jù)挖掘專家和模式識別專家,高級信息項目管理師,有10多年的大數(shù)據(jù)挖掘應用、咨詢和培訓經(jīng)驗。為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等多個行業(yè)上百家大型企業(yè)提供過數(shù)據(jù)挖掘應用與咨詢服務,實踐經(jīng)驗非常豐富。此外,他精通Java EE企業(yè)級應用開發(fā),是廣東工業(yè)大學、華南師范大學、華南農(nóng)業(yè)大學、貴州師范學院、韓山師范學院、廣東技術師范學院兼職教授,著有《神經(jīng)網(wǎng)絡實用教程》、《數(shù)據(jù)挖掘:實用案例分析》、《MATLAB數(shù)據(jù)分析與挖掘實戰(zhàn)》《R語言數(shù)據(jù)分析與挖掘實戰(zhàn)》等暢銷書。

圖書目錄

前 言
基 礎 篇
第1章 數(shù)據(jù)挖掘基礎2
1.1 某知名連鎖餐飲企業(yè)的困惑2
1.2 從餐飲服務到數(shù)據(jù)挖掘3
1.3 數(shù)據(jù)挖掘的基本任務4
1.4 數(shù)據(jù)挖掘建模過程4
1.4.1 定義挖掘目標4
1.4.2 數(shù)據(jù)取樣5
1.4.3 數(shù)據(jù)探索6
1.4.4 數(shù)據(jù)預處理7
1.4.5 挖掘建模7
1.4.6 模型評價7
1.5 常用的數(shù)據(jù)挖掘建模工具7
1.6 小結9
第2章 Python數(shù)據(jù)分析簡介10
2.1 搭建Python開發(fā)平臺12
2.1.1 所要考慮的問題12
2.1.2 基礎平臺的搭建12
2.2 Python使用入門13
2.2.1 運行方式14
2.2.2 基本命令15
2.2.3 數(shù)據(jù)結構17
2.2.4 庫的導入與添加20
2.3 Python數(shù)據(jù)分析工具22
2.3.1 Numpy23
2.3.2 Scipy24
2.3.3 Matplotlib24
2.3.4 Pandas26
2.3.5 StatsModels27
2.3.6 Scikit-Learn28
2.3.7 Keras29
2.3.8 Gensim30
2.4 配套資源使用設置31
2.5 小結32
第3章 數(shù)據(jù)探索33
3.1 數(shù)據(jù)質(zhì)量分析33
3.1.1 缺失值分析34
3.1.2 異常值分析34
3.1.3 一致性分析37
3.2 數(shù)據(jù)特征分析37
3.2.1 分布分析37
3.2.2 對比分析40
3.2.3 統(tǒng)計量分析41
3.2.4 周期性分析44
3.2.5 貢獻度分析45
3.2.6 相關性分析47
3.3 Python主要數(shù)據(jù)探索函數(shù)50
3.3.1 基本統(tǒng)計特征函數(shù)50
3.3.2 拓展統(tǒng)計特征函數(shù)53
3.3.3 統(tǒng)計作圖函數(shù)54
3.4 小結59
第4章 數(shù)據(jù)預處理60
4.1 數(shù)據(jù)清洗60
4.1.1 缺失值處理60
4.1.2 異常值處理64
4.2 數(shù)據(jù)集成64
4.2.1 實體識別64
4.2.2 冗余屬性識別65
4.3 數(shù)據(jù)變換65
4.3.1 簡單函數(shù)變換65
4.3.2 規(guī)范化66
4.3.3 連續(xù)屬性離散化68
4.3.4 屬性構造70
4.3.5 小波變換71
4.4 數(shù)據(jù)規(guī)約74
4.4.1 屬性規(guī)約74
4.4.2 數(shù)值規(guī)約77
4.5 Python主要數(shù)據(jù)預處理函數(shù)80
4.6 小結81
第5章 挖掘建模83
5.1 分類與預測83
5.1.1 實現(xiàn)過程83
5.1.2 常用的分類與預測算法84
5.1.3 回歸分析85
5.1.4 決策樹89
5.1.5 人工神經(jīng)網(wǎng)絡95
5.1.6 分類與預測算法評價100
5.1.7 Python分類預測模型特點103
5.2 聚類分析104
5.2.1 常用聚類分析算法104
5.2.2 K-Means聚類算法105
5.2.3 聚類分析算法評價111
5.2.4 Python主要聚類分析算法111
5.3 關聯(lián)規(guī)則113
5.3.1 常用關聯(lián)規(guī)則算法114
5.3.2 Apriori算法114
5.4 時序模式119
5.4.1 時間序列算法120
5.4.2 時間序列的預處理120
5.4.3 平穩(wěn)時間序列分析122
5.4.4 非平穩(wěn)時間序列分析124
5.4.5 Python主要時序模式算法132
5.5 離群點檢測134
5.5.1 離群點檢測方法135
5.5.2 基于模型的離群點檢測方法136
5.5.3 基于聚類的離群點檢測方法138
5.6 小結141
實 戰(zhàn) 篇
第6章 電力竊漏電用戶自動識別144
6.1 背景與挖掘目標144
6.2 分析方法與過程147
6.2.1 數(shù)據(jù)抽取148
6.2.2 數(shù)據(jù)探索分析148
6.2.3 數(shù)據(jù)預處理151
6.2.4 構建專家樣本156
6.2.5 模型構建157
6.3 上機實驗161
6.4 拓展思考162
6.5 小結163
第7章 航空公司客戶價值分析164
7.1 背景與挖掘目標164
7.2 分析方法與過程166
7.2.1 數(shù)據(jù)抽取168
7.2.2 數(shù)據(jù)探索分析168
7.2.3 數(shù)據(jù)預處理169
7.2.4 模型構建173
7.3 上機實驗177
7.4 拓展思考178
7.5 小結179
第8章 中醫(yī)證型關聯(lián)規(guī)則挖掘180
8.1 背景與挖掘目標180
8.2 分析方法與過程181
8.2.1 數(shù)據(jù)獲取183
8.2.2 數(shù)據(jù)預處理186
8.2.3 模型構建190
8.3 上機實驗193
8.4 拓展思考194
8.5 小結194
第9章 基于水色圖像的水質(zhì)評價195
9.1 背景與挖掘目標195
9.2 分析方法與過程195
9.2.1 數(shù)據(jù)預處理197
9.2.2 模型構建199
9.2.3 水質(zhì)評價201
9.3 上機實驗202
9.4 拓展思考202
9.5 小結203
第10章 家用電器用戶行為分析與事件識別204
10.1 背景與挖掘目標204
10.2 分析方法與過程205
10.2.1 數(shù)據(jù)抽取206
10.2.2 數(shù)據(jù)探索分析207
10.2.3 數(shù)據(jù)預處理207
10.2.4 模型構建217
10.2.5 模型檢驗219
10.3 上機實驗220
10.4 拓展思考221
10.5 小結222
第11章 應用系統(tǒng)負載分析與磁盤容量預測223
11.1 背景與挖掘目標223
11.2 分析方法與過程225
11.2.1 數(shù)據(jù)抽取226
11.2.2 數(shù)據(jù)探索分析226
11.2.3 數(shù)據(jù)預處理227
11.2.4 模型構建229
11.3 上機實驗235
11.4 拓展思考236
11.5 小結237
第12章 電子商務網(wǎng)站用戶行為分析及服務推薦238
12.1 背景與挖掘目標238
12.2 分析方法與過程240
12.2.1 數(shù)據(jù)抽取242
12.2.2 數(shù)據(jù)探索分析244
12.2.3 數(shù)據(jù)預處理251
12.2.4 模型構建256
12.3 上機實驗266
12.4 拓展思考267
12.5 小結269
第13章 財政收入影響因素分析及預測模型270
13.1 背景與挖掘目標270
13.2 分析方法與過程272
13.2.1 灰色預測與神經(jīng)網(wǎng)絡的組合模型273
13.2.2 數(shù)據(jù)探索分析274
13.2.3 模型構建277
13.3 上機實驗294
13.4 拓展思考295
13.5 小結296
第14章 基于基站定位數(shù)據(jù)的商圈分析297
14.1 背景與挖掘目標297
14.2 分析方法與過程299
14.2.1 數(shù)據(jù)抽取299
14.2.2 數(shù)據(jù)探索分析299
14.2.3 數(shù)據(jù)預處理301
14.2.4 模型構建304
14.3 上機實驗308
14.4 拓展思考309
14.5 小結309
第15章 電商產(chǎn)品評論數(shù)據(jù)情感分析310
15.1 背景與挖掘目標310
15.2 分析方法與過程310
15.2.1 評論數(shù)據(jù)采集311
15.2.2 評論預處理314
15.2.3 文本評論分詞320
15.2.4 模型構建320
15.3 上機實驗333
15.4 拓展思考334
15.5 小結335
參考文獻336

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號