Hadoop大數(shù)據(jù)實(shí)戰(zhàn)權(quán)威指南

定　價(jià)：￥68.00

作　者：	黃東軍著
出版社：	電子工業(yè)出版社
叢編項(xiàng)：	大數(shù)據(jù)科學(xué)與應(yīng)用叢書
標(biāo)　簽：	暫缺

購買這本書可以去

ISBN：	9787121318214	出版時(shí)間：	2017-07-01	包裝：	平裝
開本：	16開	頁數(shù)：	380	字?jǐn)?shù)：

內(nèi)容簡介

　　大數(shù)據(jù)貴在落實(shí)！本書是一本講解大數(shù)據(jù)實(shí)戰(zhàn)的圖書，按照“深入分析組件原理、充分展示搭建過程、詳細(xì)指導(dǎo)應(yīng)用開發(fā)”編寫。全書分為三篇，第一篇為大數(shù)據(jù)的基本概念和技術(shù)，主要介紹大數(shù)據(jù)的背景、發(fā)展及關(guān)鍵技術(shù)；第二篇為Hadoop大數(shù)據(jù)平臺搭建與基本應(yīng)用，內(nèi)容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafk、Spark等；第三篇為大數(shù)據(jù)處理與項(xiàng)目開發(fā)，包括交互式數(shù)據(jù)處理、協(xié)同過濾推薦系統(tǒng)、銷售數(shù)據(jù)分析系統(tǒng)，并就的部分銷售數(shù)據(jù)應(yīng)用大數(shù)據(jù)進(jìn)行處理分析。

作者簡介

　　黃東軍，男，教授，博士，博士生導(dǎo)師。畢業(yè)于中南大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)，先工作于中南大學(xué)信息科學(xué)與工程學(xué)院。中國計(jì)算機(jī)學(xué)會(huì)高級會(huì)員，教育部計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)教學(xué)指導(dǎo)委員會(huì)物聯(lián)網(wǎng)工程專業(yè)教學(xué)研究專家組”成員。

圖書目錄

目錄
第一篇大數(shù)據(jù)的基本概念和技術(shù)
第1章緒論\t3
1．1 時(shí)代背景\t3
1．1．1 全球大數(shù)據(jù)浪潮\t3
1．1．2 我國的大數(shù)據(jù)國家戰(zhàn)略\t5
1．2 大數(shù)據(jù)的概念\t7
1．2．1 概念\t7
1．2．2 特征\t8
1．3 技術(shù)支撐體系\t9
1．3．1 概覽\t9
1．3．2 大數(shù)據(jù)采集層\t9
1．3．3 大數(shù)據(jù)存儲(chǔ)層\t10
1．3．4 大數(shù)據(jù)分析（處理與服務(wù)）層\t11
1．3．5 大數(shù)據(jù)應(yīng)用層\t11
1．3．6 垂直視圖\t13
1．4 大數(shù)據(jù)人才及其能力要求\t14
1．4．1 首席數(shù)據(jù)官\t14
1．4．2 數(shù)據(jù)科學(xué)家（數(shù)據(jù)分析師）\t15
1．4．3 大數(shù)據(jù)開發(fā)工程師\t16
1．4．4 大數(shù)據(jù)運(yùn)維工程師\t17
1．5 本章小結(jié)\t17
第2章 Hadoop大數(shù)據(jù)關(guān)鍵技術(shù)\t19
2．1 Hadoop生態(tài)系統(tǒng)\t19
2．1．1 架構(gòu)的基本理論\t19
2．1．2 主要組件及其關(guān)系\t21
2．2 數(shù)據(jù)采集\t24
2．2．1 結(jié)構(gòu)化數(shù)據(jù)采集工具\(yùn)t24
2．2．2 日志文件采集工具與技術(shù)\t25
2．3 大數(shù)據(jù)存儲(chǔ)技術(shù)\t29
2．3．1 相關(guān)概念\t29
2．3．2 分布式文件存儲(chǔ)系統(tǒng)\t34
2．3．3 數(shù)據(jù)庫與數(shù)據(jù)倉庫\t38
2．4 分布式計(jì)算框架\t43
2．4．1 離線計(jì)算框架\t43
2．4．2 實(shí)時(shí)流計(jì)算平臺\t50
2．5 數(shù)據(jù)分析平臺與工具\(yùn)t57
2．5．1 面向大數(shù)據(jù)的數(shù)據(jù)挖掘與分析工具\(yùn)t57
2．5．2 機(jī)器學(xué)習(xí)\t61
2．6 本章小結(jié)\t66
第二篇 Hadoop大數(shù)據(jù)平臺搭建與基本應(yīng)用
第3章 Linux操作系統(tǒng)與集群搭建\t69
3．1 Linux操作系統(tǒng)\t69
3．1．1 概述\t69
3．1．2 特點(diǎn)\t70
3．1．3 Linux的組成\t72
3．2 Linux安裝與集群搭建\t75
3．2．1 安裝VMware Workstation\t75
3．2．2 在VMware上安裝Linux（CentOS7）\t79
3．3 集群的配置\t91
3．3．1 設(shè)置主機(jī)名\t91
3．3．2 網(wǎng)絡(luò)設(shè)置\t93
3．3．3 關(guān)閉防火墻\t98
3．3．4 安裝JDK\t99
3．3．5 免密鑰登錄配置\t102
3．4 Linux基本命令\t105
3．5 本章小結(jié)\t112
第4章 HDFS安裝與基本應(yīng)用\t113
4．1 HDFS概述\t113
4．1．1 特點(diǎn)\t113
4．1．2 主要組件與架構(gòu)\t114
4．2 HDFS架構(gòu)分析\t114
4．2．1 數(shù)據(jù)塊\t114
4．2．2 NameNode\t115
4．2．3 DataNode\t116
4．2．4 SecondaryNameNode\t117
4．2．5 數(shù)據(jù)備份\t117
4．2．6 通信協(xié)議\t118
4．2．7 可靠性保證\t118
4．3 文件操作過程分析\t119
4．3．1 讀文件\t119
4．3．2 寫文件\t120
4．3．3 刪除文件\t122
4．4 Hadoop HDFS安裝與配置\t122
4．4．1 解壓Hadoop安裝包\t122
4．4．2 配置Hadoop環(huán)境變量\t123
4．4．3 配置Yarn環(huán)境變量\t124
4．4．4 配置核心組件文件\t125
4．4．5 配置文件系統(tǒng)\t125
4．4．6 配置yarn-site．xml文件\t126
4．4．7 配置MapReduce計(jì)算框架文件\t128
4．4．8 配置Master的slaves文件\t129
4．4．9 復(fù)制Master上的Hadoop到Slave節(jié)點(diǎn)\t129
4．5 Hadoop集群的啟動(dòng)\t130
4．5．1 配置操作系統(tǒng)環(huán)境變量\t130
4．5．2 創(chuàng)建Hadoop數(shù)據(jù)目錄\t131
4．5．3 格式化文件系統(tǒng)\t132
4．5．4 啟動(dòng)和關(guān)閉Hadoop\t133
4．5．5 驗(yàn)證Hadoop是否啟動(dòng)成功\t133
4．6 Hadoop集群的基本應(yīng)用\t136
4．6．1 HDFS基本命令\t136
4．6．2 在Hadoop集群中運(yùn)行程序\t139
4．7 本章小結(jié)\t141
第5章 MapReduce與Yarn\t143
5．1 MapReduce程序的概念\t143
5．1．1 基本編程模型\t143
5．1．2 計(jì)算過程分析\t144
5．2 深入理解Yarn\t147
5．2．1 Yarn的基本架構(gòu)\t147
5．2．2 Yarn的工作流程\t151
5．3 在Linux平臺安裝Eclipse\t152
5．3．1 Eclipse簡介\t153
5．3．2 安裝并啟動(dòng)Eclipse\t154
5．4 開發(fā)MapReduce程序的基本方法\t155
5．4．1 為Eclipse安裝Hadoop插件\t156
5．4．2 WordCount：第一個(gè)MapReduce程序\t160
5．5 本章小結(jié)\t175
第6章 Hive和HBase的安裝與應(yīng)用\t177
6．1 在CentOS7下安裝MySQL\t177
6．1．1 下載或復(fù)制MySQL安裝包\t177
6．1．2 執(zhí)行安裝命令\t178
6．1．3 啟動(dòng)MySQL\t179
6．1．4 登錄MySQL\t179
6．1．5 使用MySQL\t181
6．1．6 問題與解決辦法\t182
6．2 Hive安裝與應(yīng)用\t183
6．2．1 下載并解壓Hive安裝包\t183
6．2．2 配置Hive\t184
6．2．3 啟動(dòng)并驗(yàn)證Hive\t187
6．2．4 Hive的基本應(yīng)用\t189
6．3 ZooKeeper集群安裝\t190
6．3．1 ZooKeeper簡介\t190
6．3．2 安裝ZooKeeper\t191
6．3．3 配置ZooKeeper\t191
6．3．4 啟動(dòng)和測試\t193
6．4 HBase的安裝與應(yīng)用\t195
6．4．1 解壓并安裝HBase\t195
6．4．2 配置HBase\t196
6．4．3 啟動(dòng)并驗(yàn)證HBase\t199
6．4．4 HBase的基本應(yīng)用\t200
6．4．5 應(yīng)用HBase中常見問題及其解決辦法\t203
6．5 本章小結(jié)\t204
第7章 Sqoop和Kafka的安裝與應(yīng)用\t205
7．1 安裝部署Sqoop\t205
7．1．1 下載或復(fù)制Sqoop安裝包\t205
7．1．2 解壓并安裝Sqoop\t206
7．1．3 配置Sqoop\t206
7．1．4 啟動(dòng)并驗(yàn)證Sqoop\t208
7．1．5 測試Sqoop與MySQL的連接\t209
7．2 安裝部署Kafka集群\t211
7．2．1 下載或復(fù)制Kafka安裝包\t211
7．2．2 解壓縮Kafka安裝包\t211
7．2．3 配置Kafka集群\t211
7．2．4 Kafka的初步應(yīng)用\t213
7．3 本章小結(jié)\t218
第8章 Spark集群安裝與開發(fā)環(huán)境配置\t219
8．1 深入理解Spark\t219
8．1．1 Spark系統(tǒng)架構(gòu)\t219
8．1．2 關(guān)鍵概念\t221
8．2 安裝與配置Scala\t224
8．2．1 下載Scala安裝包\t225
8．2．2 安裝Scala\t225
8．2．3 啟動(dòng)并應(yīng)用Scala\t226
8．3 Spark集群的安裝與配置\t226
8．3．1 安裝模式\t226
8．3．2 Spark的安裝\t227
8．3．3 啟動(dòng)并驗(yàn)證Spark\t230
8．3．4 幾點(diǎn)說明\t234
8．4 開發(fā)環(huán)境安裝與配置\t236
8．4．1 IDEA簡介\t236
8．4．2 IDEA的安裝\t236
8．4．3 IDEA的配置\t238
8．5 本章小結(jié)\t243
第9章 Spark應(yīng)用基礎(chǔ)\t245
9．1 Spark程序的運(yùn)行模式\t245
9．1．1 Spark on Yarn-cluster\t245
9．1．2 Spark on Yarn-client\t246
9．2 Spark應(yīng)用設(shè)計(jì)\t247
9．2．1 分布式估算圓周率\t248
9．2．2 基于Spark MLlib的貸款風(fēng)險(xiǎn)預(yù)測\t265
9．3 本章小結(jié)\t285
第三篇數(shù)據(jù)處理與項(xiàng)目開發(fā)術(shù)
第10章交互式數(shù)據(jù)處理\t289
10．1 數(shù)據(jù)預(yù)處理\t289
10．1．1 查看數(shù)據(jù)\t289
10．1．2 數(shù)據(jù)擴(kuò)展\t291
10．1．3 數(shù)據(jù)過濾\t292
10．1．4 數(shù)據(jù)上傳\t293
10．2 創(chuàng)建數(shù)據(jù)倉庫\t294
10．2．1 創(chuàng)建Hive數(shù)據(jù)倉庫的基本命令\t294
10．2．2 創(chuàng)建Hive分區(qū)表\t296
10．3 數(shù)據(jù)分析\t299
10．3．1 基本統(tǒng)計(jì)\t299
10．3．2 用戶行為分析\t301
10．3．3 實(shí)時(shí)數(shù)據(jù)\t303
10．4 本章小結(jié)\t304
第11章協(xié)同過濾推薦系統(tǒng)\t305
11．1 推薦算法概述\t305
11．1．1 基于人口統(tǒng)計(jì)學(xué)的推薦\t305
11．1．2 基于內(nèi)容的推薦\t306
11．1．3 協(xié)同過濾推薦\t307
11．2 協(xié)同過濾推薦算法分析\t308
11．2．1 基于用戶的協(xié)同過濾推薦\t308
11．2．2 基于物品的協(xié)同過濾推薦\t310
11．3 Spark MLlib推薦算法應(yīng)用\t312
11．3．1 ALS算法原理\t312
11．3．2 ALS的應(yīng)用設(shè)計(jì)\t315
11．4 本章小結(jié)\t329
第12章銷售數(shù)據(jù)分析系統(tǒng)\t331
12．1 數(shù)據(jù)采集\t331
12．1．1 在Windows下安裝JDK\t331
12．1．2 在Windows下安裝Eclipse\t334
12．1．3 將WebCollector項(xiàng)目導(dǎo)入Eclipse\t335
12．1．4 在Windows下安裝MySQL\t336
12．1．5 連接JDBC\t339
12．1．6 運(yùn)行爬蟲程序\t340
12．2 在HBase集群上準(zhǔn)備數(shù)據(jù)\t342
12．2．1 將數(shù)據(jù)導(dǎo)入到MySQL\t342
12．2．2 將MySQL表中的數(shù)據(jù)導(dǎo)入到HBase表中\(zhòng)t344
12．3 安裝Phoenix中間件\t347
12．3．1 Phoenix架構(gòu)\t347
12．3．2 解壓安裝Phoenix\t348
12．3．3 Phoenix環(huán)境配置\t349
12．3．4 使用Phoenix\t350
12．4 基于Web的前端開發(fā)\t353
12．4．1 將Web前端項(xiàng)目導(dǎo)入Eclipse\t353
12．4．2 安裝Tomcat\t355
12．4．3 在Eclipse中配置Tomcat\t355
12．4．4 在Web瀏覽器中查看執(zhí)行結(jié)果\t359
12．5 本章小結(jié)\t361