本書結合Python在數(shù)據分析領域的特點,介紹如何在數(shù)據平臺上集成使用Python。本書內容分為3大部分。第1部分(第1~3章)為搭建開發(fā)環(huán)境和導入測試數(shù)據;第2部分(第4~12章)為Python對HDFS、Hive、Pig、HBase、Spark的操作,主要是對常用API的說明;第3部分(第13~16章)是在前面章節(jié)的基礎上,介紹如何進行數(shù)據的分析、挖掘、可視化等內容。 本書不僅闡述了Python在大數(shù)據平臺上的應用技巧,而且關于大數(shù)據平臺管理和操作的介紹說明貫穿全書,因此對于希望學習大數(shù)據知識的讀者,本書同樣非常適合。