這是一本技術深度與企業(yè)實踐并重的著作,由百度頂尖的Hadoop技術工程師撰寫,是百度Hadoop技術實踐經驗的總結。本書使用、實現原理、運維和開發(fā)4個方面對Hadoop的核心技術進行了深入的講解:(1)使用:詳細講解了HDFS存儲系統(tǒng)、MapReduce計算框架,以及HDFS的命令系統(tǒng);(2)原理:結合源代碼,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作業(yè)調度系統(tǒng)等重要技術和組件的架構設計、工作機制和實現原理;(3)運維:結合百度的實際生產環(huán)境,詳細講解了Hadoop集群的安裝、配置、測試以及管理和運維;(4)開發(fā):詳細講解了HadoopStreaming、Pipes的使用和開發(fā)實踐,以及MapReduce的編程實踐和常見問題。與市面上已有的Hadoop相比,本書的最大不同之處是它直切企業(yè)應用和實踐Hadoop技術的痛點,深入講解了企業(yè)最需要和最頭疼的技術和問題,內容上非常聚焦。