本書是《數(shù)據(jù)科學與大數(shù)據(jù)技術導論實驗》課程的實驗教材,可以配合主教材使用。主要內容包括:Linux環(huán)境部署、Hadoop開發(fā)環(huán)境部署、網頁數(shù)據(jù)采集、大數(shù)據(jù)去重、大數(shù)據(jù)*值計算、大數(shù)據(jù)排序、大數(shù)據(jù)倒排索引、大數(shù)據(jù)平均值計算、大數(shù)據(jù)單表關聯(lián)、大數(shù)據(jù)可視化。本書選材先進、特點鮮明,注重應用。通過本書所提供的實驗練習,可以提高大數(shù)據(jù)處理能力??捎糜诖髷?shù)據(jù)實驗教材,也可以作為科學技術人員學習和應用大數(shù)據(jù)的科技參考書。