本書是一本通過實戰(zhàn)教初學者學習爬取數據、清洗和組織數據進行分析和可視化的Python 讀物。書中案例均經過實戰(zhàn)檢驗,筆者在實踐過程中深感采集數據、清洗和組織數據的重要性,作為 一名數據行業(yè)的“碼農”,數據就是沃土,沒有數據,我們將無田可耕。 本書共13 章,包括6 個核心主題,其一是Python 基礎入門,包括環(huán)境配置、基本操作、數據類型、語句和函數;其二是Python 爬蟲的構建,包括網頁結構解析、爬蟲流程設計、代碼優(yōu)化、爬蟲效率優(yōu)化、無線端的數據采集、容錯處理、反防爬蟲、表單交互和模擬頁面點擊;其三是Python數據庫應用,包括MongoDB、MySQL 在Python 中的連接與應用;其四是數據清洗和組織,包括NumPy 數組知識,以及pandas 數據的讀寫、分組、變形,缺失值、異常值和重復值處理,時序數據處理和正則表達式的使用等;其五是綜合應用實例,幫助讀者貫穿爬蟲、數據清洗與組織的過程;最后是數據可視化,包括matplotlib 和pyecharts 兩個庫的使用,涉及餅圖、柱形圖、線圖、詞云圖等圖形,幫助讀者進入可視化的殿堂。 本書以實戰(zhàn)為主,適合Python 初學者及高等院校相關專業(yè)的學生閱讀,也適合Python 培訓機構作為實驗教材。