注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書教育/教材/教輔教材研究生/本科/??平滩?/a>分布式統(tǒng)計計算

分布式統(tǒng)計計算

分布式統(tǒng)計計算

定 價:¥49.00

作 者: 馮興東,賀莘
出版社: 中國人民大學出版社
叢編項: 新編21世紀研究生系列教材 應用統(tǒng)計碩士
標 簽: 暫缺

購買這本書可以去


ISBN: 9787300315867 出版時間: 2023-04-01 包裝: 平裝
開本: 16開 頁數: 字數:  

內容簡介

  本書著重介紹分布式計算的思想其及在統(tǒng)計學以及機器學習中的應用,將傳統(tǒng)統(tǒng)計學與機器學習中的經典方法和現代分布式算法相結合,強化學生的分布式統(tǒng)計計算的編程能力和對相關方法的理解,努力在統(tǒng)計計算和分布式計算之間搭建起一座橋梁。本書亦圍繞統(tǒng)計學中的不同問題提供了豐富的實際案例以及詳細的實現代碼,從而幫助使用者快速理解相關分布式的核心思想,提升編程能力,進而可以熟練地進行大數據的統(tǒng)計分析和研究。本書可作為統(tǒng)計學與數據科學等相關專業(yè)高年級本科生與研究生教材,也可用作相關大數據分析方向從業(yè)者與研究者的參考書。

作者簡介

  馮興東 上海財經大學統(tǒng)計與管理學院院長、統(tǒng)計學教授、博士生導師。研究領域為數據降維、穩(wěn)健回歸、分位數回歸以及在經濟問題中的應用、大數據統(tǒng)計計算、強化學習等,在國際頂級統(tǒng)計學期刊Journal of the American Statistical Association、Annals of Statistics、Journal of the Royal Statistical Society Series B、Biometrika以及人工智能頂級會議NeurIPS上發(fā)表論文多篇。2018年入選國際統(tǒng)計學會推選會員,2019年擔任全國青年統(tǒng)計學家協(xié)會副會長以及全國統(tǒng)計教材編審委員會第七屆委員會專業(yè)委員(數據科學與大數據應用組),2020年成為第八屆國務院學位委員會學科評議組(統(tǒng)計學)成員,2022年擔任全國應用統(tǒng)計專業(yè)學位研究生教育指導委委員,2023年擔任全國工業(yè)統(tǒng)計學教學研究會副會長以及中國數學會概率統(tǒng)計分會常務理事,2022年起兼任國際統(tǒng)計學權威期刊Annals of Applied Statistics編委以及國內統(tǒng)計學權威期刊《統(tǒng)計研究》編委。賀 莘 上海財經大學統(tǒng)計與管理學院副教授、博士生導師。主要研究領域為統(tǒng)計機器學習及其在經濟金融、醫(yī)學健康中的應用,研究成果發(fā)表在Journal of Machine Learning Research、Journal of the American Statistical Association、Journal of Computational and Graphical Statistics、Electronic Journal of Statistics、Statistica Sinica、Thyroid等國際權威期刊上。主持國家自然科學基金青年項目一項以及上海市浦江人才計劃項目一項。

圖書目錄

第 1 章 Apache Spark 簡介
1.1 Apache Spark 的歷史與現狀
1.2 安裝和運行 Apache Spark
1.3 Apache Spark 編程簡介
1.4 Scala 語言簡介
1.4.1 Scala 開發(fā)環(huán)境配置及 IntelliJ IDEA
1.4.2 Scala 編程簡介
1.4.3 PySpark 編程簡介
1.5 Spark 編程
1.5.1 Spark 系統(tǒng)簡介
1.5.2 彈性分布式數據集
1.5.3 RDD 文件上的操作
1.5.4 Spark 中兩個抽象概念
1.6 公共數據集

第 2 章 Breeze 程序包
2.1 創(chuàng)建向量、矩陣及其簡單計算
2.2 整行或整列的運算
2.3 常用數學計算
2.4 常用分布
2.5 基于 Breeze 包的分布式計算

第 3 章 隨機模擬和統(tǒng)計推斷
3.1 隨機數的產生
3.1.1 逆累積分布函數法
3.1.2 拒絕法
3.1.3 示例:從回歸模型中模擬數據
3.2 EM 優(yōu)化
3.2.1 EM 算法
3.2.2 收斂性分析
3.2.3 分布式 EM 算法
3.2.4 示例:高斯混合模型

第 4 章 馬爾科夫鏈蒙特卡洛方法
4.1 Metropolis-Hastings 算法
4.2 Slice 取樣法
4.3 Gibbs 取樣法

第 5 章 優(yōu)化算法
5.1 數值計算方法
5.1.1 (隨機) 梯度下降算法
5.1.2 示例:分布式的線性回歸估計
5.2 近端梯度算法
5.2.1 算法介紹
5.2.2 示例:基于近端梯度算法的分布式 Lasso 回歸參數估計
5.3 交替方向乘子法
5.3.1 算法介紹
5.3.2 示例:分位數回歸分布式參數估計
5.4 有限內存 BFGS 算法

第 6 章 自舉法
6.1 自由自舉法
6.2 子集合自舉法

第 7 章 常用統(tǒng)計機器學習方法
7.1 聚類分析
7.1.1 K 組中心法
7.1.2 隱狄利克雷分配法
7.1.3 功效迭代聚類法
7.2 分類分析
7.2.1 邏輯回歸
7.2.2 線性支持向量機
7.2.3 線性判別分析
7.2.4 決策樹
7.3 數據降維
7.3.1 基于正則化的稀疏性方法
7.3.2 示例:SCAD、MCP 等正則化項的 Scala 代碼實現
7.3.3 主成分分析
7.3.4 奇異值分解
7.3.5 示例:基于分布式計算的主成分分析
7.4 集成學習方法
7.4.1 基于 Bagging 算法――以隨機森林為例
7.4.2 基于 Boosting 算法――以 AdaBoost 為例
7.4.3 基于樹的集成學習算法
7.4.4 示例:航班延誤預測分類

第 8 章 主流分布式算法簡介
8.1 分治法
8.1.1 算法思想介紹
8.1.2 分治法在統(tǒng)計學習中的應用
8.1.3 示例:線性支持向量機
8.2 基于梯度更新的分布式算法
8.2.1 算法介紹
8.2.2 示例:基于近端梯度算法的 Lasso 問題求解
8.2.3 示例:非參數嶺回歸
8.3 聯邦學習算法簡介
8.3.1 算法分類
8.3.2 聯邦平均算法介紹
8.3.3 安全聯邦線性回歸

第 9 章 案例集
9.1 案例一:基于 MM 算法和 EM 算法的負二項分布參數估計
9.1.1 負二項分布
9.1.2 MM 算法的負二項分布參數估計求解
9.1.3 EM 算法的負二項分布參數估計求解
9.1.4 數值模擬
9.1.5 實證分析
9.1.6 結論
9.1.7 源碼附錄
9.2 案例二:基于 EM 算法的混合指數分布參數估計
9.2.1 混合指數分布簡介
9.2.2 EM 算法
9.2.3 Spark 實現
9.2.4 效果評估
9.2.5 源碼附錄
9.3 案例三:基于 EM 算法的有限混合泊松分布的參數估計
9.3.1 有限混合泊松分布簡介
9.3.2 參數估計的 EM 算法
9.3.3 EM 加速算法――均方外推算法
9.3.4 實驗設計
9.3.5 SQUAREM 加速算法比較
9.3.6 源碼附錄
9.4 案例四:基于不同優(yōu)化算法的邏輯回歸模型參數的估計
9.4.1 常用優(yōu)化算法簡介
9.4.2 邏輯回歸模型簡介
9.4.3 模擬數據應用不同優(yōu)化算法的分布式實現及比較
9.4.4 源碼附錄
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號