资源名称:Spark核心技术与高级应用
内容简介:
本书共分为四大部分:
基础篇(1~10章)介绍了Spark的用途、扩展、安装、运行模式、程序开发、编程模型、工作原理,以及SparkSQL、SparkStreaming、MLlib、GraphX、Bagel等重要的扩展;
实战篇(11~14)讲解了搜索结果的排序、个性化推荐系统、日志分析系统、自然语言处理、数据挖掘等方面的案例;
高级篇(15~18)则讲解了Spark的调度管理、存储管理、监控管理、性能优化、最佳实践以及重点算法的解读;
扩展篇(19~20)讲解了Sparkjob-server和Tachyon。
资源目录:
前言
基础篇
第1章Spark简介2
第2章Spark部署和运行11
第3章Spark程序开发27
第4章编程模型44
第5章作业执行解析59
第6章SparkSQL与DataFrame73
第7章深入了解SparkStreaming97
第8章SparkMLlib与机器学习116
第9章GraphX图计算框架与应用148
第10章SparkR(RonSpark)167
实战篇
第11章大数据分析系统188
第12章系统资源分析平台200
第13章在Spark上训练LR模型215
第14章获取二级邻居关系图225
高级篇
第15章调度管理238
第16章存储管理254
第17章监控管理264
第18章性能调优273
第19章Spark—jobserver实践282
第20章SparkTachyon实战292
资源截图: