资源名称:Hadoop Spark 大数据巨量分析与机器学习整合开发实战 完整pdf
第1章 大数据与机器学习 1
第2章 VirtualBox虚拟机软件的安装 11
第3章 Ubuntu Linux操作系统的安装 23
第4章 Hadoop Single Node Cluster的安装 46
第5章 Hadoop Multi Node Cluster的安装 69
第6章 Hadoop HDFS命令 104
第7章 Hadoop MapReduce 122
第8章 Spark的安装与介绍 133
第9章 Spark RDD 159
第10章 Spark的集成开发环境 195
第11章 创建推荐引擎 236
第12章 StumbleUpon数据集 282
第13章 决策树二元分类 292
第14章 逻辑回归二元分类 326
第15章 支持向量机SVM二元分类 337
第16章 朴素贝叶斯二元分类 346
第17章 决策树多元分类 355
第18章 决策树回归分析 373
第19章 使用ApacheZeppelin 数据可视化 394
资源截图: