资源名称:大数据与机器学习:实践方法与行业案例
内容简介:
本书从企业实践出发,内容覆盖数据、平台、分析和应用等企业内数据流转的主要环节。布局上,按照数据与平台篇、分析篇和应用篇分别撰写。数据与平台篇(第1~3章),立足找到数据、整合数据、使用数据三个角度,介绍数据在企业内的分布和处理逻辑,以便快速为分析准备素材。分析篇(第4~11章),选取企业实际案例,介绍常用的数据挖掘与机器学习算法,以业务场景为导向展示数据分析过程和技巧。应用篇(第12~15章),选取当前主流的四个应用场景,介绍如何实现数据驱动,让数据“自动”流转于各个环节。
资源目录:
第1章概述
1.1名词演化
1.2基本内容
1.3数据智慧
第2章线性回归方法
2.1多元线性回归
2.2压缩方法:岭回归与Lasso
2.3*Lasso 模型的求解与理论性质
2.4损失函数加罚的建模框架
2.5上机实践
第3章线性分类方法
3.1分类问题综述与评价准则
3.2Logistic回归
3.3线性判别
3.4上机实践
第4章模型评价与选择
4.1基本概念
4.2*理论方法
4.3数据重利用方法
4.4上机实践
第5章决策树与组合方法
5.1决策树
5.2Bagging
5.3Boosting
5.4随机森林
5.5上机实践
第6章神经网络与深度学习
6.1神经网络
6.2深度学习
6.3上机实践
第7章支持向量机
7.1线性可分支持向量机
7.2软间隔支持向量机
7.3一些拓展
7.4上机实践
第8章聚类分析
8.1基于距离的聚类
8.2基于模型和密度的聚类
8.3稀疏聚类
8.4双向聚类
8.5上机实践
第9章推荐系统
9.1基于邻居的推荐
9.2潜在因子与矩阵分解算法
9.3上机实践
第10章大数据案例分析
10.1智能手机用户监测数据案例分析
10.2美国航空数据案例分析
参考文献
大数据挖掘与统计机器学习
资源截图: