资源名称:Hadoop大数据处理 中文pdf
D11章大数据处理概论1
1.1什么是大数据2
1.2数据处理平台的基础架构5
1.3大数据处理的存储7
1.3.1提升容量7
1.3.2提升吞吐量11
1.4大数据处理的计算模式17
1.4.1多处理技术17
1.4.2并行计算20
1.5大数据处理系统的容错性26
1.5.1数据存储容错27
1.5.2计算任务容错28
1.6大数据处理的云计算变革30
本章参考文献32
D12章基于Hadoop的大数据处理架构35
2.1Google核心云计算技术35
2.1.1并行计算编程模型MapReduce36
2.1.2分布式文件系统GFS38
2.1.3分布式结构化数据存储BigTable39
2.2Hadoop云计算技术及发展41
2.2.1Hadoop的由来41
2.2.2Hadoop原理与运行机制42
2.2.3Hadoop相关技术及简介45
2.2.4Hadoop技术的发展与演进47
2.3基于云计算的大数据处理架构48
2.4基于云计算的大数据处理技术的应用51
2.4.1百度51
2.4.2阿里巴巴56
2.4.3腾讯58
2.4.4华为60
2.4.5中国移动62
2.5Hadoop运行实践63
本章参考文献64
D13章MapReduce计算模式66
3.1MapReduce原理66
3.2MapReduce工作机制69
3.2.1MapReduce运行框架的组件70
3.2.2MapReduce作业的运行流程70
3.2.3作业调度72
3.2.4异常处理73
3.3MapReduce应用开发74
3.3.1MapReduce应用开发流程74
3.3.2通过Web界面分析MapReduce应用76
3.3.3MapReduce任务执行的单步跟踪78
3.3.4多个MapReduce过程的组合模式79
3.3.5使用其他语言编写MapReduce程序81
3.3.6不同数据源的数据联结(Join)82
3.4MapReduce设计模式87
3.4.1计数(Counting)88
3.4.2分类(Classfication)88
3.4.3过滤处理(Filtering)89
3.4.4排序(Sorting)89
3.4.5去重计数(DistinctCounting)90
3.4.6相关计数(Cross-Correlation)91
3.5MapReduce算法实践92
3.5.1*短路径算法92
3.5.2反向索引算法94
3.5.3PageRank算法95
3.6MapReduce性能调优97
3.6.1MapReduce参数配置优化97
3.6.2使用Cominber减少数据传输99
........
资源截图: