资源名称:BIG DATA大数据系统构建:可扩展实时数据系统构建原理与最佳实践
内容简介:
随着社交网络、网络分析和智能型电子商务的兴起,传统的数据库系统显然已无法满足海量数据的管理需求。 作为一种新的处理模式,大数据系统应运而生,它使用多台机器并行工作,能够对海量数据进行存储、处理、分析,进而帮助用户从中提取对优化流程、实现高增长率的有用信息,做更为精准有效的决策。 但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。
本书将教你充分利用集群硬件优势的Lambda架构,以及专门用来捕获和分析网络规模数据的新工具,来创建这些系统。它将描述一个可扩展的、易于理解大数据系统的方法——可以由小团队构建并运行。本书共18章,除了介绍基本概念,其他章节采用“理论+示例”的方式来阐释相关概念,并使用现实世界中的工具加以论证。其中,第1章介绍了数据系统的原理,给出了Lambda架构的概述,并概述了构建任何数据系统的广义方法。第2~9章集中阐述Lambda架构的批处理层。第10章和第11章集中阐述服务层,让读者了解只批量写入的特定数据库——这些数据库比传统数据库更简单,它们具有出色的性能,并具备可操作性、稳健性等特点。第12~17章集中阐述速度层,让读者更明确地了解NoSQL数据库、流处理和管理增量计算的复杂性。 第18章通过综合回顾Lambda架构的相关知识,帮助读者了解增量批处理、基本Lambda架构的变种,以及如何充分利用资源。
资源目录:
译 者 序
前 言
关于本书
致 谢
第1章 大数据的新范式1
第一部分 批处理层
第2章 大数据的数据模型24
第3章 大数据的数据模型:示例44
第4章 批处理层的数据存储51
第5章 批处理层的数据存储:示例62
第6章 批处理层79
第7章 批处理层:示例104
第8章 批处理层示例:架构和算法131
第9章 批处理层示例:实现147
第二部分 服务层
第10章 服务层概述168
第11章 服务层:示例184
第三部分 速度层
第12章 实时视图194
第13章 实时视图:示例206
第14章 队列和流处理211
第15章 队列和流处理:示例227
第16章 微批量流处理239
第17章 微批量流处理:示例253
第18章 深入Lambda架构268
资源截图: