数据处理

深入理解大数据:大数据处理与编程实践

资源名称:深入理解大数据:大数据处理与编程实践 内容简介: 以大数据处理主流平台 为核心,介绍 , , ,以及 的基本设计思想、工作原理、系统构架、以及详细的大数据处理编程技术。   特点:   ( ) 重点放在教读者算法设计实现,从基础算法,到应用编程案例,解决实际问题。   ( ) 作者多年的教学研究实践,课程设计沉淀,可以更深入地讨论大数据。   ( ) 来自业界 真实的实践经验和案例积累。 资源目录: 推荐序一 推荐序二 推荐序三 丛书序言 前言 第一部分 系统 第 章大数据处理技术简介 并行计算

Spark快速数据处理

资源名称: 快速数据处理 内容简介: 是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的 实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。 内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。   本书系统讲解 的使用方法,包括如何在多种机器上安装 ,如何配置一个 集群,如何在交互模式下运行第一个 作业,如何在 集群上构建一个生产级的脱机 独立作业,如何与 集群建立连接和使