数据处理
企业大数据处理 Spark、Druid、Flume与Kafka应用实践 完整pdf
资源名称:企业大数据处理 、 、 与 应用实践 完整 第一部分 准备工作 第 章 基础环境准备 第二部分 核心技术 第 章 详解 第 章 原理及部署 第 章 数据摄入 第 章 客户端 第 章 日志收集 第 章 分布式消息队列 第三部分 项目实践 第 章 数据平台 第 章 监控系统 资源截图:
用Apache Spark进行大数据处理-第一部分:入门介绍 中文
资源名称:用 进行大数据处理 第一部分 入门介绍 中文 本文档主要讲述的是用 进行大数据处理 第一部分:入门介绍; 是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在 年由加州大学伯克利分校的 开发,并于 年成为 的开源项目之一。 资源截图:
Python数据处理 PDF_Python教程
资源名称: 数据处理 内容简介: 本书采用基于项目的方法,介绍用 完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括: 基础知识,如何从 、 、 、 和 文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和 中提取数据。 作者简介: 数据科学家,资深软件开发者。活跃于 软件基金会、 等社区。曾参与美国总统创新伙伴项目,是美国政府技术组织 的联合创始人。曾担任《华盛顿邮报》数据记者。 资深 开发者, 联合创始人。喜欢数据分析和获取、网页抓取
Spark大数据处理技术 完整pdf
资源名称: 大数据处理技术 完整 第 章 系统概述 大数据处理框架 大数据处理框架 表达能力 子系统 小结 第 章 及编程接口 程序 分区( ) 优先位置( ) 依赖关系( ) 分区计算( ) 分区函数( ) 创建操作 集合创建操作 存储创建操作 转换操作 基本转换操作 键值 转换操作 再论 依赖关系 控制操作( ) 行动操作( ) 集合标量行动操作 存储行动操作 小结 第 章 运行模式及原理 运行模式概述 运行模式列表 基本工作流程 相关基本类 模式 部署及程序运行 内部实现原理 模式 部署及程序运行