数据处理

Hadoop大数据处理技术基础与实践 完整pdf

资源名称: 大数据处理技术基础与实践 完整 基础与实践第 章 概述 . 来源和动机 . 体系架构 . 与分布式开发 . 行业应用案例分析 . . 在门户网站的应用 . . 在搜索引擎中的应用 . . 在电商平台中的应用 . 小结第 章 安装与配置管理 . 实验准备 . 配置一个单节点环境 . . 运行一个虚拟系统 . . 配置网络 . . 创建新的用户组和用户 . . 上传文件到 并配置 、 环境 . . 修改 . 配置文件 . . 修改 主机名 . . 绑定 与 . . 关闭防火墙 . 节点之间的免密码

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版

资源名称:数据算法: 大数据处理技巧 英文 原版 第 章二次排序:简介 第 章二次排序:详细示例 第 章 列表 第 章左外连接 第 章反转排序 第 章移动平均 第 章购物篮分析 第 章共同好友 第 章使用 实现推荐引擎 第 章基于内容的电影推荐 第 章使用马尔可夫模型的智能邮件营销 第 章 均值聚类 第 章 近邻 第 章朴素贝叶斯 第 章情感分析 第 章查找、统计和列出大图中的所有三角形 第 章 计数 第 章 测序 第 章 回归 第 章 趋势检验 第 章等位基因频率 第 章 检验 第 章皮尔逊相关系数 第

Python数据处理 PDF_Python教程

资源名称: 数据处理 内容简介: 本书采用基于项目的方法,介绍用 完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括: 基础知识,如何从 、 、 、 和 文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和 中提取数据。 作者简介: 数据科学家,资深软件开发者。活跃于 软件基金会、 等社区。曾参与美国总统创新伙伴项目,是美国政府技术组织 的联合创始人。曾担任《华盛顿邮报》数据记者。 资深 开发者, 联合创始人。喜欢数据分析和获取、网页抓取

深入理解大数据:大数据处理与编程实践

资源名称:深入理解大数据:大数据处理与编程实践 内容简介: 以大数据处理主流平台 为核心,介绍 , , ,以及 的基本设计思想、工作原理、系统构架、以及详细的大数据处理编程技术。   特点:   ( ) 重点放在教读者算法设计实现,从基础算法,到应用编程案例,解决实际问题。   ( ) 作者多年的教学研究实践,课程设计沉淀,可以更深入地讨论大数据。   ( ) 来自业界 真实的实践经验和案例积累。 资源目录: 推荐序一 推荐序二 推荐序三 丛书序言 前言 第一部分 系统 第 章大数据处理技术简介 并行计算

企业大数据处理 Spark、Druid、Flume与Kafka应用实践 完整pdf

资源名称:企业大数据处理 、 、 与 应用实践 完整 第一部分 准备工作 第 章 基础环境准备 第二部分 核心技术 第 章  详解 第 章  原理及部署 第 章  数据摄入 第 章  客户端 第 章 日志收集 第 章 分布式消息队列 第三部分 项目实践 第 章 数据平台 第 章 监控系统 资源截图:

用Apache Spark进行大数据处理-第一部分:入门介绍 中文

资源名称:用 进行大数据处理 第一部分 入门介绍 中文 本文档主要讲述的是用 进行大数据处理 第一部分:入门介绍; 是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在 年由加州大学伯克利分校的 开发,并于 年成为 的开源项目之一。 资源截图:

Spark大数据处理技术 完整pdf

资源名称: 大数据处理技术 完整 第 章 系统概述 大数据处理框架 大数据处理框架 表达能力 子系统 小结 第 章 及编程接口 程序 分区( ) 优先位置( ) 依赖关系( ) 分区计算( ) 分区函数( ) 创建操作 集合创建操作 存储创建操作 转换操作 基本转换操作 键值 转换操作 再论 依赖关系 控制操作( ) 行动操作( ) 集合标量行动操作 存储行动操作 小结 第 章 运行模式及原理 运行模式概述 运行模式列表 基本工作流程 相关基本类 模式 部署及程序运行 内部实现原理 模式 部署及程序运行