数据处理
Spark大数据处理 原理 算法与实例 pdf
资源名称: 大数据处理 原理 算法与实例 第 章从 到 第 章体验 第 章 原理第 章 算子第 章 算法设计第 章善用 资源截图:
Hadoop大数据处理技术基础与实践 完整pdf
资源名称: 大数据处理技术基础与实践 完整 基础与实践第 章 概述 . 来源和动机 . 体系架构 . 与分布式开发 . 行业应用案例分析 . . 在门户网站的应用 . . 在搜索引擎中的应用 . . 在电商平台中的应用 . 小结第 章 安装与配置管理 . 实验准备 . 配置一个单节点环境 . . 运行一个虚拟系统 . . 配置网络 . . 创建新的用户组和用户 . . 上传文件到 并配置 、 环境 . . 修改 . 配置文件 . . 修改 主机名 . . 绑定 与 . . 关闭防火墙 . 节点之间的免密码
数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版
资源名称:数据算法: 大数据处理技巧 英文 原版 第 章二次排序:简介 第 章二次排序:详细示例 第 章 列表 第 章左外连接 第 章反转排序 第 章移动平均 第 章购物篮分析 第 章共同好友 第 章使用 实现推荐引擎 第 章基于内容的电影推荐 第 章使用马尔可夫模型的智能邮件营销 第 章 均值聚类 第 章 近邻 第 章朴素贝叶斯 第 章情感分析 第 章查找、统计和列出大图中的所有三角形 第 章 计数 第 章 测序 第 章 回归 第 章 趋势检验 第 章等位基因频率 第 章 检验 第 章皮尔逊相关系数 第
企业大数据处理 Spark、Druid、Flume与Kafka应用实践 完整pdf
资源名称:企业大数据处理 、 、 与 应用实践 完整 第一部分 准备工作 第 章 基础环境准备 第二部分 核心技术 第 章 详解 第 章 原理及部署 第 章 数据摄入 第 章 客户端 第 章 日志收集 第 章 分布式消息队列 第三部分 项目实践 第 章 数据平台 第 章 监控系统 资源截图:
Python数据处理 PDF_Python教程
资源名称: 数据处理 内容简介: 本书采用基于项目的方法,介绍用 完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括: 基础知识,如何从 、 、 、 和 文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和 中提取数据。 作者简介: 数据科学家,资深软件开发者。活跃于 软件基金会、 等社区。曾参与美国总统创新伙伴项目,是美国政府技术组织 的联合创始人。曾担任《华盛顿邮报》数据记者。 资深 开发者, 联合创始人。喜欢数据分析和获取、网页抓取