大数

大数据架构师指南

资源名称:大数据架构师指南 内容简介: 如果你是一名 工程师, 希望你在一周内提交一份公司未来 系统基础架构的初步建议; 如果你是一位 营销人员,客户需要你在一周内向他汇报未来大数据系统的大致技术方向; 在这个信息严重过剩的时代,一周内从浩渺的技术细节的海洋中抓住关键的技术脉络,并进一步提出有一定理论依据的技术思考,这几乎是不可能完成的任务。 您是否想过阅读一本关于大数据的图书帮助解决如上问题? 浩如烟海的大数据领域图书可以大致归纳为三类:第一类是描述大数据的应用前景与社会意义;第二类是研讨大数据作为一个

大数据时代的算法:机器学习、人工智能及其典型实例

资源名称:大数据时代的算法:机器学习、人工智能及其典型实例 内容简介: 《大数据时代的算法:机器学习、人工智能及其典型实例》介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。《大数据时代的算法:机器学习、人工智能及其典型实例》涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。 《大数据时代的算法:机器学习、人工智能及其典型

大数据分析:方法与应用

资源名称:大数据分析:方法与应用 内容简介: 本书介绍数据挖掘、统计学习和模式识别中与大数据分析相关的理论、方法及工具。理论学习的目标是使学生掌握复杂数据的分析与建模;方法学习的目标是使学生能够按照实证研究的规范和数据挖掘的步骤进行大数据研发,工具学习的目标是使学生熟练掌握一种数据分析的语言。本书内容由 章构成:大数据分析概述,数据挖掘流程,有指导的学习,无指导的学习,贝叶斯分类和因果学习,高维回归及变量选择,图模型,客户关系管理、社会网络分析、自然语言模型和文本挖掘。 本书可用做统计学、管理学、计算机科

触手可及的大数据分析工具:Tableau案例集

资源名称:触手可及的大数据分析工具 案例集 内容简介: 《触手可及的大数据分析工具: 案例集》对 的产品、优势、 的新特性及其功能做了全面的介绍,并且从 个不同行业的案例入手,让你在阅读本书后能够从一个新手成长为能够创建出复杂仪表板的高手。 《触手可及的大数据分析工具: 案例集》分为五个部分共 章: 使用概述、新手上路、成功晋级、高手秘籍以及实际应用。 使用概述包含四章,分别从为何要进行数据可视化、 的发展历程、 的产品介绍、 的新特性、 的应用优势以及如何利用 进行数据连接和了解工作区几个方面做了详尽的

企业大数据处理 Spark、Druid、Flume与Kafka应用实践 完整pdf

资源名称:企业大数据处理 、 、 与 应用实践 完整 第一部分 准备工作 第 章 基础环境准备 第二部分 核心技术 第 章  详解 第 章  原理及部署 第 章  数据摄入 第 章  客户端 第 章 日志收集 第 章 分布式消息队列 第三部分 项目实践 第 章 数据平台 第 章 监控系统 资源截图:

Spark大数据处理技术 完整pdf

资源名称: 大数据处理技术 完整 第 章 系统概述 大数据处理框架 大数据处理框架 表达能力 子系统 小结 第 章 及编程接口 程序 分区( ) 优先位置( ) 依赖关系( ) 分区计算( ) 分区函数( ) 创建操作 集合创建操作 存储创建操作 转换操作 基本转换操作 键值 转换操作 再论 依赖关系 控制操作( ) 行动操作( ) 集合标量行动操作 存储行动操作 小结 第 章 运行模式及原理 运行模式概述 运行模式列表 基本工作流程 相关基本类 模式 部署及程序运行 内部实现原理 模式 部署及程序运行

实时大数据分析 基于Storm Spark技术的实时应用 中文PDF

资源名称:实时大数据分析 基于 技术的实时应用 中文 第 章 大数据技术前景及分析平台 大数据的概念 大数据的维度范式 大数据生态系统 大数据基础设施 大数据生态系统组件 构建业务解决方案 数据集处理 解决方案实施 呈现 分布式批处理 分布式数据库( ) 数据库的优势 选择 数据库 实时处理 电信或移动通信场景 运输和物流 互联的车辆 金融部门 本章小结 第 章 熟悉 概述 的发展 的抽象概念 流 拓扑 任务 工作者 的架构及其组件 集群 集群 如何以及何时使用 的内部特性 的并行性 的内部消息处理 本章

实战大数据

资源名称:实战大数据 内容简介: 数据是重要资产 已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。 本书共 章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例, 云文件系统实例。 本书适合大数据技术初学者、大数据从业人员和

Spark大数据分析实战 高彦杰 完整pdf

资源名称: 大数据分析实战 高彦杰 完整 第 章 简介 初识 生态系统 架构与运行逻辑 弹性分布式数据集 简介 算子分类 本章小结 第 章 开发与环境配置 应用开发环境配置 使用 开发 程序 使用 进行交互式数据分析 远程调试 程序 编译 配置 源码阅读环境 本章小结 第 章 简介 为什么使用 架构分析 简介 架构 原理剖析 简介 的使用简介 体系结构 简介 中的聚类和分类 本章小结 第 章 架构日志分析流水线 日志分析概述 日志分析指标 架构 构建日志分析数据流水线 用 进行日志采集 用 将日志汇总 用