大数

R与Hadoop大数据分析实战

资源名称: 与 大数据分析实战 内容简介: 本书全面而系统地讲解了如何将 语言与 技术结合并应用于大数据分析,不仅系统且深入地阐释了 与 集成技术的工具、方法、原则和最佳实践,而且通过大量实践案例深入剖析各种常见问题,能为用户高效利用 语言与 技术进行大数据处理提供翔实指导。 全书分为四部分,共 章:第一部分(第 章)是基础知识,主要讲解 语言以及 的安装过程、计算原理和基本概念;第二部分(第 章)是初级应用,主要讲解 、 和 三种实现方案;第三部分(第 章)是高级实例,主要以 为技术背景,讲解多个实际应

BIG DATA大数据系统构建:可扩展实时数据系统构建原理与最佳实践

资源名称: 大数据系统构建:可扩展实时数据系统构建原理与最佳实践 内容简介: 随着社交网络、网络分析和智能型电子商务的兴起,传统的数据库系统显然已无法满足海量数据的管理需求。 作为一种新的处理模式,大数据系统应运而生,它使用多台机器并行工作,能够对海量数据进行存储、处理、分析,进而帮助用户从中提取对优化流程、实现高增长率的有用信息,做更为精准有效的决策。 但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。 本书将教你充分利用集群硬件优势的 架构,以及专门用来捕获和分析网络规模数据

Splunk大数据分析

资源名称: 大数据分析 内容简介: 是一种典型的大数据处理工具,能够高效地按时序对数据进行存储、索引、访问,已广泛应用在多个领域。本书是介绍如何实时处理大数据并从中获得商业价值的一本实用指南。本书通过真实的大数据分析项目,从数据导入、访问、挖掘和可视化角度全面而系统地介绍 的基本概念和使用方法,以帮助读者快速掌握 。 全书共 章,分为四个部分:第一部分(第 章)介绍 的基本操作,包括利用 进行数据收集、处理、分析及结果可视化等的基本操作和命令,以及使用日志文件创建高级数据分析报表的方法;第二部分(第 章)

大数据概论

资源名称:大数据概论 内容简介: 本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的 理论、 数据库、复杂网络、 分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。 资源截图:

Spark大数据分析实战 高彦杰 完整pdf

资源名称: 大数据分析实战 高彦杰 完整 第 章 简介 初识 生态系统 架构与运行逻辑 弹性分布式数据集 简介 算子分类 本章小结 第 章 开发与环境配置 应用开发环境配置 使用 开发 程序 使用 进行交互式数据分析 远程调试 程序 编译 配置 源码阅读环境 本章小结 第 章 简介 为什么使用 架构分析 简介 架构 原理剖析 简介 的使用简介 体系结构 简介 中的聚类和分类 本章小结 第 章 架构日志分析流水线 日志分析概述 日志分析指标 架构 构建日志分析数据流水线 用 进行日志采集 用 将日志汇总 用

大数据架构师指南

资源名称:大数据架构师指南 内容简介: 如果你是一名 工程师, 希望你在一周内提交一份公司未来 系统基础架构的初步建议; 如果你是一位 营销人员,客户需要你在一周内向他汇报未来大数据系统的大致技术方向; 在这个信息严重过剩的时代,一周内从浩渺的技术细节的海洋中抓住关键的技术脉络,并进一步提出有一定理论依据的技术思考,这几乎是不可能完成的任务。 您是否想过阅读一本关于大数据的图书帮助解决如上问题? 浩如烟海的大数据领域图书可以大致归纳为三类:第一类是描述大数据的应用前景与社会意义;第二类是研讨大数据作为一个

大数据Spark企业级实战

资源名称:大数据 企业级实战 内容简介: 是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是 软件基金会下所有开源项目中三大开源项目之一。   在 理念的指引下, 基于 成功地构建起了大数据处理的一体化解决方案,将 、 、 、 、 等大数据计算模型统一到一个技术堆栈中,开发者使用一致的 操作 中的所有功能;更为重要的是 的 、 、 、 等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了 在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得 正在加速成为大数据