大数

大数据架构师指南

资源名称:大数据架构师指南 内容简介: 如果你是一名 工程师, 希望你在一周内提交一份公司未来 系统基础架构的初步建议; 如果你是一位 营销人员,客户需要你在一周内向他汇报未来大数据系统的大致技术方向; 在这个信息严重过剩的时代,一周内从浩渺的技术细节的海洋中抓住关键的技术脉络,并进一步提出有一定理论依据的技术思考,这几乎是不可能完成的任务。 您是否想过阅读一本关于大数据的图书帮助解决如上问题? 浩如烟海的大数据领域图书可以大致归纳为三类:第一类是描述大数据的应用前景与社会意义;第二类是研讨大数据作为一个

大数据分析:方法与应用

资源名称:大数据分析:方法与应用 内容简介: 本书介绍数据挖掘、统计学习和模式识别中与大数据分析相关的理论、方法及工具。理论学习的目标是使学生掌握复杂数据的分析与建模;方法学习的目标是使学生能够按照实证研究的规范和数据挖掘的步骤进行大数据研发,工具学习的目标是使学生熟练掌握一种数据分析的语言。本书内容由 章构成:大数据分析概述,数据挖掘流程,有指导的学习,无指导的学习,贝叶斯分类和因果学习,高维回归及变量选择,图模型,客户关系管理、社会网络分析、自然语言模型和文本挖掘。 本书可用做统计学、管理学、计算机科

大数据Hadoop快速入门教程

教程介绍 实现了一个分布式文件系统,简称 。 有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。本课程是大数据学科的入门教程,将会为您讲述 的具体内容,对大数据感兴趣的一定不要错过!学习地址百度: 天翼: 微云: : 文件信息

拥抱大数据新常态下的数据分析典型案例

资源名称:拥抱大数据新常态下的数据分析典型案例 内容简介: 本书首先介绍了大数据的由来与数据分析师的职业前景,概述了大数据的特点及其分析方法,引发读者对数据分析师的向往。然后介绍了如今最流行的近三十种大数据算法,每种算法都附有一个成功的商业案例,通过案例深入分析每种算法的长处、缺点、适用范围等,使读者不仅知其然,更知其所以然。 该书比介绍大数据类的书籍具有更多的理论知识,比各种算法的教科书含有更多的实际应用,是两者的绝妙过渡,适合对大数据有一定了解的读者,可以帮助读者在短时间内深入学习大数据分析的算法体系

大数据存储MongoDB实战指南

资源名称:大数据存储 实战指南 内容简介: 是一种面向文档的分布式数据库,可扩展,表结构自由,并且支持丰富的查询语句和数据类型。时至今日, 以其灵活的数据存储方式逐渐成为 行业非常流行的一种非关系型数据库( )。 《大数据存储 实战指南》从学习与实践者的视角出发,本着通俗精简、注重实践、突出精髓的原则,精准剖析了 的诸多概念和要点。全书共分 个部分,分别从基础知识、深入理解 、监控与管理 和应用实践几个维度详细地介绍了 的特点及应用实例。 《大数据存储 实战指南》适合有海量数据存储需求的人员、数据库管理开

Storm技术内幕与大数据实践

资源名称: 技术内幕与大数据实践 内容简介:  《 技术内幕与大数据实践》内容主要围绕实时大数据系统的各个方面展开,从实时平台总体介绍到集群源码、运维监控、实时系统扩展、以用户画像为主的数据平台,最后到推荐、广告、搜索等具体的大数据应用。书中提到的不少问题是实际生产环境中因为数据量增长而遇到的一些真实问题,对即将或正在运用实时系统处理大数据问题的团队会有所帮助。 资源目录: 第 章 绪论     的基本组件     集群组成     核心概念      的可靠性      的特性    其他流式处理框架

大数据Spark企业级实战

资源名称:大数据 企业级实战 内容简介: 是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是 软件基金会下所有开源项目中三大开源项目之一。   在 理念的指引下, 基于 成功地构建起了大数据处理的一体化解决方案,将 、 、 、 、 等大数据计算模型统一到一个技术堆栈中,开发者使用一致的 操作 中的所有功能;更为重要的是 的 、 、 、 等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了 在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得 正在加速成为大数据

Hadoop大数据处理 中文pdf

资源名称: 大数据处理 中文 章大数据处理概论 什么是大数据 数据处理平台的基础架构 大数据处理的存储 提升容量 提升吞吐量 大数据处理的计算模式 多处理技术 并行计算 大数据处理系统的容错性 数据存储容错 计算任务容错 大数据处理的云计算变革 本章参考文献 章基于 的大数据处理架构 核心云计算技术 并行计算编程模型 分布式文件系统 分布式结构化数据存储 云计算技术及发展 的由来 原理与运行机制 相关技术及简介 技术的发展与演进 基于云计算的大数据处理架构 基于云计算的大数据处理技术的应用 百度 阿里巴巴