大数

Spark大数据分析核心概念技术及实践

资源名称: 大数据分析核心概念技术及实践 内容简介: 本书是大数据和 方面的一本简明易懂的手册。它将祝你学习如何用 来完成很多大数据分析人物。它覆盖了高效利用 所需要的一切内容。作者首先介绍 语法,然后介绍作为基石的 再对 的各大组件 、 、 、 进行详细介绍,最后讲解 集群管理。书中不仅给出了丰富的示例代码,还对 的核心概念和基本原理进行了较为全面的介绍,然你不仅知其然且知其所以然。通过本书,你可以快速上手 ,把 应用到实践中。 资源截图:

大数据Spark企业级实战

资源名称:大数据 企业级实战 内容简介: 是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是 软件基金会下所有开源项目中三大开源项目之一。   在 理念的指引下, 基于 成功地构建起了大数据处理的一体化解决方案,将 、 、 、 、 等大数据计算模型统一到一个技术堆栈中,开发者使用一致的 操作 中的所有功能;更为重要的是 的 、 、 、 等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了 在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得 正在加速成为大数据

大数据技术丛书:Apache Kylin权威指南 高清pdf

资源名称:大数据技术丛书: 权威指南 高清 第 章  概述 第 章 快速入门 第 章 增量构建 第 章 流式构建 第 章 查询和可视化 第 章  优化 第 章 应用案例分析 第 章 扩展 第 章  的企业级功能 第 章 运维管理 第 章 参与开源 第 章  的未来 资源截图:

大数据处理系统:Hadoop源代码情景分析

资源名称:大数据处理系统: 源代码情景分析 内容简介: 是目前重要的一种开源的大数据处理平台,读懂 的源代码,深入理解其各种机理,对于掌握大数据处理的技术有着显而易见的重要性。 本书从大数据处理的原理开始,讲到 的由来,进而讲述对于代码的研究方法,然后以 作为样本,较为详尽地逐一分析大数据处理平台各核心组成部分的代码,并从宏观上讲述这些部分的联系和作用。 本书沿用作者独特而广受欢迎的情景分析方法和风格,深入浅出直白易懂,可以作为大数据系统高级课程的教材,也可用作计算机软件专业和其他相关专业大学本科高年级学

实战大数据 MATLAB数据挖掘详解与实践 中文pdf

资源名称:实战大数据 数据挖掘详解与实践 中文 第 章 绪论 数据挖掘概述 数据挖掘的分类 数据挖掘的过程 数据挖掘的任务 数据挖掘的对象 数据库 文本 图像与视频数据 数据 数据挖掘建模方法 业务理解 数据理解 数据准备 建模 评估 部署 数据挖掘的应用 在金融领域的应用 在零售业中的应用 在电信业的应用 在管理中的应用 在化学研究领域中的应用 在材料研究、生产方面的应用 在机械故障诊断与监测中的应用 在医疗领域中的应用 第 章 数据挖掘算法 决策树算法 决策树基本算法 算法 算法 算法 决策树的评价标

征信与大数据 移动互联时代如何重塑“信用体系”

资源名称:征信与大数据 移动互联时代如何重塑 信用体系 内容简介: 本书的主要内容分为征信商业模式和大数据在征信领域的应用两大部分。 随着近年来国内征信相关法规的出台,国内市场化的征信业开始起步,建设热情高涨,社会需求旺盛,资本市场热捧、大量互联网公司涌入。但是由于起步晚,国内金融、经济和法制环境配套并不完善,所以国内征信业发展过程虽然遇到空前的机会,但是目前还存在短时间内难以解决的瓶颈。相比而言,在欧美发达国家,征信有一百多年的历史,随着信息技术的发展,已经到了一定的专业高度。因此针对国内目前刚起步的市

Hadoop大数据处理技术基础与实践 完整pdf

资源名称: 大数据处理技术基础与实践 完整 基础与实践第 章 概述 . 来源和动机 . 体系架构 . 与分布式开发 . 行业应用案例分析 . . 在门户网站的应用 . . 在搜索引擎中的应用 . . 在电商平台中的应用 . 小结第 章 安装与配置管理 . 实验准备 . 配置一个单节点环境 . . 运行一个虚拟系统 . . 配置网络 . . 创建新的用户组和用户 . . 上传文件到 并配置 、 环境 . . 修改 . 配置文件 . . 修改 主机名 . . 绑定 与 . . 关闭防火墙 . 节点之间的免密码

Python+Spark 2.0+Hadoop机器学习与大数据实战

资源名称: 机器学习与大数据实战 内容简介: 本书从浅显易懂的 大数据和机器学习 原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了 机器学习 内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机 系统上通过 虚拟机安装多机 虚拟机,如何建立 集群,再建立 开发环境。书中介绍搭建的上机实

Python和HDF5大数据应用 带目录完整pdf_Python教程

资源名称: 和 大数据应用 带目录完整 语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。 应用领域的拓展,越来越多的人将 用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而 也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用 对大小从 至 的数字数据集进行存档和共享的细节、实践以及陷阱,体验在 语言中用 存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主

Splunk大数据分析

资源名称: 大数据分析 内容简介: 是一种典型的大数据处理工具,能够高效地按时序对数据进行存储、索引、访问,已广泛应用在多个领域。本书是介绍如何实时处理大数据并从中获得商业价值的一本实用指南。本书通过真实的大数据分析项目,从数据导入、访问、挖掘和可视化角度全面而系统地介绍 的基本概念和使用方法,以帮助读者快速掌握 。 全书共 章,分为四个部分:第一部分(第 章)介绍 的基本操作,包括利用 进行数据收集、处理、分析及结果可视化等的基本操作和命令,以及使用日志文件创建高级数据分析报表的方法;第二部分(第 章)