大数

实战大数据

资源名称:实战大数据 内容简介: 数据是重要资产 已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。 本书共 章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例, 云文件系统实例。 本书适合大数据技术初学者、大数据从业人员和

尚学堂_大数据_Hbase视频教程

教程名称: 尚学堂 大数据 视频教程 是一个分布式的、面向列的开源数据库,该技术来源于 所撰写的 论文 :一个结构化数据的分布式存储系统 。就像 利用了 文件系统( )所提供的分布式数据存储一样, 在 之上提供了类似于 的能力。

Python和HDF5大数据应用 带目录完整pdf_Python教程

资源名称: 和 大数据应用 带目录完整 语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。 应用领域的拓展,越来越多的人将 用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而 也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用 对大小从 至 的数字数据集进行存档和共享的细节、实践以及陷阱,体验在 语言中用 存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主

零起点Python大数据与量化交易 (何海群著) pdf_Python教程

资源名称:零起点 大数据与量化交易 何海群著 第 章 从故事开始学量化 第 章 常用量化技术指标与框架 第 章 金融数据采集整理 第 章 案例汇编 第 章 整体架构 第 章 模块详解与实盘数据 第 章 量化策略库 第 章 海龟策略与自定义扩展 第 章 函数库与策略开发 第 章 扩展与未来 资源截图:

大数据与机器学习:实践方法与行业案例

资源名称:大数据与机器学习:实践方法与行业案例 内容简介: 本书从企业实践出发,内容覆盖数据、平台、分析和应用等企业内数据流转的主要环节。布局上,按照数据与平台篇、分析篇和应用篇分别撰写。数据与平台篇(第 章),立足找到数据、整合数据、使用数据三个角度,介绍数据在企业内的分布和处理逻辑,以便快速为分析准备素材。分析篇(第 章),选取企业实际案例,介绍常用的数据挖掘与机器学习算法,以业务场景为导向展示数据分析过程和技巧。应用篇(第 章),选取当前主流的四个应用场景,介绍如何实现数据驱动,让数据 自动 流转于

Spark大数据分析实战

资源名称: 大数据分析实战 内容简介: 本书一共 章:其中第 ~ 章,主要介绍了 的基本概念、编程模型、开发与部署的方法;第 ~ 章,详细详解了热点新闻分析系统、基于云平台的日志数据分析、情感分析系统、搜索引擎链接分析系统等的应用与算法等核心知识点。 资源目录: 前 言 第 章 简介 初识 生态系统 架构与运行逻辑 弹性分布式数据集 简介 算子分类 本章小结 第 章 开发与环境配置 应用开发环境配置 使用 开发 程序 使用 进行交互式数据分析 远程调试 程序 编译 配置 源码阅读环境 本章小结 第 章 简

大数据概论

资源名称:大数据概论 内容简介: 本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的 理论、 数据库、复杂网络、 分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。 资源截图: