大数

Python和HDF5大数据应用 带目录完整pdf_Python教程

资源名称: 和 大数据应用 带目录完整 语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。 应用领域的拓展,越来越多的人将 用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而 也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用 对大小从 至 的数字数据集进行存档和共享的细节、实践以及陷阱,体验在 语言中用 存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主

零起点Python大数据与量化交易 (何海群著) pdf_Python教程

资源名称:零起点 大数据与量化交易 何海群著 第 章 从故事开始学量化 第 章 常用量化技术指标与框架 第 章 金融数据采集整理 第 章 案例汇编 第 章 整体架构 第 章 模块详解与实盘数据 第 章 量化策略库 第 章 海龟策略与自定义扩展 第 章 函数库与策略开发 第 章 扩展与未来 资源截图:

尚学堂_大数据_Hbase视频教程

教程名称: 尚学堂 大数据 视频教程 是一个分布式的、面向列的开源数据库,该技术来源于 所撰写的 论文 :一个结构化数据的分布式存储系统 。就像 利用了 文件系统( )所提供的分布式数据存储一样, 在 之上提供了类似于 的能力。

Hadoop大数据处理技术基础与实践 完整pdf

资源名称: 大数据处理技术基础与实践 完整 基础与实践第 章 概述 . 来源和动机 . 体系架构 . 与分布式开发 . 行业应用案例分析 . . 在门户网站的应用 . . 在搜索引擎中的应用 . . 在电商平台中的应用 . 小结第 章 安装与配置管理 . 实验准备 . 配置一个单节点环境 . . 运行一个虚拟系统 . . 配置网络 . . 创建新的用户组和用户 . . 上传文件到 并配置 、 环境 . . 修改 . 配置文件 . . 修改 主机名 . . 绑定 与 . . 关闭防火墙 . 节点之间的免密码

Python+Spark 2.0+Hadoop机器学习与大数据实战

资源名称: 机器学习与大数据实战 内容简介: 本书从浅显易懂的 大数据和机器学习 原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了 机器学习 内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机 系统上通过 虚拟机安装多机 虚拟机,如何建立 集群,再建立 开发环境。书中介绍搭建的上机实

Storm实战:构建大数据实时计算 带书签 完整PDF

资源名称: 实战 构建大数据实时计算 带书签 完整 第 章 基础 能做什么 特性 其他流计算系统 应用模式第 章 初体验 本地环境搭建 集群第 章 构建 基本概念 构建 小结第 章 的并行度 并行元素 配置并行度 一个运行中 的例子 如何更新运行中的 的并行度第 章 消息的可靠处理 简介 理解消息被完整处理 消息的生命周期 可靠相关的 高效地实现 选择合适的可靠性级别 集群的各级容错 小结第 章 一致性事务 简单设计一:强顺序流 简单设计二:强顺序 流 的原理 第 章 总体概述 本地模式 远程模式 一个复

实战大数据

资源名称:实战大数据 内容简介: 数据是重要资产 已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。 本书共 章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例, 云文件系统实例。 本书适合大数据技术初学者、大数据从业人员和