大数
数据科学与大数据分析
资源名称:数据科学与大数据分析 内容简介: 数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。《数据科学与大数据分析 数据的发现 分析 可视化与表示》总共分为 章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用 语言进行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分
征信与大数据 移动互联时代如何重塑“信用体系”
资源名称:征信与大数据 移动互联时代如何重塑 信用体系 内容简介: 本书的主要内容分为征信商业模式和大数据在征信领域的应用两大部分。 随着近年来国内征信相关法规的出台,国内市场化的征信业开始起步,建设热情高涨,社会需求旺盛,资本市场热捧、大量互联网公司涌入。但是由于起步晚,国内金融、经济和法制环境配套并不完善,所以国内征信业发展过程虽然遇到空前的机会,但是目前还存在短时间内难以解决的瓶颈。相比而言,在欧美发达国家,征信有一百多年的历史,随着信息技术的发展,已经到了一定的专业高度。因此针对国内目前刚起步的市
Hadoop大数据处理技术基础与实践 完整pdf
资源名称: 大数据处理技术基础与实践 完整 基础与实践第 章 概述 . 来源和动机 . 体系架构 . 与分布式开发 . 行业应用案例分析 . . 在门户网站的应用 . . 在搜索引擎中的应用 . . 在电商平台中的应用 . 小结第 章 安装与配置管理 . 实验准备 . 配置一个单节点环境 . . 运行一个虚拟系统 . . 配置网络 . . 创建新的用户组和用户 . . 上传文件到 并配置 、 环境 . . 修改 . 配置文件 . . 修改 主机名 . . 绑定 与 . . 关闭防火墙 . 节点之间的免密码
大数据Spark企业级实战
资源名称:大数据 企业级实战 内容简介: 是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是 软件基金会下所有开源项目中三大开源项目之一。 在 理念的指引下, 基于 成功地构建起了大数据处理的一体化解决方案,将 、 、 、 、 等大数据计算模型统一到一个技术堆栈中,开发者使用一致的 操作 中的所有功能;更为重要的是 的 、 、 、 等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了 在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得 正在加速成为大数据
大数据与机器学习:实践方法与行业案例
资源名称:大数据与机器学习:实践方法与行业案例 内容简介: 本书从企业实践出发,内容覆盖数据、平台、分析和应用等企业内数据流转的主要环节。布局上,按照数据与平台篇、分析篇和应用篇分别撰写。数据与平台篇(第 章),立足找到数据、整合数据、使用数据三个角度,介绍数据在企业内的分布和处理逻辑,以便快速为分析准备素材。分析篇(第 章),选取企业实际案例,介绍常用的数据挖掘与机器学习算法,以业务场景为导向展示数据分析过程和技巧。应用篇(第 章),选取当前主流的四个应用场景,介绍如何实现数据驱动,让数据 自动 流转于
赤裸裸的未来 : 大数据时代:如何预见未来的生活和自己(带目录)
资源名称:赤裸裸的未来 大数据时代 如何预见未来的生活和自己(带目录) 内容简介: 全书主题聚焦于未知与未来,但论述绝非建立在想象之上的空中楼阁,其间穿插着大量事例,或基于客观现实,或依据科学推测,生动有趣。 塔克尔通过大量的访谈和调查,约见各领域的权威人士,积累了极为丰富的素材,提取了他们有关现实的观点和对未来的预期,为我们展开了有关未来社会各领域的翔实可信的图景,讲述的虽是前沿科技主题,内容却平实亲和。就个人而言,我们生活在一个 超级透明 的世界,我们泄露出去的海量信息无处不在。若将这些信息收集起来,
BIG DATA大数据系统构建:可扩展实时数据系统构建原理与最佳实践
资源名称: 大数据系统构建:可扩展实时数据系统构建原理与最佳实践 内容简介: 随着社交网络、网络分析和智能型电子商务的兴起,传统的数据库系统显然已无法满足海量数据的管理需求。 作为一种新的处理模式,大数据系统应运而生,它使用多台机器并行工作,能够对海量数据进行存储、处理、分析,进而帮助用户从中提取对优化流程、实现高增长率的有用信息,做更为精准有效的决策。 但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。 本书将教你充分利用集群硬件优势的 架构,以及专门用来捕获和分析网络规模数据
Spark大数据分析实战 高彦杰 完整pdf
资源名称: 大数据分析实战 高彦杰 完整 第 章 简介 初识 生态系统 架构与运行逻辑 弹性分布式数据集 简介 算子分类 本章小结 第 章 开发与环境配置 应用开发环境配置 使用 开发 程序 使用 进行交互式数据分析 远程调试 程序 编译 配置 源码阅读环境 本章小结 第 章 简介 为什么使用 架构分析 简介 架构 原理剖析 简介 的使用简介 体系结构 简介 中的聚类和分类 本章小结 第 章 架构日志分析流水线 日志分析概述 日志分析指标 架构 构建日志分析数据流水线 用 进行日志采集 用 将日志汇总 用