数据分析

R与Hadoop大数据分析实战

资源名称: 与 大数据分析实战 内容简介: 本书全面而系统地讲解了如何将 语言与 技术结合并应用于大数据分析,不仅系统且深入地阐释了 与 集成技术的工具、方法、原则和最佳实践,而且通过大量实践案例深入剖析各种常见问题,能为用户高效利用 语言与 技术进行大数据处理提供翔实指导。 全书分为四部分,共 章:第一部分(第 章)是基础知识,主要讲解 语言以及 的安装过程、计算原理和基本概念;第二部分(第 章)是初级应用,主要讲解 、 和 三种实现方案;第三部分(第 章)是高级实例,主要以 为技术背景,讲解多个实际应

Python数据分析基础 PDF_Python教程

资源名称: 数据分析基础 内容简介: 想深入应用手中的数据?还是想在上千份文件上重复同样的分析过程?没有编程经验的非程序员们如何能在最短的时间内学会用当今炙手可热的 语言进行数据分析? 来自 的数据专家 可以帮您解决上述问题。在他的这本书里,读者将能掌握基本 编程方法,学会编写出处理电子表格和数据库中的数据的脚本,并了解使用 模块来解析文件、分组数据和生成统计量的方法。 学习基础语法,创建并运行自己的 脚本 读取和解析 文件 读取多个 工作表和工作簿 执行数据库操作 搜索特定记录、分组数据和解析文本文件

网络爬虫 Python和数据分析 PDF_Python教程

资源名称:网络爬虫 和数据分析 第一篇 理论基础篇 第 章 什么是网络爬虫  初识网络爬虫  为什么要学网络爬虫  网络爬虫的组成  网络爬虫的类型  爬虫扩展 聚焦爬虫  小结 第 章 网络爬虫技能总览  网络爬虫技能总览图  搜索引擎核心  用户爬虫的那些事儿  小结 第二篇 核心技术篇 第 章 网络爬虫实现原理与实现技术  网络爬虫实现原理详解  爬行策略  网页更新策略  网页分析算法  身份识别  网络爬虫实现技术  实例  小结 资源截图:

实时大数据分析 基于Storm Spark技术的实时应用 中文PDF

资源名称:实时大数据分析 基于 技术的实时应用 中文 第 章 大数据技术前景及分析平台 大数据的概念 大数据的维度范式 大数据生态系统 大数据基础设施 大数据生态系统组件 构建业务解决方案 数据集处理 解决方案实施 呈现 分布式批处理 分布式数据库( ) 数据库的优势 选择 数据库 实时处理 电信或移动通信场景 运输和物流 互联的车辆 金融部门 本章小结 第 章 熟悉 概述 的发展 的抽象概念 流 拓扑 任务 工作者 的架构及其组件 集群 集群 如何以及何时使用 的内部特性 的并行性 的内部消息处理 本章

数据分析:企业的贤内助_数据库教程

资源名称:数据分析:企业的贤内助 内容简介: 资深数据分析师多年工作经验结晶, 余位行业专家联袂推荐! 数据分析领域的开创性著作,技术内容专业、细致、严谨;写作方式独辟蹊径,构思巧妙,生动有趣! 以企业经营中的案例为依托,将复杂的数据分析知识巧妙地融入其中,完整呈现数据分析项目的流程,系统阐述数据分析的专业思路、方法和技能! 真正的好书不在于给出答案,而在于给出思考问题的方法。本书选择人物对话的形式,通过一问一答把读者带入到思考问题的情境,耳濡目染,感同身受。思路上清晰连贯,表达上深入浅出,减少枯燥的概念

Splunk大数据分析

资源名称: 大数据分析 内容简介: 是一种典型的大数据处理工具,能够高效地按时序对数据进行存储、索引、访问,已广泛应用在多个领域。本书是介绍如何实时处理大数据并从中获得商业价值的一本实用指南。本书通过真实的大数据分析项目,从数据导入、访问、挖掘和可视化角度全面而系统地介绍 的基本概念和使用方法,以帮助读者快速掌握 。 全书共 章,分为四个部分:第一部分(第 章)介绍 的基本操作,包括利用 进行数据收集、处理、分析及结果可视化等的基本操作和命令,以及使用日志文件创建高级数据分析报表的方法;第二部分(第 章)

Python数据分析与挖掘实战 PDF_Python教程

资源名称: 数据分析与挖掘实战 内容简介: 余位数据挖掘领域资深专家和科研人员, 余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍 数据挖掘建模过程,实践性极强。 本书共 章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例

Spark大数据分析实战

资源名称: 大数据分析实战 内容简介: 本书一共 章:其中第 ~ 章,主要介绍了 的基本概念、编程模型、开发与部署的方法;第 ~ 章,详细详解了热点新闻分析系统、基于云平台的日志数据分析、情感分析系统、搜索引擎链接分析系统等的应用与算法等核心知识点。 资源目录: 前 言 第 章 简介 初识 生态系统 架构与运行逻辑 弹性分布式数据集 简介 算子分类 本章小结 第 章 开发与环境配置 应用开发环境配置 使用 开发 程序 使用 进行交互式数据分析 远程调试 程序 编译 配置 源码阅读环境 本章小结 第 章 简