密集型

PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署

资源名称: 实战指南:利用 和 构建数据密集型应用并规模化部署 内容简介: 本文从 的基本特点出发,借助大量例子详细介绍了如何使用 调用 新特性、处理结构化及非结构化数据、使用 中基本可用数据类型、生成机器学习模型、进行图像操作以及阅读串流数据等新兴技术内容。 资源目录: 译者序 序 前言 关于作者 第 章 了解  什么是   作业和  执行过程  弹性分布式数据集       优化器  钨丝计划   的架构  统一 和   介绍    结构化流  连续应用  小结 第 章 弹性分布式数据集   的内部运