PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署
资源名称: 实战指南:利用 和 构建数据密集型应用并规模化部署 内容简介: 本文从 的基本特点出发,借助大量例子详细介绍了如何使用 调用 新特性、处理结构化及非结构化数据、使用 中基本可用数据类型、生成机器学习模型、进行图像操作以及阅读串流数据等新兴技术内容。 资源目录: 译者序 序 前言 关于作者 第 章 了解 什么是 作业和 执行过程 弹性分布式数据集 优化器 钨丝计划 的架构 统一 和 介绍 结构化流 连续应用 小结 第 章 弹性分布式数据集 的内部运