数据挖掘

大数据:互联网大规模数据挖掘与分布式处理

资源名称:大数据:互联网大规模数据挖掘与分布式处理 内容简介: 本书源自作者在斯坦福大学教授多年的 挖掘 课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前 应用的许多重要话题。主要内容包括:    分布式文件系统以及 工具;    相似性搜索;    数据流处理以及针对易丢失数据等特殊情况的专用处理算法;    搜索引擎技术,如谷歌的 ;    频繁项集挖掘;    大规模高维数据集的聚类算法;    应用中的关键问题:广告管理和推荐系统。 资源目录: