飓风算法

超级蜘蛛池之网站中了“飓风算法”

年 月 日,百度正式推出 飓风算法 ,从官方文档中来看,飓风算法的命中对象是站点,而不是网页 主要是针对以恶劣采集为内容主要来源的网站,而不是所有包含恶劣内容的站点。 哪些内容算是恶劣采集 恶劣采集内容,一般是指没有花费时间,精力,专业能力,人工整合的内容,或者说对用户没有任何附加价值的内容。 一、这部分内容有以下几种类型: 、从其他站点采集的内容 包括整个页面内容都是采集、主题内容是采集,或者多篇采集拼凑成的内容。这种类型内容很容易被识别。 、采集之后轻度加工的内容 包括修改了部分词语,修改了部分句子,