360算法 – 360搜索后羿算法在线解读

互联网高速发展离不开站长们的原创优质内容,有些网站在短时间内通过工具大量采集、拼接、自动伪原创来拼凑大量低质量的网页,这将导致无法优先展现高质量的原创内容,这些网站通过工具自动提取标题、 大量伪原创,严重影响用户体验。

所以,2016年12月26日360上线“后羿算法”,主要鼓励站长们写优质原创内容,重点打击采集和拼凑内容的网站!

后羿算法1.0

360搜索后羿算法1.0,于2016年12月26日正式上线,360搜索以鼓励互联网原创生态为宗旨,秉承“保护原创+控制采集”的原则。打击典型采集泛滥的现象,基于业界领先的安全大数据和大规模机器学习平台,研发和上线了“后羿算法”:对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权,同时确保新闻网站之间正常的转载行为不受影响。

360搜索后羿算法上线后,对于内容丰富的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展现的机会;对于滥用采集手段的行为(如整站大规模采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展现机会和网页收录量。

我们建议网站存在上述问题的站长,能够从长远发展考虑,积极完善网站建设,提供更多时效性高、内容丰富的原创内容,引擎将随着网站完善,不断提升收录量。同时也欢迎原创网页的作者,通过360站长平台主动提报我们收录缺失的信息。

后羿算法2.0

360搜索后羿算法2.0,于2017年9月7日正式上线,基于对恶劣采集行为的持续打击,对“后羿算法”进行了版本升级!秉承既有“保护原创+控制采集”的原则,严厉打击以恶劣采集为内容主要来源的网站,情节严重站点将会剔除索引!并且,与此类作弊站点有关联的其他站点,也将会受到不同程度的影响。

本次“后羿算法2.0”升级,针对的问题包括但不限于如下类别:

  • 页面标题与正文语义不一致,页面内容用机器批量构造
  • 站点内容存在淫秽低俗等诱导倾向
  • 页面排版混乱,存在多幅广告,巨型广告、弹窗过多等站点
  • 未经授权的采集和盗图
  • 导购类和网购类站点的关键词堆砌和采集行为
  • 页面内容与站点主营业务无关
  • 由建站程序批量制造的垃圾站

不断提升自身站点的原创内容覆盖度,通过产出高质量原创内容来体现站点自身价值,构建互联网内容良性生态环境。

本文由 学习链 作者:学习链 发表,其版权均为 学习链 所有,文章内容系作者个人观点,不代表 学习链 对观点赞同或支持,未经许可,禁止转载,题图来自Unsplash,基于CC0协议。

发表评论