我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:九肖六肖三肖全年资料 > 去重 >

搜索引擎是怎么去重的

归档日期:07-24       文本归类:去重      文章编辑:爱尚语录

  同一篇文章在一个网站中多次出现是搜索引擎不喜欢的,同一片文章在很多网站上出现也是搜索引擎厌恶的,特别是当用户搜索的时候前几页都是这同样一篇文章对于搜素引擎来认为他是不利于用户体验的。搜索引擎希望的是一篇文章只出现一次。是以搜素引擎识别重复文章和删除重复文章就叫做去重。去重的方法是根据关键词指纹来计算,选择一个最具有代表意义的关键词然后再分词和去停止词去噪之后在选择10个特征这样就可以到达一个非常高的准确性,特征再多了不但浪费计算并且没有意义,简单的加一些的地得已经让我们知道这样所谓的伪原创对付搜索引擎木有任何的意义。搜索引擎的去重不会只是淡淡的一个页面或者一个网站,而是在整个互联网都在运作,是以所谓的调换段落,和用几篇文章拼成一篇文章的做法并不能让搜索引擎认为这是原创文章。

本文链接:http://odigallery.com/quzhong/341.html