百度飓风算法2.0的推出,网站还能采集吗?
网站采集文章,实际上是一直以来很多站点内容获取的一种方式。虽然这种方式很受人鄙视,剽窃别人的原创作品,从而应用于自己的网站上,我也是一种遭遇着这种行为。但确实没有办法,相关站点那么多,谁也不能管控这些问题。但百度飓风算法推出之后,很多采集者遭受了严厉的打击,有的流量每天百万级的现在也只有几万uv的不在少数。
那现在文章还能通过采集发布吗?
首先,文章采集这件事本身是没有问题的,但道德上考虑加上人家原创作者的归属就可以。严格来说百度并不是打击采集行为,而是针对性的打击恶劣采集行为。
什么是恶劣采集行为呢?
这里赵彦刚举例说明一下,知名网站A通过对很多网站的内容采集,在百度上获得了很多的流量。它内容采集的方式是利用工具进行采集,在采集的过程中,去掉对方的品牌、链接以及一些图片水印的同时,把段落代码也去掉了。发布到自己网站后,变成了一大段文字,段落不清晰,甚至还有大量的空格不知道是啥目的。而且整个网页而言很多内容都和当前网页不想关。在飓风算法2.0出来后,它无疑被惩罚了。
所以你单纯为了内容而采集,完全不顾用户浏览内容的体验。就被称之为恶劣的采集行为。是不可以的。
怎么采集文章,才不会被飓风算法2.0惩罚呢?
要不想命中飓风算法,我这里给出以下几点建议:
良好的阅读体验:段落清晰、阅读通顺、甚至整改原创文章的一些错别字等,让内容本身是你读起来至少感觉到是人写的;
优秀的内容排版:内容的排版好与坏搜索引擎是能够识别的,所以字号多大、段落间距、文字间距、字体颜色、图片插入位置及大小等,有没有比原创文章站点的更美观,更能让人轻松浏览。
相关的其他元素:除了你内容主题的采集部分外,你网页的最新推荐、相关推荐、热门文章、编辑推荐等是不是都与当前文章主题相关呢?为用户提供更多与当前网页相关的内容进行延展阅读,也是提高当前网页质量的关键。
可想而知,如果你采集过来的内容无论从阅读体验、内容排版还是其他元素的相关性上,都更比原创站点好。有什么理由说你是恶劣的采集站点呢?
所以采集本身,从百度的角度上来说并不会遭受惩罚,但影响用户的体验就不同了。搜索引擎最为关心的是目标站点能不能很好的、综合性的解决用户的需求。
当然,现在搜索引擎加大对原创文章的保护力度确实对采集站点不利,这是趋势。如果流量都让采集站点抢走了,谁还来创造好的内容呢?