网站内容相似度高的处理办法
一些做站群的站长总在担心页面相似度的问题,认为控制在合理范围内就不会受到惩罚,其实百度对网站的惩罚还是有自己的一套手段,不是太恶劣的话只要你“有所悔改”,就会“宽大处理”。
301处理
所谓页面相似度很高的绝大多数网站是因为没做好301,比如带www和不带www的域名,相似度是100%;带 .html、.php等后缀的和不带后缀的页面相似度也是100%,这个才是真正被认为是作弊,基本上不会给你很好的排名。
这种情况较好解决,如果发现自己的网站排名始终上不去,就尽快把这些URL全部跳转到主URL,减少被判作弊风险,同时也减少权重分散。
二级域名处理
分地区的二级域名也会遇到类似的情况,一定要让内容不一样,否则会被K的风险。
一些测试用的二级域名如果不及时屏蔽蜘蛛,后期不用这些二级域名了,删除快照参考文章《彻底屏蔽已收录的不需要的二级域名有效方法》
差别不是很大的页面处理
机械设备网站每种产品有可能只是图片、参数、尺寸不一样,其他内容、布局是一样的,这个也很伤脑筋,可以参考淘宝的方式,这类产品可以放到一个页面,用户可以挑选购买。当然如果没有购买功能,根本没必要区分那么多参数。
有些CMS管理就比较到位,内容页模板随机选用,多写几个模板,对html标签、title、keywords、description进行区分,也能降低相似度过高的风险。
内容被盗用、复制的处理
网友辛苦些的文章,被一些权重高的网站盗用了,还不留版权,这个是非常恼火的事情。联系那些不劳而获的站长,心情好的时候会删除或者给你加上版权,但绝大多数是做杨白劳。
很多时候你网站上的原创文章还不如别人盗用的排名还高,这是正常现象,虽然百度现在极力宣传自己的原创版权保护,但仍处于内测阶段。
如果按照评判标准,应该和线下版权程序类似:
①相关出处证明
如有自己特有的标签、网站链接、网站名,就能证明这是你写的文章;
②提交时间
现在百度链接提交内容途径比较丰富,但最直接的还是主动推送、自动推送,具体实现方法请参考官方说明,也可参考文章《新网站快速提高SEO索引量文章链接推送到百度》;
③蜘蛛的爬行时间
蜘蛛有时候勤快的爬取内容,但及时放出快照,这也是证明这些内容早于某些抄袭网站。
增加抄袭、采集者的成本
对付这类抄袭,一般只能通过JS禁止复制、禁用右键、封对方的IP等实现,这些仅限于低级的抄袭,会用采集工具的就没辙了,只要能查看源代码,什么都不是问题...
我们只能做到增加对方的采集成本,比如图片增加自己的水印,对方简单粗暴的覆盖你的水印可以会让网友怀疑内容真实性。
尽量把CSS样式引用的方式,对方复制过去如果他没写好,是很难看的,比如在行内样式可以让字体非常小,造成正常阅读困难,但在样式表里增加 !important 控制正常阅读大小,具体实现方法自己琢磨或者咨询我。
上一篇:网站存在敏感词会影响网站排名吗