百度蜘蛛问题
先在网站中加了百度地兔脒巛钒图(百度地图的链接),又在robots文件中加了这样一句:Sitemap: http://www.xbsb123.com/sitemap.xml
意思是橇秆苡螳想让百度蜘蛛直接通过地图进站访问,但今天看网站日志的时候发现蜘蛛访问的日志的代码是200 0 64 网上有人说64是错误代码也有可能是被K的千兆,我试过了百度地图没有问题啊,而且地图也每天更新,我是不是应该把上面robots文件中那句话除掉,让百度蜘蛛自由访问,这是网站日志中蜘蛛访问的日志,大家帮我分析一下
2014-05-28 00:00:32 W3SVC10002 123.1.157.214 GET /modules/article/reader.php aid=511&cid=232724 80 - 123.125.71.79 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 200 0 64
这个是在网上找的解释:
200 0 0 成功访问该页面,0代表抓取成功并带回数据库。这个时候你就放心了,这个页面已经被bd收录,但是还没有释放出来,bd更新时就可能释放出来。
“200 0 64 网络上流传着这么三种解释第一:64为K站的前兆。第二64的出现只是64位操作系统。第三:网络不可达,由于某种原因无法完全打开页面,或者网络不稳定这些原因,导致蜘蛛无法带回页面或者说不抓取该页面,所以200 0 64的解释也应该为:访问了该页面,但并没有任何抓取也没有带回数据库。这种原因多为空间不稳定、服务器不稳定。”
当天网络日志中蜘蛛访问的次数大概有100多次,全部是200 0 64的提示,大家帮我看下到底怎么回事,实在不是只能换了域名重做了,毕竟是新站投入的还不多
不知道你们是不知道这个问题,还是没人注意啊,刚才自家在网上找了一下,可能算是个标准答案吧,有同样疑惑的参考一下,以下是原文我直接复制过来了:
最先发现有人讨论百度蜘蛛200 0 64这个状态码是在SEOWHY、点石上看到的,当时发现有很多舆论。而当中最另站长们胆寒的,无疑是“百度K站前兆”一说。后来我在很多SEO博客上留意到其他的一些说法,但最终都没有比较权威的证实。于是乎,我也在我的几个新站上研究这个奇怪的蜘蛛代码“200 0 64”。
听说这个状态码在新站的出现频率特别高。我开始在我一个有点权重的老站上找那个状态码,平时没注意,没想到一查还真有几个“200 0 64”存在着,几乎每天都有。甚至追查到一个月前去,还是有这个状态码存在。关于这点,我证明了一个事,百度蜘蛛200 0 64这个状态码不是那所谓的“K站前兆”。在此请广大站长们放心先!
接下来,便是研究这个状态码的含义究竟是什么了。刚好我有一个新站刚上线,是个博客站。开始一星期,每天固定在晚上九点左右更新一篇文章。站做好提交给百度数日后,查看了一下IIS访问日志。发现百度的蜘蛛每天都有好几个“200 0 64”的状态码,接连这种情况大概十天左右。站提交给百度8天就收录了,第11天有了点小排名以及一些长尾关键词的排名,流量上升到了每天100IP左右。
在这个时候,我发现“200 0 64”越来越少了,刚好在这个时候,好像是在SEOWHY还是哪里看到有一高手说出了“200 0 64”其实是百度蜘蛛在发现网页内容与上次访问时没发生变化,也就是没有更新,就会出现这个状态码。有了这个思路后,我便从这个突破口去研究下去。
这时候怪事出现了,我那个新站都是每天晚上九点才更新的,而在IIS访问日志里却发现,上午8点是“200 0 64”,而9点来了的百度蜘蛛却给出了“200 0 00”的状态码,再下来在12点的时候,连续来了几只都是“200 0 64”。我给玩晕了,一时间不知道是何意思。
在我百思不得其解之时,发现了整件事的原因。因为我的新站是用ZBLOG建设的,加上是新站,有时候访客一进来,塞都点击同一篇文章的话,那么首页的热文调用那里,那篇文章便会升上去。这下我彻底明白了,原来是这里有变动。加上有时候访客进来塞发表留言或评论,首页也会在缓存后自动更新。这便造成了首页自动更新了!
在还没有权威的评测出来前,我想,这个“200 0 64”应该是一个很正常的状态码。至于很多站长说这个状态码是“K站前兆”,我想应该是他们的站经常长时间不更新,刚好百度蜘蛛给出了“200 0 64”,然后又因为长时间不更新让百度K了。才会出现那些另人胆寒的传言。