百度蜘蛛爬取后,返回304代码的分析与解决方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最近糗事百科遇到一个问题,网站的首页快照隔天,快照已经很长一段时间了,可以为什么内页就是不收录。

于是就去看了一下网站的日志,看一下是否有蜘蛛来爬取过,如:
192.168.0.254 - - [15/Oct/2011:11:31:41 +0800] "GET / HTTP/1.0" 304 -192.168.0.254 - - [15/Oct/2011:11:31:41 +0800] "GET / HTTP/1.0" 304 - "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +/search/spider.html)"。

通过观看了这些代码之后,发现很我这样的代码,都是返回304。

而正常情况下,应该是200才对,在查了很多资料与自己实践得出以下几点:
304代码解释
返回304代码是请求的网页与上次比没有更新。

意思是蜘蛛来到你的网站,你网站没有更新内容,并且与上次一样,就会返回304代码。

如果每次蜘蛛来你的网站都有新的内容出现,就会反回200代码。

304代码过多现象
304代码在网站日志中出现过多,会出现网站快照停止、收录减少、权重下降。

哪为什么会出现这几种情况呢,下面给大家分析一下:
1、网站快照停止:如果网站日志中在24小时内,全是304代码,而24小时内没有返回一个200代码,这样就会使网站的快照停止。

因为304代码是记录网站内容是否有更新,在24小时内没有更新,哪快照就会停止。

2、收录减少:因为对于一个网站,返回的304代码过多,蜘蛛就会很少来你的网站,因为当304代码达到一定的量,说明你的网站更新不是很快,从而蜘蛛会很少来,从而收录量会下降。

3、权重下降:304代码过多,蜘蛛会很少来你的网站,收录就会减少,收录减少了,当然权重也就下降了。

304代码的解决方法
在上面说了304代码过多会不利于网站,哪解决的方法有以下几种:
1、内容更新:把蜘蛛来的时候给记录下来,算出蜘蛛每隔多久来一次网站,然后就分隔多久更新一下文章,更新文章时要原创+转载。

让蜘蛛每次来都能够有吃的,而不是无功而返。

这样就会产生很多200代码。

2、互动论坛:对于有些比较大的网站,本来网站的内容比较多,但是每次都是一次更新,这样也会出现很多304代码,解决的方法是做一个论坛,可以让网友互动起来,从而使网站不停有新的改变,从而返回200代码。

以上就是糗事百科对于日志返回304代码的解决方法。

如果有什么不对的地方还请大家说出
来。

来源糗事百科: 。

相关文档
最新文档