收藏本站|设为首页

您现在的位置: 首页 > 新闻中心 > 网络营销 > 详细内容

教你看出日志中的潜匿的奥秘

2012-09-12 14:11 来源: 卓杰科技 www.zhuojie.net [ ]

几天前我经由过程自己工作室才上线的网站教巨匠经由过程处事器日志察看中蜘蛛的访谒行为,相信这样一来巨匠都能触类旁通的找出日志平分歧搜索引擎蜘蛛的爬行路径了吧。今天我们仍用自己的网站处事器日志,教巨匠清楚把握处事器与蜘蛛是怎么互动的,这些都是日志中不太较着的信息,需要你细心的去不雅察看的。新站升引是用被使用过的老域名,反而没有直接用没有被使用过的新域名收录来得快,比来上线的这个新站,因为域名拔取的原因,必需使用被使用过的老域名,上线已经9天, 仍没有快照与收录,但我们是不是就应该要选择抛却了呢?

原文出处:http://www.zhuojie.net/?/experience/seo/seo-82.html

新站升引被使用过的老域名,就会碰着像我一样的情形,可是怎么不雅察看潜匿在日志的访谒奥秘,是做为站长的你必需要学会的。只有这样,才能让你看到但愿,只有这样,才能让你有坚持的动力,只有这样,才能让你不再迷惑!

123.125.71.116 - - [10/Sep/2012:05:41:23 +0800] "GET / HTTP/1.1" 200 5858 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.zhuojie.net/?/search/spider.html)

经由过程上一次的讲解,我们知道IP为123.125.71.116的蜘蛛,在2012年9月10日凌晨05点41分23秒的时辰,爬行了我们首页信息,HTTP返回状况值200,爬行字节数5858。

什么是HTTP返回状况值呢?当用户或搜索引擎向网站处事器发出浏览请求的时辰,处事器返回的HTTP数据流中头信息中的状况码,它是一种处事器与访谒者交互的说话。

好吧,纯粹的理论让人看得是不是有颔首晕了,我们下面用实例来剖析一下常见的返回状况值都有哪些!

布景:我们剖析的这个网站是老域名,之前被人用过,存在搜索引擎收录数据,此刻域名被我用来年夜头建站。

我们来几标识表记标帜录来看一看:

这标识表记标帜录HTTP返回状况值是200,原因是因为百度蜘蛛爬行了真实存在的网站首页,HTTP返回200代表:处事器已经成功措置了请求。

123.125.71.98 - - [10/Sep/2012:01:02:33 +0800] "GET /news/disp.php?id=302 HTTP/1.1" 404 1107 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.zhuojie.net/?/search/spider.html)

这标识表记标帜录HTTP返回状况值是404,原因是因为百度蜘蛛爬行了一条本网站根柢不存在的路径,HTTP返回404代表:处事器找不到请求的网页。

这标识表记标帜录HTTP返回状况值是301,原因是因为百度蜘蛛爬行了在网站中不存在的文件路径,HTTP返回301代表:请求的网页已永远移动到新位置。

220.181.51.113 - - [10/Sep/2012:08:44:22 +0800] "GET /product/disp.php?id=85 HTTP/1.1" 301 250 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.zhuojie.net/?/search/spider.html)

HTTP返回状况值还有良多,如不美观你碰着其它的可以随时百度一下就能找到它代表的意思。本文的目的是但愿经由过程我们网站的文章,辅佐到其他和我们碰着同样问题的人。今朝本文新上线的网站年夜量存在HTTP返回状况404,首要原因是老域名存在使用情形,百度收录数据库中存在年夜量原有收录数据,此刻百度蜘蛛仍按原收录文章路径进行爬行,导致HTTP返回状况值呈现404码,按照笔者的经验,此时新站处于百度审核期,只有经由过程百度一个月到三个月的 审核期,收录数据才能获得释放,此时的404应该越多越好,蜘蛛爬行欠亨,自然会将该条原收录数据删失踪,只是这样一来会延迟新站的审核经由过程周期。

好吧,我们仍拿出几条蜘蛛爬行记实来剖析:

好了,今天的分享到此竣事,让我们拭目以待新站的成功收录吧!

今天我们要重点讲解的就是这个HTTP返回状况值,什么是返回状况值?都有哪些返回状况值?它们都分袂代表什么意思?

都有哪些返回状况值呢?返回状况值有良多,按照其寄义,以1开首的返回值暗示姑且响应并需要请求者继续执行操作。以2开首的返回值暗示成功措置了请 求。以3开首的返回值要求完成请求需要进一步操作,凡是这些状况码用来重定向。以4开首的返回值暗示请求可能犯错,故障了处事器的措置。以5开首的返回值 暗示处事器在措置请求时发生内部错误,这些错误可能是处事器自己的错误,而不是请求犯错。

123.125.71.116 - - [10/Sep/2012:05:41:23 +0800] "GET / HTTP/1.1" 200 5858 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.zhuojie.net/?/search/spider.html)