是不是常常在做SEO时发现,网站在某个搜索引擎有好的排名,在另一个排名却很差呢?让我们来看看Google与Bing在索引网页时的差异。
Bing与Yahoo目前共享搜寻功能,而且在未来几个月,会有进一步的整合。而他们结合的结果是Bing/Yahoo在搜寻市场占有25%的市占率!
图一:Yahoo与Bing合作
如果你到目前都忽略了重要性日渐增长的Bing,是时候来看看在Bing的搜寻结果底下,如何优化你的网站了。本文将会来看Bing是如何索引网页的。
Google显然在搜寻领域是领导者,而且也是个成熟、顶尖的搜索引擎。他们从事很非凡的工作,那就是广泛的索引各式各样不同的内容。另一方面,Bing仍在起步的阶段,而且也还没发展出一些Google已经有的丰富索引功能。更引人注意的地方在于Google如何索引网站内容及Bing的爬虫如何运作,其差异包括标准链接元素的需要、网页大小、301 & 302转址、meta refresh和反向连结的需要。
Google在判断网站的标准连结能力是很优异的,就算原始码并没有适当地指向其标准连结。Google的站长工具甚至不需要更动原始码就可以设定标准连结。另外,Google支持标准链接元素卷标,这个方法让站长可以很容易避免掉重复内容的问题。
图一:google站长工具偏好设定
另一方面,Bing不支持标准链接元素卷标且在站长工具内也不提供设定标准链接的功能。Bing会从编程的角度来看待网站成为标准连结这件事。
Bing的爬虫最初预设是造访网站的根域而非有”www”的次网域(例如:http://searchdiscovery.com)。如果服务器传回了200(ok码)的响应,Bing就会纪录这个网域在他们的索引里是没有"www"的。如果无www的网域被301转址到有www的次网域,Bing通常会遵循这个指令,然后正确的索引有"www"版本的网域。如果你比较喜欢网域的结构是有"www"的次网域,要确定你的标准重新指向有正确的反应了这项偏好。
回到以前的Google,google的爬虫只能爬到任何已知网页的前100k。随着Google的成熟,页面容量的大小对他们的爬虫来说是个小问题。然而,目前的Bing只能抓取到大部分网页的前100k(这范围大约是95k~105k)。当你是要在Bing上优化你的网站时,请记住这点。确定你的重要内容都在100k以内,否则就不会被Bing的爬虫索引。
虽然Google比较喜欢301重新指向,但302在索引上也不会造成太大的问题。然而,弱势302重新指向而非301,Bing不会遵循这个重新指向,在很多情况下,将会完全拒绝索引这个网站。基于这个原因,标准重新指向都使用301就相当重要。Bing表示:我们不会索引任何302重新指向的页面。换句话说,如果无www版本的网域302重新指向到有www的网域,Bing会直接不索引这个网站。
有些网站还在用Meta Refresh来重新指向。Bing及Google处理这个技术的作法相当迥异。Google会遵循0秒的Meta Refresh而且将他视为301。Bing就不会这么做。事实上,使用Meta Refresh会终止Bing的爬虫去造访任何已被索引的网站。所以如果想要Bing索引到你整个网站的话,就不要再用Meta Refresh。
Google很显然有最大的索引量。在过去几年,Google把他们的索引里有多少的网页数这件事看的很重。这些日子以来,他们真的不需要去吹嘘他们的索引量有多少,因为他们已经赢了这场战役。Bing甚至不跟Google玩。取而代之的是,Bing试图去索引网域里的所有内容,而且在页面上如果没有发现有足够的链接权重或价值来排进搜寻结果页面中,Bing会主动把网站从索引中删除。
而Google会索引每个档案,他可以在已知的网站上找到(甚至是一些不存在的就要感谢Javascript的功能内部URL可以被看见),Bing则会摒弃没有排名权重的页面。在多数情况下,为了要让页面可以被Bing索引,网站至少要有一个外部连结。根据Bing的前程序经理Brett Yount指出:在内部页面被索引之前,网站需要建立特定页面的反向连结。有一些例外,但这是目前Bing索引网站的标准作业程序。
Bing一定会继续发展他们的搜索引擎直到成熟。在未来的文章将讨论Bing的排名要素以及索引更新的能力。
awoo最近遇到了一个案例,某客户的网站改版完成重新上线之后,Google能够正常的索引到整个网站,但在Bing却是无法正常的索引,awoo使用Bing站长工具检测时发现:站长工具内居然显示网站被robots.txt给挡住了。
但奇怪的是,当时还没有上传robots.txt档案!正当事情逐渐演变成罗生门之际,我们发现了Bing在索引时真正造成问题的原因为何,我们透过301转址、正确的robots.txt、meta index follow、加速Bing来访速度等方式,使索引问题在一个礼拜左右的时间恢复正常,最后终于顺利解决了这个难得一见的问题。整个案例用几行文字就可以讲完,但其实在找寻问题及相关数据时,是很耗费人力跟时间的!所以awoo要提醒大家,在做SEO时,一定要先弄清楚是针对Google或是Bing抑或两者在做SEO,才不会费时费力却没有良好的排名结果!
转自awoo SEO研究团队