seo的数据剖析概述与案例
经常有人让我辅佐简单说说seo相关的数据剖析怎么做,甚至期望能几小时速成。但这方面涵盖的太多,不成能言简意赅就说尽,也不知可年夜哪里简单归纳综合。
seo是一个很是不成熟的行业,能参考的资料极有限,年夜年夜都工具都要经由过程数据来试探,而试探的过程中,往往能揭露凭过往的直觉没有意识到的秘闻。所以数据化有时对于seo长短常残酷的,往往一份简单的数据就可以否认失踪一群人数年的全力工作。
就拿最常见的例子来说,seo流量是怎么组成的?年夜年夜都人感受那是靠热点关头词撑起来的,或者认为是年夜量的热点关头词撑起来的,于是认为热点辞书排名上去流量必定会涨,却否则。对于年夜年夜都稍年夜的网站,绝年夜年夜都seo流量都是由百度指数都没法看到的极其长尾的词带来的。是以哪怕用再年夜的实力去做热点辞书排名,它们进献的流量依旧很有限。
或许有人会认为这不成思议,因为年夜来没看到过这样的数据。但这数据是只有经由过水平析网站的原始日志才能得出的结论,而Google Analytics此类采样率极低的统计系统无法看到这样的数据。更不提哪怕会谙练用GA的seo也甚少,是以seo流量的秘闻几乎是年夜不被人看到的。
所以,有时听人说“seo已死”,而我经常说“seo还没活过”,一点也不夸年夜。
若何起头进修数据剖析
seo的最终目的是给网站发生收益,是以焦点指标有两个:转化、流量。
好比流量再可以细分:流量 = 收录 * 排名 * 点击率 * 搜索量
收录可以再细分:收录 = 抓取量 * 页面质量
而好比抓取量,它的瓶颈依情形,可能是抓取时刻封顶、可能是抓取总量封顶、可能是页面总量封顶。各类情形都有分歧的措置体例,需插手分歧的数据指标。
经由过程近似这样的分法,年夜最终数据指标(转化、流量)可以慢慢细扶持几十几百个数据指标,这些数据指标都是有用的,因为它们的数值变换往后,最终也会影响到转化或流量。
(有本热点的seo书籍,花了很年夜的篇幅去写了对一个网站剖析并操作的实例,但最后阿谁网站的seo流量却很低,没见多年夜效不美观。因为尽管其中有年夜量的“剖析”,却多是在看没意义的数据。)
当一个首要数据指标发生波动的时辰(最常见的是总流量变换),就需要经由过程细分数据来剖析具体的原因,后面有两个举例说起年夜致思绪与轨范。
之间涉及到的面则很是广——
首先要体味搜索引擎的基本事理,这才能知道在什么情形下什么数据指标是有关的;
之后需要对多种手艺的入门级常识,因为各类数据的获取体例都分歧,有些需要采集、有些需年夜日志提取、有些年夜数据仓库导出、有些年夜API获取等等,需要进修的标的目的不尽不异;
单单的数据只是数字,还需要剖析数据才能让它发生价值。姑且性的剖析一般用到Excel,监控类的剖析则需要自己做个能输出图表的报表系统。
这些至少要花个半年功夫才能学会,但并不算难,没有什么可害怕的。就如进修1+1时城市感受9*9是难的,但学会后再往回看,那就没什么了。
一个基本的设想案例剖析
假设个较接近于现实应用的例子:
一个游戏类论坛,A板块为网盘游戏下载,良多页面上有到X网盘的导出链接;B板块为BT下载,页面上有一个站内的种子下载链接,无站外导出链接。
起头剖析:
统计页面的抓取数目与即时收录数目,并计较之后,发现A板块的页面质量较着低于B。(页面质量 = 收录数目 / 抓取数目)
那么此时猜测,是否是A板块帖子页面上,X网盘的导出链接导致了它的页面质量低?
为了验证猜测,再将A板块的帖子页面分为两组,其中aa组有X网盘的导出链接、bb组没有X网盘的导出链接。分袂计较其页面质量。如不美观aa组帖子的页面质量较着低于bb组,那么可以得出初步结论:
“X网盘的导出链接,使得自身帖子页面质量降低,影响到收录量,并最终导致seo流量受损。所以需将该类导出链接做非凡措置,好比由自己站内URL,301跳转到X网盘等。”
当然这个结论未必是正确的。好比,aa组帖子具备的特征,除了具有X网盘的导出链接外,也可能具备的特征如转载帖子斗劲多(游戏资本贴良多会是转载),可能是后者真正导致了其页面质量的低下。
尽管更严谨的数据剖析(好比再将转载帖子与非转载帖子分组)更可能得出切确的结论,但这捌揭捉谨下去就没个头了,seo事实下场不是火箭科学,在某步的数据获取很有难度时,借助经验来猜测下可能更划得来。
所以可以先实施项目,然后再监控整个A板块相对B板块的页面质量是否有拉近,年夜而以最终效不美观来证实之前的猜测正确与否。
尽管这个例子完全为假设,我并不确定现实情形中,帖子到网盘的导出链接是否会影响到页面质量。但近似的例子常日能碰着良多,且此类剖析的时辰所需的数据收集起来便利,是以这是日常seo数据剖析最轻易碰着的一类情形。
一个进阶的现实案例剖析
(数字与现实数值不等,但年夜致比例不异)
内页的流量在某一时刻段年夜幅度下降,需剖析其下绞ё侪因。
一个常用且管用的思绪是,取25%的热词,看它们带来的流量、与此外75%词分袂的转变。如不雅概念出的数据是热辞书流量下降多,即多半为热辞书排名有下降;如不美观下降水平相当,则为整体的影响。
首先,计较得出25%的热点关头词,它们的流量下滑幅度为35%;而75%的非热词,它们的流量下滑幅度为30%。
但虽然数据差了5%,但差距还不是出格较着,需要进一步剖析才能确定。
因为关头词往往是可以被进一步分辞书,如“seo文章”可进一步分为两个检索词——“seo”、“文章”,而且检索词才是搜索引擎真正在措置的。所以进一步的剖析就去剖析25%的热点检索词流量的转变。
最终得出的数据是,包含25%热点检索辞书关头词流量下降了40%,不包含热点检索辞书词流量仅下降10%。
那么结论就很清楚了,热点检索词相关的流量发生了转变。之后对比网站近期的项目上线列表,没有涉及到这部门的改削,所以这是百度的算法调整所导致的。
知道了流量的变换原因后,自瘸景M可以有一些响应的改良方案了。尽管方案能执行与否尚取决于网站对seo的重考水平,但至少不用砌词于:“百度老是喜欢K我们的站”之类。
文章来历:semwatch.org
注:相关网站培植技巧阅读请移步到建站教程频道。
本页关键词:
上一篇:淘宝为什么屏障百度搜索 下一篇:网站过度优化导致降权的因素