一个文科生对于PR算法的研究 2012-06-13 来源: 卓杰科技(www.zhuojie.net) 浏览:

对于PR来说,一个高不是高,巨匠高才是真的高!

远程跳转是解决链接陷阱的通用体例,就是PR的传递并不局限于出链的传递,也可以以必然的概率向肆意矣闽页面传递PR。

PR计较出来的结不美观是对网页主要性的评估,作为网页排名其中的一个身分。但PR是一个全局性的算法,和具体发芽无关,即和相关性无关的。PR高不能声名该网页相关。假如搜索引擎只用PR这一算法进行排序的话,那无论你输入任何的发芽词,输出的结不美观都是一样的,谁PR高就谁排前面。

质量假设:指向该页面的入链的质量分歧,质量高的网页会经由过程链接传递更多的权重,越是质量高的网页指向该页面,则暗示该页面越主要。也就是一个好的网页必定也会获得其他好的网页的认同。

PR算法首要基于数目假设和质量假设两个方面考虑的。

数目假设:该页面收到越多的入链(其他网页对该页面的链接称为入链),则暗示该网页越主要。也就是一个好的页面必定会获得良多其他页面的举荐。

文章来历:光年论坛

所有的算法城市有个假设前提,所有假设都是基于用户行为的剖析。而算法就是把这些剖析公式化。

经由过程以上两个假设,PR算法刚起头会遴选一批网页作为种子网页并赋予较高的PR,经由过程迭代递归算法计较来更新每个页面节点的PR得分,直到得分不变为止,即为当前页面PR得分。

过度追求PR的结不美观往往得不偿失踪,PR主要吗?PR不主要吗?看不美观园去!

PR的计较很简单,假如A网页有两个出链分袂毗连到B网页和C网页。假如A网页的PR值是1,那么以概率平均分配的原则,B和C网页城市平均获得0.5值的传递。这种计较体例是成立在随机游走模子上的,随机游走模子是指假设这个网页有三个出链,用户点击每个出链的概率是一样的,所以传递的PR值也是一样的。

这种反作弊是基于假设:

此外,有些网页只有入链没有出链,那么会导致积储的PR质ё俳来越高,而不能传递出去。这样会违反PR的设计初衷,影响公允性。这种结构被称为链接陷阱。

PR算法作为谷歌标识表记标帜性算法,早已普遍运用到反作弊傍边,即以遴选出一批作弊网页作为种子网页(遴选信赖网页也亦然),给以必然的作弊分值(或信赖分值),跟PR算法一样进行传递,设定一个赏罚阀值,达到则为作弊网页。

因为网页之间是互相毗连的,所以PR不能一向轮回传递下去,否则最后所有网页的PR值城市无限年夜。所以PR算法惹人了衰减因子的概念,即是中转的次数越多离种子网页越远,传递的PR质ё俳少,直到传递值为0得分不变为止。才计较最后PR得分,插手排序结不美观的计较中。

一、如不美观一个网页将其链接指向作弊网页,则这个网页很可能也是作弊网页。

二、如不美观一个网页被作弊网页指向,则不能声名这个网页是作弊的。

当然这只是最原始的反作弊思绪。研究搜索引擎算法不应该只盯着公式看,要看这个算法解决了侍趵硎题,是基于什么样的假设,这种假设是不是合合用户行为。体味了算法的前因后果,才能更好的知道搜索引擎解决问题的体例。这样才是进修seo的王道!

体味轨则是为了更好的运用轨则,避免违反轨则受到赏罚。

作为一个文科生,我给巨匠最后的忠言是:爱护保更生命,远离公式!!!

在线咨询

020-89202380