假設一個(gè)由4個(gè)頁(yè)面組成的小團體:A,B, C 和 D。如果所有頁(yè)面都鏈向A,那么A的PR(PageRank)值將是B,C 及 D的和。
PR(A) = PR(B) + PR(C) + PR(D)
繼續假設B也有鏈接到C,并且D也有鏈接到包括A的3個(gè)頁(yè)面。一個(gè)頁(yè)面不能投票2次。所以B給每個(gè)頁(yè)面半票。以同樣的邏輯,D投出的票只有三分之一算到了A的 PageRank 上。
PR(A) =PR(B) /2+PR(C) /1+PR(D)/3
換句話(huà)說(shuō),根據鏈處總數平分一個(gè)頁(yè)面的PR值。
PR(A) =PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)
最后,所有這些被換算為一個(gè)百分比再乘上一個(gè)系數q。由于下面的算法,沒(méi)有頁(yè)面的PageRank會(huì )是0。所以,Google通過(guò)數學(xué)系統給了每個(gè)頁(yè)面一個(gè)最小值1-q。
PR(A) =(PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)+...+PR(N)/L(N))q+1-q
所以一個(gè)頁(yè)面的 PageRank 是由其他頁(yè)面的PageRank計算得到。Google 不斷的重復計算每個(gè)頁(yè)面的 PageRank。如果您給每個(gè)頁(yè)面一個(gè)隨機 PageRank 值(非0),那么經(jīng)過(guò)不斷的重復計算,這些頁(yè)面的 PR 值會(huì )趨向于正常和穩定。這就是搜索引擎使用它的原因。
其中,PR(A):指網(wǎng)頁(yè)A的佩奇等級(PR值)
PR(B)、PR(C)...PR(N)表示鏈接網(wǎng)頁(yè)A的網(wǎng)頁(yè)N的佩奇等級(PR)。N是鏈接的總數,這個(gè)鏈接可以使來(lái)自任何網(wǎng)站的導入鏈接(反向鏈接)。
L(N):網(wǎng)頁(yè)N往其他網(wǎng)站鏈接的數量(網(wǎng)頁(yè)N的導出鏈接數量)
q:阻尼系數,介于0-1之間,google設為0.85.
從上面的公式我們可以看到網(wǎng)頁(yè)A的PR是由鏈接它的其他網(wǎng)頁(yè)L(N)所決定的。在網(wǎng)頁(yè)L(N)中如果有一個(gè)鏈接指向網(wǎng)頁(yè)A,那么A就得到了一個(gè)“投票氣而這個(gè)投票來(lái)自網(wǎng)上任何一張網(wǎng)頁(yè)。每個(gè)“投票”都是表示一份“支持”。越多的鏈接指向網(wǎng)頁(yè)A,網(wǎng)頁(yè)A的PR值或者等級就越高。沒(méi)有鏈接就是沒(méi)有一個(gè)網(wǎng)頁(yè)支持A。
但是不同網(wǎng)頁(yè)的PR值不同,所以不同的網(wǎng)頁(yè)給網(wǎng)頁(yè)A的投票權重是不一樣的。
完整的PR值計算方法
這個(gè)方程式引入了隨機瀏覽的概念,即有人上網(wǎng)無(wú)聊隨機打開(kāi)一些頁(yè)面,點(diǎn)一些鏈接。一個(gè)頁(yè)面的PageRank值也影響了它被隨機瀏覽的概率。為了便于理解,這里假設上網(wǎng)者不斷點(diǎn)網(wǎng)頁(yè)上的鏈接,最終到了一個(gè)沒(méi)有任何鏈出頁(yè)面的網(wǎng)頁(yè),這時(shí)候上網(wǎng)者會(huì )隨機到另外的網(wǎng)頁(yè)開(kāi)始瀏覽。
為了對那些有鏈出的頁(yè)面公平,q = 0.15(q的指阻尼系數)的算法被用到了所有頁(yè)面上,估算頁(yè)面可能被上網(wǎng)者放入書(shū)簽的概率。
所以,這個(gè)等式如下:

p1,p2,...,pN是被研究的頁(yè)面,M(pi)是鏈入pi頁(yè)面的數量,L(pj)是pj鏈出頁(yè)面的數量,而N是所有頁(yè)面的數量。
PageRank值是一個(gè)特殊矩陣中的特征向量。這個(gè)特征向量為

R是等式的答案

如果pj不鏈向pi, 而且對每個(gè)j都成立時(shí),等于 0

這項技術(shù)的主要缺點(diǎn)是舊的頁(yè)面等級會(huì )比新頁(yè)面高。因為即使是非常好的新頁(yè)面也不會(huì )有很多上游鏈接,除非它是某個(gè)站點(diǎn)的子站點(diǎn)。
這就是PageRank需要多項算法結合的原因。Google經(jīng)常懲罰惡意提高PageRank的行為,至于其如何區分正常的鏈接交換和不正常的鏈接堆積仍然是商業(yè)機密。
但是我們始終堅持一點(diǎn)是,大家不要刻意的去追求PR值,因為影響排名的因素有上百種。建議網(wǎng)站設計人員可以充分認識佩奇等級在google優(yōu)化排名中的重要作用,從設計前的考慮到后期網(wǎng)站更新都要考慮一下佩奇等級。從而很好的利用google PageRank。

