図1を用いて計算方法を説明します。
まず、全てのWebページはそれぞれPageRankをもっています。 そしてこの値はそのページがリンクしている先に均等に分配されます。
この場合100は50づつに9は3づつに分配されることになります。 すると、Aは53とBは3、Cは50のWebページと計算できます。 ページランクは高いほど重要であるということを意味し、サイトの重要度を測る指標となっています。
YSTにおいても重要度をなんらかのアルゴリズムで計算していると考えられます。
ページランクをどのように計算するのか?
まず、リンク関係を行列の形で表わしてみます。 あるページ i から別のページ
j へリンクが張られている場合にはその成分を 1 とし、そうでない場合を 0 とします。
すなわち、行列 A の成分 aij は
aij = 1 if (ページ i からページ j へのリンクが「ある」場合)
|
| 0 if (ページ i からページ j へのリンクが「ない」場合) |
で表わされるとします。 文書数を N とするとこの行列は N×N のN次正方行列になります。 これは、グラフ理論で「隣接行列」と呼ばれるものに相当します。
PageRank の計算は、この推移確率行列の最大固有値に属する固有ベクトル(優固有ベクトル)を求めることにほかならない。 なぜなら、線形変換系の
t →∞ での漸近挙動は、変換行列の絶対値最大の固有値とそれに属する固有ベクトルによって本質的に記述されることがわかっているからです。 言い換えれば、推移確率行列で表わされる確率過程は、この行列の掛け算を繰り返したものを調べることで、行き着く先の状態の確率を計算できると言うことになります。
R=cAR (c:定数 R:Aの固有ベクトル)を繰り返し計算することになります。
ここで思いませんか?どうしたら現状のPageRankで上位に表示させることができるのか?
これが一番大事なところであり、弊社の出番なのです。
|