サイト訪問者の皆様へ。お願いですから、サイト運営者の下記記事をお読みください。読んで下されば、「日本人の危機」であることが、明確です。


韓国人遺伝子の異常性へ


ダンピングファクター(damping factor) d を可変値とすることで、 グーグルは意図的(=SEO目的)被リンクに対応している

ページランク=理論上はウェブページが訪問される確率です(正確には、確率分布)

ページランクベクトルとその固有値との関係等理論上の問題について、知られたい方は、 「固有値について」をお読みください。 英米の学者によれば、ペロンフロベニウスの定理(注)から、 ページランクベクトルの単一性及び理論上の収束可能性(=パワー法が有効)が導かれるのだとされています。

ページランクの特許公開文書 →

にて、
現実のページランク算出に用いられる行列の定義式が、下記のとおり、明記されています。(一般にグーグル行列と呼ばれます。)なお、パラメーター d=1-αの関係となります。


A=(α/N ×1)+(1-α)B 


(備考)
①ページランクに関する特許の米政府公式ページは、コチラですが、図が含まれていないため、グーグルの特許関連ページを使用しています。

②αを可変値として計算する場合には、上記Aのグーグル行列中、1は、数字の1ではなく、要素が全て1であるN×Nの行列です。

①Aは、実際の計算において反復して乗ずるべき行列です。英語で、グーグル行列と呼ばれます。ページランクの計算方法の原理ご参照

②Nは、計算対象のウェブページ数です。

αは、通常0.15とする旨明記しています。なお、このウェブサイトの他ページで主にパラメーターdを使用していますが、1-d =α です。

④Bは、リンク関係がある場合には、1/nì (発リンク数で割った数値です。)リンクなしの場合0をいれた次のようなN×Nの行列です。(下例では、N=3です。)

  X Y Z
X 0 0 1
Y 0.5 0 0
Z 0.5 1 0

(1)α=0.85 の固定値とする場合。

ページランクの特許公開文書等で、上記αの基準値は、0.85である旨繰り返し述べています。
②上記例のグーグル行列を行列形式で示せば、(N=3)


α/N ×1は
  X Y Z
X 0.05 0.05 0.05
Y 0.05 0.05 0.05
Z 0.05 0.05 0.05

(1-α)Bは、
  X Y Z
X 0 0 0.85
Y 0.425 0 0
Z 0.425 0.85 0

となり、グーグル行列は、
  X Y Z
X 0.05 0.05 0.9
Y 0.475 0.05 0.05
Z 0.475 0.09 0.05
となります。

実際の計算で使用されるグーグル行列は、上記のような行列の要素に 0 を全く含まない行列です。
このようなタイプの行列でなければ、ページランクベクトルが、一意的に定まらず、また、パワー法によって収束値を得ることができない旨既に証明されています。

(2)α を可変値とする場合

ページランクの特許公開文書及びGoole創設者の論文 (The Pagerank Citation Ranking:Bringing order to the web)では 、ページランクを人為的に引き上げようとする場合を考慮して、α を可変値とするとしています。

以下に、ページランクの特許公開文書該当部分を引用しておきます。
As already mentioned above, rather than including the random linking probability α equally among all nodes, it can be divided in various ways among all the sites by changing the 1 matrix to another matrix. For example, it could be distributed so that a random jump takes the surfer to one of a few nodes that have a high importance, and will not take the surfer to any of the other nodes. This can be very effective in preventing deceptively tagged documents from receiving artificially inflated relevance. Alternatively, the random linking probability could be distributed so that random jumps do not happen from high importance nodes, and only happen from other nodes. This distribution would model a surfer who is more likely to make random jumps from unimportant sites and follow forward links from important sites.

上記から明らかなように、意図的にページランクを引き上げようとしているページであると判定された場合には、低いパラメーター d の数値が適用されます。(0.85より小さいことです。)

なお、政府関係機関(アメリカであれば、.gov のドメイン)からの被リンクを有する場合には、逆に、高いパラメーター d の数値が適用されると推定されます。同様に該当部分引用します
Additional modifications can further improve the performance of this method. Rank can be increased for documents whose backlinks are maintained by different institutions and authors in various geographic locations.

②α を可変値とする場合、A=(α/N ×1)+(1-α)B 中の1は、数字の1ではなく、下記のような要素が全て1であるN×Nの行列です。

1 1 1
1 1 1
1 1 1

(この行列をわざわざ使用する理由の推察)
例えば、あるウェブページのグループ(リンクファーム等)に対しα=1と設定し、バックリンク評価値(1-α)Bをゼロとした場合、この行列を使用しなければ、逆に、 数値配分上のベース値(α/N ×1 )は、大きくなってしまいます。しかしこの行列の数値を変えれば、 数値配分上のベース値(α/N ×1 )を下げることができます。
なお、この場合、合計を1にしますので逆に他のウェブページのグループ(政府機関ウェブサイト等々)のベース値(α/N × 1 )を大きくする必要が生じます。

上記例のα を可変値とするグーグル行列を行列形式で示せば、


(例)あるウェブサイトのグループについてのみ、α=0.6とする場合。

A=(α/N ×1)+(1-α)B

①α/N ×1 は、N=3, 0.15/3で、

0.15/3*
1 1 1
1 1 1
1 1 1
0.05 0.05 0.05
0.05 0.05 0.05
0.05 0.05 0.05

上記のように全て固定ではなく、下のようにα=0.6であれば
0.15/3*
0.4 0.4 0.4
1 1 1
1 1 1
0.02 0.02 0.02
0.15 0.15 0.15
0.15 0.15 0.15

②(1-α)Bは、

1-αは、
1 1 1
1 1 1
1 1 1
0.6 1 1
1 0.15 1
1 1 0.15
0.4 0 0
0 0.85 0
0 0 0.85
×B
0 0 1
0.5 0 0
0.5 1 0
0 0 0.4
0.425 0. 0
0.425 0.85 0

①+②は、

0.02 0.02 0.42
0.575 0.15 0.15
0.575 1 0.15
となり、この例では、次のように修正します。
0.02/1.17 0.02/1.17 0.42/0.72
0.575/1.17 0.15/1.17 0.15/0.72
0.575/1.17 1/1.17 0.15/0.72
合計 1 1 1

となり、およそ

0.02 0.02 0.58
0.49 0.13 0.21
0.49 0.85 0.21
合計 1 1 1

となります。

上に引用したページランクの特許公開文書によれば、グーグルは、 意図的に被リンクを増加させていると判定した場合には、このようなにαを可変値とする手法で、ページランクを算出しています。繰り返しますが、その正確な手法(特に判定基準)は、不明であり、上記は、その1例にすぎません。

そうでなければ、数百~数千のウェブサイトから構成されるいわゆるリンクファーム・自動相互リンクプログラム・熱心な手動の相互リンク努力等々により、 ページランクによるウェブページ評価というgoogleの根幹をなす技術が、意味をなさなくなるからです。


(注)
ページランクに関係するペロン・フロベニウスの定理に関する数学者による解説内容は、次のとおりです。

Carl D. Meyer, 「Matrix Analysis and Applied Linear Algebra」 (The Society for Industrial and Applied Mathematics, Philadelphia, 2000) より。
(ページ数は、Adobe Reader 8による。)

*P673 ペロン・フロベニウスの定理
以下、英語原文引用。ただし、赤字・太字は、私が勝手に入れたものであり、原文にはありません。

Perron-Frobenius Theorem

If An×n >0 is irreducible, then each of the following is true.
・ r = ρ (A) ∈ σ (A) and r > 0. (8.3.6)
・ alg multA (r) = 1. (8.3.7) ←(注)algebraic multiplicity の略。代数的重複度=1。
・ There exists an eigenvector x > 0 such that Ax = rx. (8.3.8)
・ The unique vector defined by Ap = rp, p > 0, and ||p||1 = 1, (8.3.9)←(注)L1ノルム。ページランクの合計は、1です!。
  is called the Perron vector.
 There are no nonnegative eigenvectors for A except for positive multiples of p, regardless of the eigenvalue.
(以下、省略。)
・この次に証明がありますが、省略。

上記内容を、普通の言葉で表現すれば、N×Nの正方行列が、既約で、かつ、要素の全てが正であれば、固有値にかかわらず、合計が1になる固有ベクトルは、正で単一のpベクトルとその正のa倍しかない。つまり、ページランクは、"ペロンベクトル"に他ならないということになります。

引用した線形代数のテキストは、下記のウェブサイトでダウンロードできます


線形代数のテキスト入手 →



リンクファームとは?

日本語では、「多数の相互リンクを意味する」と誤解されている場合も多いようですが、英文のWikipedia にもあるとおり、リンクファーム内部において、参加しているウェブサイト全てが完全に相互リンクしているウェブ上のグループを意味し、ほとんどの場合には、自動プログラムによって運用されています。