サイト訪問者の皆様へ。お願いですから、サイト運営者の下記記事をお読みください。読んで下されば、「日本人の危機」であることが、明確です。


韓国人遺伝子の異常性へ


サーチエンジンとしてのグーグルの秀逸性は、ウェブページが、訪問される確率に応じて、検索順位は決定されるべきであるという根本発想にあります。

ページランク定義式①

グーグル創設者の論文→

に記載されている定義です

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))


①PR(A)は、ページランクの計算対象のウェブページAのページランクです。
②PR(T1)~PR(Tn) は、AページにリンクしているTページのページランクです。たとえば、Aページに5つのページがリンクしていれば、それぞれT1からT5の各ページを意味します。
③C(T1)~C(Tn)は、リンク元であるTnページに含まれる他のウェブページへのリンク数の総数を意味します。
④パラメーターdは、ダンピングファクターの略です。上記論文では、通常0.85に設定する旨明記しています。


(ご参考)

グーグル創設者論文のページランク定義に関する該当箇所の英語の原文(HTML版)を引用します。ただし、赤字強調は、私が加えました。 グーグル創設者の基本発想は、非常に多数のウェブページについて、ページ閲覧者が特定のページを訪問する確率に応じて、グーグル検索順位を決定するという点にあります。

The Anatomy of a Large-Scale Hypertextual Web Search Engine
Sergey Brin and Lawrence Page
2.1.1 Description of PageRank Calculation


Academic citation literature has been applied to the web, largely by counting citations or backlinks to a given page. This gives some approximation of a page's importance or quality. PageRank extends this idea by not counting links from all pages equally, and by normalizing by the number of links on a page. PageRank is defined as follows:


We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. We usually set d to 0.85. There are more details about d in the next section. Also C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Note that the PageRanks form a probability distribution over web pages, so the sum of all web pages' PageRanks will be one.


PageRank or PR(A)can be calculated using a simple iterative algorithm, and corresponds to the principal eigenvector of the normalized link matrix of the web. Also, a PageRank for 26 million web pages can be computed in a few hours on a medium size workstation. There are many other details which are beyond the scope of this paper.


ページランク定義式②

英文Wikipedia →

に記載されている定義です。



①N は、グーグルがページランクの計算対象とする全てのウェブサイトの数です。
②1-d/N となっているのは、ページランクは総和が1になるように計算されるからです。上記の定義式で反復計算して、総和が1になるように計算されるのです。(=確率です)



注意点(勘違いされやすい点)

①ページランクを意図的に上げようとされるご努力をされている場合について、分かりやすく端的に言えば、リンク相手方のトップページのページランクは、 無関係であり、外部ウェブサイトとリンク関係にある相手方のリンク元ページのページランクのみが、計算対象です。


②内部リンクの扱いについては上記特許文書にて、

a modification to avoid drawing unwarranted attention to pages with artificially inflated relevance is to ignore local links between documents and only consider links between separate domains.


意訳:意図的に増加させた内部リンク(=関連)によって、ウェブページへ不当な関心を引き寄せることを防ぐ修正(方法)は、ウェブサイト内の内部リンクを無視し、 別々のドメイン間のリンクのみを(ページランク計算対象として)考慮することである。


と明記しており、ページランク計算上は、無視されていると考えざるをえません。逆に言えば、ウェブサイト内で、内部リンク関係に基づき、ページランクが、比喩的に言えば、 再配分されていると考えざるをえません。


③上記の定義式は、あくまで単なる定義にすぎません。実際の算出には、他の重要な要素が加味されています。


④いわゆるリンクファームの場合のぺナルティー(インデックスされない)は、ページランク算出と無関係です。 (リンクファームとしてぺナルティーが課される前は、ぺージランク算出との関係では、パラメーター d が相当低い数値であろうという推測が成立するだけです。)