
しばらく、政治系エントリーが続きましたので、今日は、筆者の息抜き雑談エントリーをさせていただきます。(笑)
3月26日、産経デジタル株式会社は、ネットサイトのカテゴリ別検索エンジン「産経ディレクトリ」の提供を開始した。産経デジタルによれば、『産経ディレクトリに申し込み、審査を通過すると検索エンジンから評価の高い産経保有サイト(ペイジランク7以上サイト数は業界最多の6つ!)から、リンクを一括で獲得することができる』としていて、SEO(Search Engine Optimization)対策のひとつとして提供されるもの。
SEOとは「サーチエンジン最適化」や「検索エンジン最適化」などと訳されるのだけれど、サーチエンジンの検索結果で、上位に自分のサイトが表示されるように、あれこれ工夫することを指す。
一般に、ネット利用者は、サーチエンジンで検索された最初のページだけを見て、それらのサイトを訪問する場合が多く、企業などは検索順位を上げるために様々な試みをしている。
そのひとつの要素となるものが、ペイジランク。
ペイジランク (PageRank) とは、グーグルが開発したウェブページの重要度を決定するアルゴリズムのこと。グーグルの共同創設者ラリーペイジ氏にちなんで名づけられたペイジランクは、そこにリンクしているサイトの数とそのリンクの関係性の質に基づいて、全てのページに点数化された指数を割り当てる。
ペイジランクのスコアは、0から10の等級で示され、0が最低ランク、10が最高となる。ペイジランクを見ることで、グーグルがそのサイトをどう評価している分かるようになっていて、おおよそ次のとおりとされる。
ペイジランク無:評価外…グーグルに「評価外(評価対象外)」として認識されている又は、未認知のサイト。
ペイジランク0 :未評価…グーグルにサイトとして認識されているが、未評価と判定されているサイト
ペイジランク1 :「普通下」程度として評価・認識されているサイト
ペイジランク2 :「普通」程度として評価・認識されているサイト
ペイジランク3 :「普通上」程度として評価・認識されているサイト
ペイジランク4 :「良」相当として評価・認識されているサイト
ペイジランク5 :「優良」相当として評価・認識されているサイト
ペイジランク6 :「特良」相当として評価・認識されているサイト
ペイジランク7以上 :「別格」扱いとして評価・認識されているサイト
これらの中で、ペイジランク7以上は文字通り"別格"の格付け扱いとなっていて、世界的な公的機関や超大手のポータルサイトでもない限りこのランクにはならないとされている。一般的なサイトではペイジランク5がだいたい上限になるようだ。
このペイジランク技術は、ラリーペイジ氏がスタンフォード大学の計算機科学の博士課程に在籍していた当時、同じ博士課程に進んでいた、セルゲイ・ブリン氏と出会い、1997年1月に「大規模なハイパーテキスト的なウェブ検索エンジンに関する解剖」という共同で執筆した論文の中に登場した技術。セルゲイ・ブリン氏は後に、ラリーペイジ氏と共に、グーグルを創設することになる。
ペイジランクによるサイトのランク付けは、数学的なアルゴリズムに従って算出されるもので、人間が直接判定しているわけじゃない。何百万とあるサイトのひとつひとつを人の目で確かめることなんて不可能。
そこで、ペイジランクは、あるページから別のページへのリンクを、リンクされたページへの「支持投票」とみなし、それにリンク元のページの重要度の重みをつけて加算集計することで、ペイジランクを算出する。例えば、多くのリンクを集めているようなサイト、つまり重要だと世間から認知されているサイトから貰うリンクは重要視して、点数を高くして、そうでないサイトは点数を低くするというような操作をしている。
平たく言えば、「多くの良質なページからリンクされているページはやはり良質なページである」という判定を自動プログラム化したもので、そのページの価値は、世間の評判で決めて貰おうというもの。一種の民主主義的なランキング。
これは、引用に基づく学術論文の評価システムとよく似ている。学術論文も、重要な論文は沢山の人によって引用されるので、必然的に引用される数が多くなるのだけれど、これをネット上でやっているのがペイジランク。
では、相互リンクか何かで、滅多矢鱈にリンクを貰えばいいかというとそうは問屋が卸さない。「多くの良質なページからリンクされているページはやはり良質なページである」という判定基準は、裏返せば、「多くの良質でないページからリンクされているページはやはり良質でないページである」ということになるから、ペイジランクが低いサイトからのリンクを沢山貰っても、左程ペイジランクは上がらない。
ペイジランクは上になればなるほど、ランクを一つあげるのがとっても大変。それは、ランクを上げるための必要点数が指数関数的に増加するように設定されているからで、ひとつランクを上げる為には、大体、それまでに獲得した点数の6~7倍の点数を獲得しないといけないようになっている。次の表は、ペイジランクの内部アルゴリズム中で使われている、ペイジランクの実数値で、例えば、ペイジランク2になったばかりサイトがペイジランク3になるためには、5.4点を32.4点以上にすれば、よいのだけれど、ペイジランク3になったばかりサイトが、ペイジランク4になるためには、32.4点を194.4点以上にしなくちゃいけない。そしてその、ペイジランク4になったサイトが、ペイジランク5になるためには、1166.4点以上が必要になる。
こういう具合に、他のサイトからのリンク数及び重要度で、ランク付けを決めるやり方は、一種の人気投票だとも言える。
人気投票という意味では、人気ブログランキングも、参加ブログに貼り付けられている人気ブログランキングのバナーをクリックすることで順位を決める仕組みだから、これはそのまま人気投票によるランキング。では、人気ブログランキングとペイジランクの間には、果たして、相関があるのか。
本ブログも人気ブログランキングの政治カテゴリに参加しているのだけど、政治カテゴリ内上位100位(2012.4.1現在)について、それぞれのペイジランクを調べてみると、次のとおり。
政治カテゴリ中のブログのペイジランクは、最高が5で最低が0。それぞれいくつあるかというと、次のとおり。
PR5…10
PR4…38
PR3…32
PR2…16
PR1…2
PR0…2
となっていて、ペイジランク3から4が中心を占めていて、平均値は3.32。また、25位ごとの平均値を見ると次のとおり。
1位~25位 PR平均:4.08
25位~50位 PR平均:3.64
51位~75位 PR平均:2.80
76位~100位 PR平均:2.76
これをみると確かに人気ランキング上位のブログは、ペイジランクも高くなる傾向があり、それなりの相関があるように思われる。
まぁ、だからといって、どうだという訳ではないけれど、数と質の両方でランク付けするペイジランクと、主にクリック数という数に重きを置いた人気ランキングでも、それなりの相関が見えたという結果はそれなりに面白く感じている。

この記事へのコメント