
- 田中 友尋
- 株式会社ハマ企画 代表取締役社長
- Webプロデューサー
対象:ホームページ・Web制作
- 原島 洋
- (Webプロデューサー)
- 井上 みやび子
- (Webエンジニア)
Google、ウェブクローリングについて
ZDNET「グーグル、ウェブクローリング作業の範囲を公表」から一部参照。
Googleは自らのブログにて、ウェブクローリングをindex化について公表しました。
以下は要点です。
1.ネットサーフィン
ネットサーフィンを行い、リンクで構成されている全てのページをたどり膨大なリンクのリストを作ります。
Google曰く、ウェブページの数は 1日数十億ページ増加しているとのこと。
2.PageRank
PageRankをつくるためにリンクリストから「リンクグラフ」を用いて解析します。
PageRankは、常にネットサーフィンを行い、「1日数回」リンクグラフを再計算を行っているとのこと。
GoogleによるWEBサイトの評価対象は「リンクグラフ」であり、この部分はまだブラックボックスのようです。
検索エンジン市場の中で一番重要な部分となるため触れていませんが、index化の流れを公表したのはとても凄いことだと思いますね。
ハマ企画