HOME > SEOニュース
 > Matt Cutts、グーグルのインデックス性能を語る


Matt Cutts、グーグルのインデックス性能を語る

 

Matt Cutts、グーグルのインデックス性能を語る

グーグルのMatt Cutts氏が、8月7日に自身のブログ上で、グーグルのインデックス性能について「昔と今」の感想を書いています。

長い文章ですが、概要をまとめると、「昔のグーグルのインデックススピードは、数ヶ月以上かかっていたのに対して、今のインデックススピードは、ウェブページをアップしてから数分後には検索結果に登場するほど性能がアップしている」というものです。

下記に原文の全文訳を掲載しましたので、ご覧ください。なお、直訳に近いものになっていますので、分かりにくい表現があるかもしれませんが、ご了承ください。また、画像は同氏のブログ上に掲載されているものをそのまま掲載させていただきました。

スカッと新鮮なインデックス(全文訳)

2007年8月7日 12:15am Google/SEO

2000年の始め私が入社した当時は、インデックス(索引作業)を3〜4か月或いはもっと長い期間更新しないという時期がありました。その当時はそれほど問題ではありませんでした;1年以上更新されなかったサーチエンジンもあったと記憶しています。
2000年の中頃になって、Googleはほぼ毎月のペースでインデックスを更新するようになってきました。以前は月の満ち欠けを見て次の"Googleダンス"(更新)のタイミングを予測できたと言われるほど月1度のペースになっていました。

さて、2003年夏の"更新フリッツ"を覚えている方は挙手願います。あれがまさにGoogleダンスが月1度の更新から頻度が増えたポイントと言えるでしょう。それはつまり私たちのクロール/インデックスチームがインデックスの中のほんの一部分ではありますが、ほぼ毎日更新作業をしたという意味です。当時Googleには通常のクロールだけではなく"フレッシュクロール"が存在しましたので、文書がその新鮮なクロール内にあった場合、Googleの検索結果の抜粋文書内(英語でShippet)に日付を表示することもありました。

Googleのクロール/インデックスチームの続けてきた努力によって、Googleのインデックスがより新鮮になってきていることは明確になりつつあります。現時点で、すでにいくつかの文書は何時間後何日後ではなく何分後という速さで表示されることが可能になりました。

サーチエンジンの改良(より新鮮に、より大きく、より関連性の高い)が進むにつれて、人々の期待も高まってきていると感じています。今ではニュースイベントなどの情報のインデックスをサーチエンジンが更新するのを1か月も待つということは考えられませんが、数年前まではそれがごく普通のことだったのです。新鮮なインデックスとの出会いを数回体験するだけで、その期待が高まることは間違いありません。以前の私のイメージでは"通常、多くのサーチエンジンに表示されるまでには数日近くかかる"という印象でしたが、"まさか!そんなに速いの!"という私が今夜体験したことを説明します。

私が頻繁に行うことですが…Googleリーダーで遊んでいた時に、オフラインリーディング(Googleのギア)の為のリーダーズコードへの更新があるというメッセージを見ました。私の経験では、もし私が次のページに移動すると、そのコードの更新のためのリンクとともにその小さなメッセージまでも失ってしまうはずです。(なぜそうなるのかは不明ですが、それは置いておいて)。なのでリンクをクリックして、オフラインリーディングの為の私自身のコードを更新しました。

その作業の過程で、ちょうど最近読んでいたペルシアに関するRich Skrentaのブログを失ってしまいました。その時点ではそのブログはまだ読み終えていませんでした。さてどうすれば良いでしょうか?私はGoogleにアクセスして[skrenta blog]と入力し検索しました。そして読みかけのSkrentaのブログを見つけ、無事読み終わることができました。

さて検索結果で私が見つけたものは何だったでしょうか。そのSkrentaのブログからの抜粋文書の下には7時54分(PST;太平洋標準時)彼によって更新されたという表示が出ていたのです。ちなみに私がこの検索をしたのは8時44分(PST)頃でした。つまりSkrentaさんがブログ更新のボタンを押してから、私がそれをGoogleのメインサーチインデックスで見られるようになるまでに1時間もかからなかったということです。

信じられませんか?下記の実際の表示画面で7時54分pmという更新時間が確認できます。

私はSkrentaさんの別のブログ上に簡単なコメントを残すことによって、この時間表示が太平洋標準時かを念のため再確認しました。

また下記の表示画面にてSkrentaさんのブログからの抜粋文書が検索結果画面に公開されるまでに1時間もかかっていないということが確認できます。

これはまさにスカッと新鮮なインデックスと言えるでしょう。?膨大なページをより速く更新するためには、多数の優れたデザインとインフラ(設備)が必要不可欠でしょう。ウェブ文書を敏速に再クロール、インデックスそしてランク付けする能力を改良し続けているGoogleスタッフ達を祝福したいです。

更新;私は10分おきぐらいにチェックしていただけですが、このブログがクロールされインデックスされそして検索可能な状態になるまでには30分もかかっていないでしょう。