HOME > SEOニュース
 > 特定のウェブサイトの「過去」を知る方法


特定のウェブサイトの「過去」を知る方法

 

特定のウェブサイトのURLを入力するだけで、そのウェブサイトの過去が時間を遡って分かってしまうタイムマシンのようなウェブツールのご紹介です。

Way Back Machine (ウェイバックマシーン)

Way Back Machine(ウェイバックマシーン)は、 Internet Archive(インターネット・アーカイブ)が運営するウェブアプリケーションで、 任意のURLを入力して検索すると、そのURLの過去ページ一覧がずらっと出てくるタイムマシンのようなツールです。

上図は、ウェイバックマシーンで、「http://www.apple.com/」(アップルコンピュータのウェブサイト)を検索した時の結果です。 ご覧のように、アップルコンピュータのアーカイブが、1996年から2007年末までの一覧が表示されます。

では、1997年4月4日時点のアップルコンピュータのウェブサイトを見てみましょう。

いまのMacのサイトから想像できないくらい、なんとも簡潔なウェブサイトデザインです。
昔は、こんなサイトだったのですね〜。

このように、知りたいウェブサイトの過去のコンテンツを簡単に知ることができる、大変便利な無料ツールですので、ぜひ皆様も使ってみてください。

SEO視点からの使用方法

弊社では、このウェブツールは次のような用途で使用しています。

1. サイトテーマをサイト公開時から遡って調べるため。
2. 中古ドメインや、ドメイン(サイト)の譲渡の有無を調べるため。
3. 過去に、スパム行為を行っていなかったか調べるため。

サイトテーマ(性)は、SEOでは重要な要素の一つです。
テーマは継続して一貫している必要がありますので、ウェブサイトの公開時点から順を追ってテーマがブレていないかを検証します。

また、最近、中古ドメインを購入する人が増えているようです。
ドメインは、新しいものよりも古いものの方が有利という考え方から、中古ドメインを購入するのですが、検索エンジンは、中古ドメインや、ドメイン譲渡を見破っています。

検索エンジンは、ウェイバックマシーンのように、ウェブサイトの過去データを保存して時系列で管理しています。そのため、ある時点でドメインの所有者が変わったり、サイトのテーマが大きく変わった場合、すぐに分かるようになっています。
検索エンジンが、中古ドメインやドメイン譲渡と判断した場合には、今までのドメインの評価はゼロカウントになりますので、高いお金を払って中古ドメインを購入しても無駄になります。

ウェイバックマシーンの仕組み

仕組みは、とても簡単で、インターネットアーカイブが自主運営してしているクローラーを使って、世界中のウェブサイトを収集、保存しているデータを一般に公開しているのです。
確かに仕組みは簡単なのですが、「運営」となると、想像を絶するほど大変なことです。

いま世界中には、80億以上のウェブページが存在していると言われていますが、インターネットアーカイブは、2007年だけで、20億ページをクロールして、データを保存しています。(なんと世界中の4分の1!)
これは、世界のアーカイブサイトでは、最大です。

これら収集してきたデータを整理し、正確に保存すると、いったいどのくらいのサーバーが必要になると思いますか?

前回、Googleのサーバー数についてお話したときに、Googleでは、20万台のサーバーを世界中に保有していると言いましたが、インターネットアーカイブは、少なくともその10分の1のサーバーは保有していると思われますので、2万台のサーバーを管理・運営していることになりますので、大変なことです。(あくまでも予想ですが。)

インターネットアーカイブは、運営目的として次のように述べています。

「インターネット上にある歴史的・文化的デジタルデータを貴重な"遺物"として保存、一般に閲覧できるよに提供すること。」

すばらしい考え方です!