[PR]テレビ番組表
今夜の番組チェック

シンプルのロゴ画像

ホームページを保存するインターネットアーカイブ(ウェブアーカイブとも呼ばれる)について、初心者向けにシンプル解説。更新日:2002年04月29日。

<< |ホーム |リンク集 |ヘルプ |>>

ホーム >1ページ目 >2


インターネットアーカイブ:ホームページよ、よみがえれ!

ネット初心者のために、今回は、2001年あたりからサービスを始めて、いろいろな雑誌に取り上げられたInternet Archive(以下、インターネットアーカイブ。サイトはhttp://www.archive.org)について、取り上げてみたいと思います。なんと、世界中のホームページ、その数100億ページを保存、公開しているそうです。ホームページを作る人、見る人には必ず、必要となる知識でしょう。

はたして、このサイトはどんなときに必要となるのでしょうか。

注:100億ページという数字は、インターネットアーカイブ自身が言っていること。参考>>「Internet Archive:News(http://www.archive.org/wayback/press_kit/background.html)」のCollectionsの項

目次

1ページ目
  1. ホームページは消える
  2. ホームページを保存せよ
  3. インターネットアーカイブを使う
  4. 私の考察「反対派、賛成派。あなたはどちらの立場?」

1,ホームページは消える

インターネットで、ぼんやりとホームページを見ていますと、「not found」という言葉が出てきます。これはどういう意味なのでしょうか。

アドレスを見ると、ちゃんと入力されています。以前はちゃんと存在したページのようです。つまり、上に挙げた「not found」というのは、「もうないよ」という意味なのです。

そのように表示されたページは、もう、ネット上にはありません。そのページの作者、あるいは他の誰かが、そのホームページを消してしまったのです。ですから、見つけることは出来ません。すると、せっかく、リンク(もしくは引用)をしても、消えると参考にならないなど、困ったことが起きます。

もっと、たくさんあるかもしれません。みなさんも、検索エンジンを使うと、そんな困った経験がありませんか。

2,ホームページを保存せよ

消えたホームページは、どこを探しても見つかりません。ページの作者がもう一度、用意するしかないのです。

そこで、ホームページを自動に保存して、消された後でも見せようと言う動きが出ています。

有名かも知れませんが、「Google」という検索エンジンのキャッシュ機能。検索したページを保存しています。消えた後でも、そのページを見ることが出来るのです。一度、「キャッシュ」を使ってみてください。

インターネットアーカイブは、さらに、もっと便利になっています。どんなことが出来るのか、見ていきましょう。

3,インターネットアーカイブを使う

インターネットアーカイブの最初のページに、「http://」から始まる、入力欄があると思います。そこに、サイトのアドレス(自分のでも他人のページでも良し)を入力してみてください。しばらくすると、ページが切り替わり、数字が現われるはずです。

その数字は年月日(例えば、2001/04/21など)を表しています。もうお気づきかも知れませんが、その日に保存されたページを表示させることが出来ます。ですから、例えば、1年前のホームページと、2年前のホームページが、当時のまま、見られます。

なお、数字の横に、たまに、「*」という記号が見られますが、これは、「前回に比べて、内容がかなり更新されているよ」と言う意味で付けられています。>>参考「インターネットアーカイブFAQ」(英語http://www.archive.org/about/faq-wayback.html#5)

1996年から、保存し始めています。2001年から公開し始めたようです。

画像や映像も保存されています。ただし、注意点として、全てが保存されているわけではないし、表示されないページもあります。その場合には、次のような言葉が代わりに出てきます。

エラーメッセージについて

「Not in archive」
この文字が表示されるのは、「お探しのページは保存されていません。」という意味を示す。もう一度試してみるか、あきらめるか、別のアドレスをどうぞ。
「Sorry,no matches」
入力したアドレスが間違っていると、これが表示される。確認して、再度、探し直す。
「Blocked Site Error.」
そのサイトの管理者が、過去の自分のページを表示させないようにしている。
「Robots.txt Query Exclusion.」または、「Robots.txt Retrieval Exclusion.」
robot.txtがサイトのサーバに入っていると、アーカイブには表示されなくなるそうです。サイト削除に関しては、英語ですが、次を参照のこと。
>>インターネットアーカイブの「Removing Documents From the Wayback Machine(http://www.archive.org/internet/remove.html)

私の考察「反対派、賛成派、あなたはどちらの立場?」

インターネットが普及してから、アーカイブ問題はその、重要性を増してきています。また、著作権問題の絡みもあります。

ネットで、アーカイブ問題には二つあって、一つは古い資料をデジタル化する問題。もう一つが、今回触れたホームページの保存(アーカイブ化)です。前者はとくに、図書館に保管されている古い資料をいかに、コンピュータの中に(またはマイクロフィルムに)保存しておくかなどが取りざたされています。後者はどうでしょうか。

従来、ホームページは好き勝手に、閉鎖されたり、編集されたりして、引用のしにくいものでした。また、2002年4月の出来事でしたが、政治家が自分の公式サイトで、疑惑(秘書の給料事件)を示唆してしまったらしいとマスコミが報道しました。仮に、もし、このページが消されたり、勝手に修正されていたりするならば、信憑性が無くなってしまいます。

となると、やはり、ホームページを保存、公開してくれるところが必要になってくるのですが、はたして、管理者の許可なしにそのまま、運営しても良いのかどうか、著作権の観点からも疑問が残ります。

他にも、解決すべき課題は山積状態であると言えます。

他のサイトを見ていきますと、二つの立場に分かれているようです。一つは、かような法的、倫理的問題は解決できるはずがないので、「インターネットアーカイブを認めない」派。もう一つは、必要だから認めた上で、問題を解決していくべきだという「インターネットアーカイブを認める」派。

どちらの立場に立ったにしろ、やはり、様々な問題を解決しなければなりません。

今回はインターネットアーカイブの概要をちょっとだけ書いてみました。インターネットアーカイブの山積する課題についてはいずれ、また今度。(「インターネットアーカイブの諸問題」に続く)

スタート地点のページに戻る (1/2) 次のページへ進みます (1 )

シンプル

>>リンク集へ行く

>>ホームへ戻る

simple by dhr(Eメールでdhrname@mail.goo.ne.jp