ホームページを保存するインターネットアーカイブ(ウェブアーカイブとも呼ばれる)について、初心者向けにシンプル解説。更新日:2002年04月29日。
ネット初心者のために、今回は、2001年あたりからサービスを始めて、いろいろな雑誌に取り上げられたInternet Archive(以下、インターネットアーカイブ。サイトはhttp://www.archive.org)について、取り上げてみたいと思います。なんと、世界中のホームページ、その数100億ページを保存、公開しているそうです。ホームページを作る人、見る人には必ず、必要となる知識でしょう。
はたして、このサイトはどんなときに必要となるのでしょうか。
注:100億ページという数字は、インターネットアーカイブ自身が言っていること。参考>>「Internet Archive:News(http://www.archive.org/wayback/press_kit/background.html)」のCollectionsの項
インターネットで、ぼんやりとホームページを見ていますと、「not found」という言葉が出てきます。これはどういう意味なのでしょうか。
アドレスを見ると、ちゃんと入力されています。以前はちゃんと存在したページのようです。つまり、上に挙げた「not found」というのは、「もうないよ」という意味なのです。
そのように表示されたページは、もう、ネット上にはありません。そのページの作者、あるいは他の誰かが、そのホームページを消してしまったのです。ですから、見つけることは出来ません。すると、せっかく、リンク(もしくは引用)をしても、消えると参考にならないなど、困ったことが起きます。
もっと、たくさんあるかもしれません。みなさんも、検索エンジンを使うと、そんな困った経験がありませんか。
消えたホームページは、どこを探しても見つかりません。ページの作者がもう一度、用意するしかないのです。
そこで、ホームページを自動に保存して、消された後でも見せようと言う動きが出ています。
有名かも知れませんが、「Google」という検索エンジンのキャッシュ機能。検索したページを保存しています。消えた後でも、そのページを見ることが出来るのです。一度、「キャッシュ」を使ってみてください。
インターネットアーカイブは、さらに、もっと便利になっています。どんなことが出来るのか、見ていきましょう。
インターネットアーカイブの最初のページに、「http://」から始まる、入力欄があると思います。そこに、サイトのアドレス(自分のでも他人のページでも良し)を入力してみてください。しばらくすると、ページが切り替わり、数字が現われるはずです。
その数字は年月日(例えば、2001/04/21など)を表しています。もうお気づきかも知れませんが、その日に保存されたページを表示させることが出来ます。ですから、例えば、1年前のホームページと、2年前のホームページが、当時のまま、見られます。
なお、数字の横に、たまに、「*」という記号が見られますが、これは、「前回に比べて、内容がかなり更新されているよ」と言う意味で付けられています。>>参考「インターネットアーカイブFAQ」(英語http://www.archive.org/about/faq-wayback.html#5)
1996年から、保存し始めています。2001年から公開し始めたようです。
画像や映像も保存されています。ただし、注意点として、全てが保存されているわけではないし、表示されないページもあります。その場合には、次のような言葉が代わりに出てきます。
インターネットが普及してから、アーカイブ問題はその、重要性を増してきています。また、著作権問題の絡みもあります。
ネットで、アーカイブ問題には二つあって、一つは古い資料をデジタル化する問題。もう一つが、今回触れたホームページの保存(アーカイブ化)です。前者はとくに、図書館に保管されている古い資料をいかに、コンピュータの中に(またはマイクロフィルムに)保存しておくかなどが取りざたされています。後者はどうでしょうか。
従来、ホームページは好き勝手に、閉鎖されたり、編集されたりして、引用のしにくいものでした。また、2002年4月の出来事でしたが、政治家が自分の公式サイトで、疑惑(秘書の給料事件)を示唆してしまったらしいとマスコミが報道しました。仮に、もし、このページが消されたり、勝手に修正されていたりするならば、信憑性が無くなってしまいます。
となると、やはり、ホームページを保存、公開してくれるところが必要になってくるのですが、はたして、管理者の許可なしにそのまま、運営しても良いのかどうか、著作権の観点からも疑問が残ります。
他にも、解決すべき課題は山積状態であると言えます。
他のサイトを見ていきますと、二つの立場に分かれているようです。一つは、かような法的、倫理的問題は解決できるはずがないので、「インターネットアーカイブを認めない」派。もう一つは、必要だから認めた上で、問題を解決していくべきだという「インターネットアーカイブを認める」派。
どちらの立場に立ったにしろ、やはり、様々な問題を解決しなければなりません。
今回はインターネットアーカイブの概要をちょっとだけ書いてみました。インターネットアーカイブの山積する課題についてはいずれ、また今度。(「インターネットアーカイブの諸問題」に続く)