「ウェブアーカイバ」で過去の情報を収集しよう!


日記で紹介しましたが、かなり有用な情報なので、独立させてHPコンテンツにしました。

インターネットの情報は、容易に検索出来る、しかも無料と言う事で、きわめて
便利なものです。ちょっと調べたいものがあった時、その情報を、Yahooやgooで
検索して、探し当てる場面は、良くあります。

しかし、せっかく、ほぼ目的どおりの内容がヒットしたにもかかわらず、リンク先が
移動していたり、あるいは消失していた場合、そこで追跡をあきらめるか、別の
方法で検索しなおすか、しかありません。
手に入れたジャンクの素性を調べて、○○社の××というボードだと分かっても、
そのメーカーが、倒産していて、公開されていたドライバが、もう手に入らない、
なんてのは、ジャンクを趣味にしている方なら、一度ならず経験した事があるはずです。

同様、2度と手に入らない情報は、いっぱいあります。

たとえば、作者が更新しなくなって、消えてしまったHP。
何等かの理由で、数年前には容易に入手できた情報だが、旬を過ぎた、などで消えた
情報を扱ったページ。
メーカーが公開していた製品のスペックで、生産が中止されたので、現在は公開されなく
なったもの、などなど。ジャンキィには、欠かせない情報ばかりです。

そこで、ウェブアーカイバ、このHPの出番です。

http://web.archive.org/

ここは、ロボットによって、Webの内容を自動収集し、それを集め、記録したものです。
ロボットを拒否するタグが、HPのHTMLに記載されている場合には、収集されませんので、
全てのHPが残っているわけではありません。例えばメルコはダメでした。

しかし、かなりのメーカーのHPが、保存されています。記録されているHPの日付けが
名前になってます。

少し、実際に使用してみましょう。たとえば、倒産したメーカーです。
Macの、アクセラレータなどを販売していた、インターウェア社のドライバは、当然、
もう手に入りません。しかし、WebArchiveなら、当時の情報が、そのまま保存されてます。
なんと、ダウンロードページまでも。僕が探したのは、PowerBook1400cs用のアクセラレータです。
ちゃんとダウンロード出来ました。

使い方は、至って簡単です。トップページで、当時のインタウェア社のHPのアドレス
www.interware.co.jp
を入れるだけです。記録されているHPが、日付け順で表示されます。
それらの候補中、自分が探している時期、もしくはその後の記録を見てみます。
今回は、倒産直前に記録されていた分を探してみます。

http://web.archive.org/web/20000520012207/http://www.interware.co.jp/

ボードに添付されていたドライバが、最新(=最後)のものであった事を確認出来ました。

別の方法にも使えます。これは、以前は公開されていたが、現在はHPから
削除されてしまったドライバです。

日本NCRのWaveLANPCMCIA、博多のPC-NETで\300で販売されていた、無線LANです。
当然、ジャンクです。店員も、何も分からずに販売している品でした。
 
こういったものを動作させるには、まずは情報探し。幸い、日本NCRは、業務向け
LANの老舗的メーカーです。ちゃんとメーカーサイトがありました。

http://www.ncr.co.jp/

そこの「サポート」「ダウンロード」をさがしましたが、過去の製品ですので、
もうHP上にドライバはありませんでした。問い合わせ先のメールアドレスは
明記されていますので、サポートは継続されているようです。しかし、ジャンクで
入手した製品まで、メールによるサポートを求めるのは、迷惑でしょう。

そこで、日本NCRのアドレスを、Webアーカイブに入力します。

予想通り、過去のHPが、5年以上前から保存されていました。リンクが切れて
いるものも多かったですが、お目当てのWebLANPCMCIAのドライバのダウンロードに
成功しました。(一部ファイルが壊れていたのですが、メインのドライバは無事でした。)

このWebArchive、こんな時には、本当に便利さが実感出来ます。

ダウンロードしたドライバを、インストールしたら、ほとんどデフォルトの設定だけで、
無事P2P(アドホックモード)のLANが、構築出来ました。

転送速度は、57Mのデーターを転送して、7分弱でした。計算したら、1Mbpsちょい
出ています。実用性は???ですが、そこそこ楽しめました。いい買い物でした。

同様に使えるのが、例えば、作者が更新しなくなって、消えてしまったHPです。

例えば、エプソンノートの情報を集めた、「赤茄子さんのHP」。今はもうリンクが切れて
いますが、ウェブアーカイブには、ほぼ完璧に保存されていました。

http://web.archive.org/web/20000930122129/http://www.coara.or.jp/~epson/

有名なHPの、過去の姿を知る事も可能です。
試しに自分のHPでやってみたら、3年前の貧弱なHPがありました。オドロキ。
(今でも、とても貧弱なHPですけどね、笑)

http://web.archive.org/web/20010802195309/http://www.geocities.co.jp/SiliconValley-PaloAlto/7846/

もし、僕が何らかの理由でこのHPを閉じてしまったとしても、PA-200情報は、
ウェブアーカイブで入手出来る訳です。閉鎖する気はありませんが、手狭になって
削除した情報でも、ちゃんと残ってるのがすごい?かも。消したい過去も残るけど。(笑)

極めて貴重な情報の集大成だと思います。
著作権の問題はあるでしょうが、ずっと公開続けられるといいですね。

メインに戻る