「wayback machine」にサイトを保存する方法！

こんにちは！

皆さんは「wayback machine」ってご存知ですか？

「wayback machine」とは「インターネットアーカイブ」が運営している世界中のサイトのアーカイブが保存されているWEBサービスです。1996年から膨大な数のWEBデータが保存されていて、過去データを調べるのに欠かせない便利なサービスです。

ただし「wayback machine」に自分が望んでいるサイトの情報が必ず保存されているとは限りません。「wayback machine」の独自のクローラーが判断してサイトを保存します。

先日、私が欲しかった情報も保存されていませんでした。「wayback machine」に保存されていると思い込んでいたので、本当にガックリしました。

それならクローラーの判断だけでしかアーカイブされないのかというと、そういう訳でもありません。手動で「wayback machine」にサイトを保存することも可能です。

今回は「wayback machine」にサイトを保存する方法をご紹介したいと思います。

過去に記事を書いています。

それでは「wayback machine」にサイトを保存してみたいと思います。

↓以下のURLより「wayback machine」にアクセス！

↓上記URLをクリックすると以下の画面が開きます。

↓右下にある「Save Page Now」に保存するサイトのURLを入力し「SAVE PAGE」をクリックしてください。

↓保存中は以下のような画面が出てきます。しばらくお待ちください。

↓以下の画面が表示されれば保存完了です。

以上です。簡単に保存できますね。保存されるのに30秒ぐらいでした。

「wayback machine」にサイトの保存を拒否する方法！

逆に「wayback machine」にサイトを保存されたくないケースもあるかもしれません。もちろんサイトの保存を拒否する方法もあります。

「robots.txt」に以下のコードを追加してください。「robots.txt」でクローラーをブロックしています。ちなみに「robots.txt」とは検索エンジンに対する命令が記述されたファイルのことです。

User-agent: ia_archiver
2
Disallow: /

以上で設定完了です。

↓「インターネットアーカイブ」ではWEBデータだけでなく、書籍、動画、音源なども保存されています。今回はそのいくつかの運営サイトをご紹介します。

これまでに出版された全ての書籍に関するページを作るためのプロジェクトです。デジタルスキャンされた書籍を数万冊読むことができます。

↓昔のニュースや映画、音楽のライブ映像などの動画や音源が保存されているサイトです。

作業は簡単なので、いざという時のために、自分のサイトを保存しておくことをおすすめします。自分には関係がないと思っている時に限って、必要に迫られる状況になるものです(私がそうでした)。こんな便利なサービスを無料で提供してくれる「インターネットアーカイブ」に感謝です。

以上「「wayback machine」にサイトを保存する方法！」でした！

それではまた。

ゆうとより:

削除が予想されるURLの事前登録は理解できます。サイトの保存を拒否する方法があるのは意外ですね。