閉鎖済みサイトをWebArchiveキャッシュから一括DLする「Warrick」

Warrick_00.jpg 「インターネットの図書館」とも呼ばれる、WebArchiveというサービスをご存じだろうか?「○○というURLの○○年○○月○○日の状態」というように、インターネット上のページを時系列でキャッシュ化しまくっているウェブサービス。URLを検索すれば、そのサイトの過去の姿を拝むことが出来るのだ。当然、既に閉鎖されて見れなくなっているサイトでもOK。ただ、いかんせんサイトが重いし、日本語はエンコードの関係で文字化けする。ページ単位での閲覧なら実用的に不満はないが、「昔の神サイトを全部まとめて読みたい」といったケースではストレスが溜まってしまう。Warrickを使い、サイト全体を一括でダウンロードしてしまおう。ローカルに過去の神サイトアーカイブを保存することができるぞ。

Warrick_01.jpg Warrickの動作にはActivePerlが必要だ。作者のページからダウンロードしてインストールし、さらにWarrickを作者のページからダウンロードして解凍。「C:\Program Files\warrick」にコピーする。基本的にパスは任意だが、コマンドプロンプトに不慣れな人は、必ずこのパスを使うこと。

Warrick_02.jpg まずWebArchiveで当該URLを検索する。検索結果に並ぶのは、そのアドレスの各時期におけるキャッシュ。なるべく新しく、かつ閉鎖前のキャッシュを探すのだ。日本語サイトの場合は、検索結果を開くと文字化けが発生するが、エンコードをShift_JISに変更すれば直る。既に閉鎖した個人サイト、ニーツオルグの場合は2006年2月27日だった。

Warrick_03.jpg また、詳しいメカニズムは割愛するが、キャッシュページでサイト内ページへのリンク(「過去ログ」など)にマウスを載せてみよう。ステータスバーに表示されるリンク先アドレスが「http://web.archive.org/web/~」になっているサイトなら、この後の方法で復元可能だ。このページのように、サイト内リンクが「http://そのサイトのアドレス/~」になっているサイトの場合は無理。

Warrick_04.jpg コマンドプロンプトを起動し、まず「cd ../../Program Files\warrick」と入力しエンター。「C:\Program Files\warrick」と表示されるはずなので、「warrick.pl -r -c -wr ia -dr 年-月-日 一括DLしたいサイトのURL」と入力しエンター。

Warrick_05.jpg あとは完全自動。一つずつページがダウンロードされるのでしばらく待とう。

Warrick_06.jpg warrickフォルダ以下にドメイン別のフォルダが作成され、内部にファイルがダウンロードされる。ちなみに、このファイルを開いた場合は、日本語ページでも文字化けは起こらないので、エンコード変更の必要はない。

この記事のカテゴリー

超旬ツール

この記事に付与されたタグ

ありません

ソーシャルブックマーク

はてなブックマーク livedoor クリップ Yahoo!ブックマーク del.icio.us Google ブックマーク Buzzurl イザ!ブックマーク FC2 ブックマーク

2007年01月24日 16:56

トラックバック

このエントリーのトラックバックURL:
http://www.new-akiba.com/mt/mt-tb.fcgi/34798

同じカテゴリーの記事を見る

touchでウェブページをオフラインで見たいなら「PDFViewer」
広告やコメントの除去も可能なニコニコ動画キャッシュプロキシ「ばんしー」
IrfanViewに簡易画像編集や傾き修正機能が追加
IE7に広告画像を非表示にする機能を追加する「AdBrick」
「BOON SUTAZIO」でニコニコ動画をコメント付きで落とし快適に再生
POP3メールでmixiのメッセージ全文・マイミク日記などを受け取れるPopmixi
PCでチェックしたニコニコ動画をワンクリでiTunesに一括登録→動画対応iPodに詰め込める「ニコニコPodder」
初心者をVPNなマシン遠隔操作で助けるのにピッタリの「CrossLoop」
自前コーデックで様々な形式を再生できる「XUL Player」
日本語で簡単に使えるiPod touch用動画変換「Free Video to iPhone Converter」
IEのキャッシュファイルを検索する「IECacheView」
2000/XP/Vistaのレジストリゴミを削除する「NT Registry Analyzer」
P2Pを利用したインターネットTV「Joost」がオープンβに
キーボードをタッチパッドのボタンの代わりにする「ThumbRemap.ahk」
一度見たニコニコ動画を以後スムーズに再生できるようになるNicoCache
AVIなど動画からメニュー付きDVDを楽に作れるDVDForger
Torより導入~利用が簡単で高速にもなる匿名プロクシツール「JAP」
ウェブサイト一括DL→圧縮して保存→圧縮書庫のまま閲覧ができる「Weblzh」
YouTube等の動画を手軽にダウンロードする「Free Video Downloader」
軽量データベース型音楽プレイヤーHogehoge2006(仮)が更新再開
様々な動画形式をDVD化する「K-Lite Video Conversion Pack」
無料サービスをアカウント登録せずに利用できる(?)「Log-me in」
プレビュー付きFlashリソース抜き出しツール「Fortop SWF Resources Extractor」
手軽なインデックス型テキスト検索ツール「butterfly search」
ダラぴく探の新機能で2chに貼られた画像を漁れ
5クリックで2つの画像をパノラマ連結できる「ぱのらみ」
「Replace TaskManager」でタスクマネージャを好きなソフトに変更
9つの顔写真の中から正解を選ぶことでWindowsにログオンできるようにする「Passfaces」
常駐プログラムが安全かどうかを調べられる「RunScanner」
カスタム項目も削除可能な不要データ削除ソフト「Free Window Sweeper」
半透明タイトルバーも可能な期待のスキンツール「TrueTransparency」
ルールに従い書き込み内容を改造表示可能になった「JaneStyle」ver2.70
動作が軽快なアンチウィルスソフト「AVG Free edition」日本語版が登場
音楽ファイルの重複を削除する「Music Content Inspector」
指定画素数の画像を検索して一括コピーや壁紙設定できる「scooper」
ネットサービスを活用したハイブリッドP2P音楽共有ツール「p2s」
Google製の多言語OCRエンジンを搭載した「Softi FreeOCR」
ダラぴく探をスクリーンセーバー化して画像を自動表示
デスクトップにモザイクを掛けちゃう「Mosaic.ahk」
簡単にFLVを再生可能にする「楽々♪FLVSplitterインストーラー」
右クリックメニューをカスタマイズ可能になったSleipnir2.5.14
Googleマップに拡張機能を組み込む「マップレット」が登場
軽くて高機能なVxEditorが久々に更新され、ポータブル利用が可能に
画像を検索して垂れ流し、楽々保存できる「ダラぴく探」
Sleipnir2用2chブラウザプラグイン「mosa」が一般公開に
.3gpや.flvにも対応したUniteMovie v2.00リリース
シェアウェアの試用期限クラックに使っちゃダメな「RunAsDate」
テキストエディタチックな操作で初心者でも使いやすいリネームツール「Renemo」
ニコニコ動画のコメントデータを落とし発言主IDを調べる「getnicoment」
CDから簡単に着うたを作成できる「Sound Portalプレイヤー」