トップ > 超旬ツール > 記事

閉鎖済みサイトをWebArchiveキャッシュから一括DLする「Warrick」

「インターネットの図書館」とも呼ばれる、WebArchiveというサービスをご存じだろうか？「○○というURLの○○年○○月○○日の状態」というように、インターネット上のページを時系列でキャッシュ化しまくっているウェブサービス。URLを検索すれば、そのサイトの過去の姿を拝むことが出来るのだ。当然、既に閉鎖されて見れなくなっているサイトでもOK。ただ、いかんせんサイトが重いし、日本語はエンコードの関係で文字化けする。ページ単位での閲覧なら実用的に不満はないが、「昔の神サイトを全部まとめて読みたい」といったケースではストレスが溜まってしまう。Warrickを使い、サイト全体を一括でダウンロードしてしまおう。ローカルに過去の神サイトアーカイブを保存することができるぞ。

Warrickの動作にはActivePerlが必要だ。作者のページからダウンロードしてインストールし、さらにWarrickを作者のページからダウンロードして解凍。「C:\Program Files\warrick」にコピーする。基本的にパスは任意だが、コマンドプロンプトに不慣れな人は、必ずこのパスを使うこと。

まずWebArchiveで当該URLを検索する。検索結果に並ぶのは、そのアドレスの各時期におけるキャッシュ。なるべく新しく、かつ閉鎖前のキャッシュを探すのだ。日本語サイトの場合は、検索結果を開くと文字化けが発生するが、エンコードをShift_JISに変更すれば直る。既に閉鎖した個人サイト、ニーツオルグの場合は2006年2月27日だった。

また、詳しいメカニズムは割愛するが、キャッシュページでサイト内ページへのリンク（「過去ログ」など）にマウスを載せてみよう。ステータスバーに表示されるリンク先アドレスが「http://web.archive.org/web/～」になっているサイトなら、この後の方法で復元可能だ。このページのように、サイト内リンクが「http://そのサイトのアドレス/～」になっているサイトの場合は無理。

コマンドプロンプトを起動し、まず「cd ../../Program Files\warrick」と入力しエンター。「C:\Program Files\warrick」と表示されるはずなので、「warrick.pl -r -c -wr ia -dr 年-月-日一括DLしたいサイトのURL」と入力しエンター。

あとは完全自動。一つずつページがダウンロードされるのでしばらく待とう。

warrickフォルダ以下にドメイン別のフォルダが作成され、内部にファイルがダウンロードされる。ちなみに、このファイルを開いた場合は、日本語ページでも文字化けは起こらないので、エンコード変更の必要はない。

この記事のカテゴリー

カテゴリー

超旬ツール

この記事に付与されたタグ

ありません

ソーシャルブックマーク

2007年01月24日 16:56

同じカテゴリーの記事を見る

・「My Expose」でVistaでもマックっぽくウインドウ切り替え
・ウザいUAC警告を自由に設定できる「Vista UAC Released」
・Vistaのログオン画面を「Logon Studio」でカスタマイズ
・「Mz Vista Force」で激重なVistaの動作速度をグーンと向上
・外部サーバを使わず「自分専用ファイル便」で巨大ファイル転送
・「AnGo3 free」でUSBメモリ内のデータを暗号化
・非アクティブで動作が止まるエミュ等を止めない黒幕
・「フォルダの足あと」でフォルダの表示履歴を使いこなす
・宇宙を旅するMS製ツール「WorldWide Telescope」
・デスクトップの様子を「Debut Video Recorder」で動画に
・4GB超メモリの認識されない部分を高速ドライブとして活用
・「斧」混雑時のリトライ作業を「AxfcDownloader」で自動化
・SoftPerfect File RecoveryでUSBメモリのデータを復旧
・ツールチップの文章内容をコピーする「GetTipEx」
・2ch専ブラのログを超速に検索する「スレッド全文検索」
・パッチ等で見かけるNFO/DIZファイル用のビューア「GetDiz」
・Vistaのフォント「Meiryo」のXP用が無料配布開始
・映画等DVDのリスト管理を行う「DVD Administrator」
・Ajax系地図で写真にGPSデータを付加する「Pro Photo Tools」
・ゲットした圧縮ファイルを自動解凍するAutoUnpack
・1CD-Linux等のLiveCDをWin上で起動するMobaLiveCD
・touch「マップ」を外出先で使うGMDL＋Maps Offline
・各翻訳サイトの翻訳結果を一発表示する「Free Translator」
・デジカメ写真等をタグ/タグクラウドで管理するiTag
・iTunesアートワーク登録の新定番「Voralent Invidi」
・漫画流し読み→不要なら削除ビューア「JunkCrusher」
・CD/DVD/次世代DVD用の統合ツール「StarBurn」
・DVD±Rの内容を記録保存する「HDD File Administrator」
・「FileCapsule Deluxe」でファイルを簡単に暗号化して転送
・高性能な画像リサイズ専用レタッチツール「R13」
・URLを入れるだけでYourFileHostから落とせる「OIDON」
・Appleのブラウザ「Safari」にWindows用正式版が登場
・グラボ/CPU依存で高速表示可能な「FastPictureViewer」
・動画→音楽抽出(変換)「Pazera Free Audio Extractor」
・共有動画を「Oretube」の小型画面で表示
・フォルダを監視し音楽を自動登録する「iTunes Folder Watch」
・好みの動画を検索＆すぐ保存できるツールバーを使おう！
・強力な音楽ファイルボーカル除去「精密マイナスワンメーカー」
・高速な楽曲検索が行える音楽プレイヤ「H2k6」
・メディアの共有も転送も「doubleTwist」に全部おまかせ
・「お気に入りコマンド」等の機能が追加された「ExtraPutty」
・全セクタ読み込みでHDDの寿命を延ばす「HDD Walker」
・面白画像スライドショー動画用「ニコニコムービーメーカー」
・HomeでUAC詳細設定「Windows Vista UAC RELEASED」
・動画を回転/反転する「Free Video Flip and Rotate」
・「プログラムから開く」の不要項目を消すOpenWithView
・OEメールのバックアップデータ用ビューア～復元ツール
・ニコニコをキーワードで地引ダウンロードできるwoopie
・Google等のイメージ検索が3D化されるPicLens
・画像掲示板の巡回を補助する「すぷらうとジェネリクス」

インターネットは面白い！と本気で思えるパソコン雑誌。
5月8日発売号は他誌には載らない激裏ツールを大紹介！

質問・投稿はこちら

サイト内検索

人気ツールベスト20

1位：Bit Comet
2位：Orbit Downloader
3位：窓の足
4位：ffdshow-alpha
5位：CCleaner
6位：Auto Gordian Knot(AutoGK)
7位：VirtualDubMod日本語化パッチ
8位：CDex 日本語LanguageFile
9位：MediaCoder
10位：DVDFab Decrypter
11位：UniteMovie
12位：DVD Shrink
13位：VirtualDubMod
14位：携帯動画変換君
15位：Leeyes
16位：ImgBurn
17位：LAME
18位：CDex
19位：VLC media player
20位：GOM Player

ネトラン推薦商品(Amazon)

I-O DATA 地上デジタルチューナー内蔵22型ワイド液晶ディスプレイ

チューナー内蔵で地デジTVとしても使える液晶。D端子/HDMIなど入力端子も豊富。

PSP-2000専用 D端子ケーブル『D端子ケーブルP2』

PSPの映像をD端子付きのテレビに出力できるケーブル。

byd:sign 42型地上・BS・110度CSデジタルチューナー搭載デジタルフルハイビジョン液晶テレビ LF-4201DAB

42インチのフルハイビジョン液晶が、5/28まで数量限定9万9800円！

トランセンド・ジャパン T.sonic MP3プレーヤー 320 8GB TS8GMP320

USBコネクタ内蔵のMP3プレーヤー。8GBと大容量で、USBメモリ代わりにも便利。

ELECOM 牛革製マウスパッド(エテノルブルー) MP-107BU

上質な牛革を使用したオシャレなマウスパッド。マウスを快適に使いたいならオススメ。

SANWA SUPPLY OAチェア SNC-T138BKN

メッシュ生地と本革を組み合わせたOAチェア。低反発ウレタン使用で座り心地もグッド。

LOAS ホームチェア　座イス RZC-118GY

こたつやちゃぶ台でパソコンを快適に使える座イス。回転台とひじかけ付き。

ヒルリード低反発ヘッドリクライニング座椅子・ボーダー

低反発素材使用で座り心地の良い座イス。ヘッドレストがついていて首が疲れにくい。

ELECOM CCD-F120BK CD/DVDファイル(120枚収納)

たまったメディアの整理に便利な収納ケース。

サンワサプライ OAチェア SNC-L8

肘掛け付きのOAチェア。肘掛けは倒すこともできる。ガス圧リフト装置付きで高さ調節が可能。

SANWA SUPPLY OAチェア用マット SNC-MAT

OAチェアを使っても床が傷つかないようにするマット。

Transcend USBメモリ 8GB JetFlash V10 TS8GJFV10

8GBの大容量USBメモリが4000円ちょいの手頃な価格で販売中。

BUFFALO USBメモリスタンダードタイプブラックモデル TurboUSB機能搭載 4GB RUF-C4GS-BK/U2

4GBと大容量なUSBメモリが3000円以下。Vistaの高速化技術ReadyBoostにも対応。

KOKUYO KB用紙(共用紙)(FSC認証)(64g) A4 500枚 KB-39N

何かと必要になるA4のコピー用紙。まとめ買いしとくといいかも。

That's データ用DVD-R 4.7GB 8倍速 50枚入り DR-47WTY50BA

クオリティで定評のあるDVD-Rメディア50枚セット