Nowhere to roam.

アクセスカウンタ

help リーダーに追加 RSS wgetによるblogのバックアップ

<<   作成日時 : 2004/12/14 21:43   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

UNIXおよびLinux、さらにcygwinでは、wgetを利用すると簡単にウエブリブログのバックアップが可能である。$addressをウエブリブログのユーザのアドレスとする。

% wget -r -L -l 5 $address/200412/index.html

-rでディレクトリ階層を含んだダウンロードを行い、-l 5で5階層下のディレクトリまでダウンロードすることを指定する。また、-Lは、外部のサーバにはデータを取りに行かないというオプションである。この場合、期待される動作として、200412のディレクトリの下にあるすべてのファイルをダウンロードすることになるが、ダウンロードされたのは、200412ディレクトリ内のindex.htmlだけであった。個別の記事は、別のサーバに格納されているみたいなので、-Lオプションを外して実行してみた。

% wget -r -l 5 $address/200412/index.html

そうすると、このブログを構成するすべてのファイルがダウンロードされることになった。-Lオプションを指定しないと再帰的にリンクをたどってデータをダウンロードすることになるので、このような結果になったのだろう。一度、ダウンロードすると、同じ構成でローカルに保存されているので、差分をダウンロードするためには、以下のように実行する。

% wget -N -r -l 5 $address/200412/index.html

-Nオプションは、ファイルのタイムスタンプを比較して、すでにダウンロードしたファイルをダウンロードしないようにするものである。wget自体は、連続してファイルをダウンロードするため、サーバに負荷をかけるので、初回のダウンロード以外は、差分でダウンロードする方が望ましい。

このwgetは、もともと、UNIX/Linux用のプログラムであるが、windows用のバイナリも存在し、コマンドプロンプトで実行できる。windowsで使うためには、opensslのバイナリも必要である。これらは、以下のサイトからダウンロード可能である。

wget-1.9.1(binary)
openssl-0.9.7c(binary)

wgetをダウンロードしたら、適当なフォルダに解凍し、opensslの方は、PATHの環境変数に含まれるディレクトリのどこかにダウンロードしておく。その他の使い方は、UNIX/Linux版と全く同じ。

設定テーマ

関連テーマ 一覧

月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文