UNIXおよびLinux、さらにcygwinでは、wgetを利用すると簡単にウエブリブログのバックアップが可能である。$addressをウエブリブログのユーザのアドレスとする。
-rでディレクトリ階層を含んだダウンロードを行い、-l 5で5階層下のディレクトリまでダウンロードすることを指定する。また、-Lは、外部のサーバにはデータを取りに行かないというオプションである。この場合、期待される動作として、200412のディレクトリの下にあるすべてのファイルをダウンロードすることになるが、ダウンロードされたのは、200412ディレクトリ内のindex.htmlだけであった。個別の記事は、別のサーバに格納されているみたいなので、-Lオプションを外して実行してみた。
そうすると、このブログを構成するすべてのファイルがダウンロードされることになった。-Lオプションを指定しないと再帰的にリンクをたどってデータをダウンロードすることになるので、このような結果になったのだろう。一度、ダウンロードすると、同じ構成でローカルに保存されているので、差分をダウンロードするためには、以下のように実行する。
-Nオプションは、ファイルのタイムスタンプを比較して、すでにダウンロードしたファイルをダウンロードしないようにするものである。wget自体は、連続してファイルをダウンロードするため、サーバに負荷をかけるので、初回のダウンロード以外は、差分でダウンロードする方が望ましい。 このwgetは、もともと、UNIX/Linux用のプログラムであるが、windows用のバイナリも存在し、コマンドプロンプトで実行できる。windowsで使うためには、opensslのバイナリも必要である。これらは、以下のサイトからダウンロード可能である。 wget-1.9.1(binary) openssl-0.9.7c(binary) wgetをダウンロードしたら、適当なフォルダに解凍し、opensslの方は、PATHの環境変数に含まれるディレクトリのどこかにダウンロードしておく。その他の使い方は、UNIX/Linux版と全く同じ。 |
<< 前記事(2004/12/13) | トップへ | 後記事(2004/12/14)>> |
タイトル (本文) | ブログ名/日時 |
---|
内 容 | ニックネーム/日時 |
---|
<< 前記事(2004/12/13) | トップへ | 後記事(2004/12/14)>> |