なまけものになりたくて

wget全オプション日本語訳

まずはwgetをダウンロードしてくる。いくつもリンクがあるが、特にこだわりが無いなら「If you don't know which version to get: GET」以降のlink(2008/06/16日現在は「THIS ONE:1.10.2 complete」)からダウンロードして展開する。(ここにwgetを使うのに必要なものが全て含まれている)

ただ使うだけなら、コマンドプロンプトを立ち上げてwgetが置いてあるフォルダに移動し、「wget url」とすればダウンロード可能(例 「wget http://yagi.s321.xrea.com/」)。

出来る事としては大雑把に言うと、該当サイトを全てダウンロードし、その内部リンクを全てローカルのものに書き換える、ダウンロード対象ファイルを外部ファイルに記述する、proxy(プロキシ認証でも)を使用する、事も可能。詳細は以下のオプション群を参照の事。
また、タスクスケジューラ等でスケジューリングすればrssGetterとしても使用可能。オプションの組み合わせと考え方次第で「こんな事できるかな?」が実現できてしまったりする。

その他、コマンドで全て指定せず環境設定ファイル(「.wgetrc」)を使用する事も可能。余談だがwindowsの場合、通常は「.」から始まるファイル名(.wgetrcの事)は作成出来ないが、例えばメモ張を開いて、「名前を付けて保存」を選び「ファイル名」に「.wgetrc」ファイルの種類に「すべてのファイル」を選択して保存すれば作成する事が出来る。(ここでは関係無いが「.htaccess」もこれでOK)

以下ページ最後までオプション一覧。カテゴリ分け、並び順序は--helpのカテゴリ分け、並び順序と同一。

wget 実行時オプション
-V --version wgetのバージョンを表示する。
-h --help ヘルプを表示する。
-b --background wgetをバックグラウンドで実行。
-e --execute=COMMAND .wgetrcスタイルのコマンドを実行( 例: wget -e input=./download.txt )する。
wget ロギングと入力ファイルオプション
-o --output-file=FILE ログメッセージをFILEに出力(出力ファイルが存在する場合は上書き)する。
-a --append-output=FILE ログメッセージをFILEに出力(出力ファイルが存在する場合は追記)する。
-d --debug デバッグ情報を出力する。
-q --quiet 処理状況等を一切表示しない。(wget URLとwget -q URLで試してみると分かりやすい)
-v --verbose 処理状況等を表示する。(デフォルト)
-nv --no-verbose 適度に処理状況を表示する。(-vと-qの中間)
-i --input-file=FILE FILEに記載されているURLsをダウンロードする。(URLsのsがポイント、複数記述可、urlを記述するファイルは1行1url)
-F --force-html HTMLとして入力を扱う。(wget -F www.google.co.jpとして実行してみると分かりやすい)
-B --base=URL -F -i オプション使用時のベースとなるURLを指定する。( -i オプションで指定されるファイルには-Bオプションで指定したURLの続きを記載する)
wget ダウンロードのオプション
-t --tries=NUMBER リトライ回数の上限を設定(0であれば無制限)する。
  --retry-connrefused 接続を拒否された場合でもリトライする。
-O --output-document=FILE ダウンロードした内容をFILEに出力する。(複数ファイルをダウンロードする際にこのオプションが指定されているとFILEに全部まとまってしまうので注意)
-nc -no-clobber 既にファイルが存在する場合はダウンロードで既存ファイルを上書きしない。
-c --continue 部分的にダウンロードされたファイルの続きから再開する。
  --progress=TYPE プログレスバーの種類を指定する。(dot、barを指定可能)
-N --timestamping タイムスタンプを比較して、ローカルに既に存在するファイルよりも新しいファイルだけを取得する。
-S --server-response サーバの応答を表示する。
  --spider 何もダウンロードしない
-T --timeout=SECONDS 全てのタイムアウトをSECONDSに指定する。(秒)
  --dns-timeout=SECS DNSの問い合わせのタイムアウトをSECSに指定する。(秒)
  --connect-timeout=SECS 接続タイムアウトをSECSに指定する。(秒)
  --read-timeout=SECS 読み込みタイムアウトをSECSに指定する。(秒)
-w --wait=SECONDS ダウンロードの間にSECONDSだけ間隔を空ける。(秒)
  --waitretry=SECONDS リトライする間にSECONDSだけ間隔を空ける。(秒)
  --random-wait=SWITCH ダウンロードの間に0〜2秒だけ間隔を空ける。(on、offが指定可能)
-Y --proxy プロキシを使う。
  --no-proxy プロキシを使わない。
-Q --quota=NUMBER ダウンロードサイズの条件を指定する。(バイト)
  --bind-address=ADDRESS ローカルアドレスとしてADDRESS(ホスト名かipアドレス)を使う。
  --limit-rate=RATE ダウンロード速度をRATEまでに制限する。
  --no-dns-cache DNSの問い合わせ結果をキャッシュしない。
  --restrict-file-name=OS OSで使用可能なファイル名だけに制限する。
  --user=USER ftp,httpのユーザを指定する。
  --password=PASS ftp,httpのパスワードを指定する。
wget ディレクトリ(フォルダ)のオプション
-nd --no-directories ディレクトリ(フォルダ)を作成しない。
-x --foce-directories 強制的にディレクトリ(フォルダ)を作成する。
-nH --no-host-directories ホスト名のディレクトリ(フォルダ)を作成しない。
  --protocol-directories 使っているプロトコル名のディレクトリ(フォルダ)を作成する。
-P --directory-prefix=PREFIX PREFIX/以下にダウンロードしたファイルを保存する。
  --cut-dirs=NUMBER リモートディレクトリ(フォルダ)のNUMBER階層分を無視する。
wget HTTPのオプション
  --http-user=USER httpのユーザにUSERを設定する。
  --http-password=PASS httpのパスワードにPASSを設定する。
  --no-cache サーバにキャッシュされたデータを許可しない。
-E --html-extension HTMLは".html"拡張子で保存する。
  -ignore-length "Content-length"ヘッダを無視する。
  --header=STRING 送信ヘッダにSTRINGを追加する
  --proxy-user=USER プロキシユーザ名にUSERを設定する。
  --proxy-password=PASS プロキシパスワードにPASSを使う。
  --referer=URL リファラにURLを設定する。
  --save-headers HTTPのヘッダをファイルに保存する。
-U --user-agent=AGENT ユーザエージェントにWget/VERSIONでは無くAGENTを使用する。
  --no-http-keep-alive HTTPの持続的接続機能を使わない。
  --no-cookies クッキーを使用しない。
  --load-cookies=FILE FILEに指定したクッキーを読み込む。
  --save-cookies=FILE FILEにクッキーを保存する。
  --keep-session-cookies セッションで使うクッキーを保持する。
  --post-data=STRING POSTメソッドを使用してSTRINGを送信する。
  --post-file=FILE POSTメソッドを使用してFILEの内容を送信する。
wget HTTPS(SSL/TSL)のオプション
  --secure-protocol=PR セキュアプロトコルを指定する。(auto、SSLv2、SSLv3、TLSv1から一つ選択)
  --no-check-certificate サーバの証明書を検証しない。
  --certificate=FILE クライアント証明書にFILEを使用する。
  --certificate-type=FILE クライアント証明書の種類にPEMかDERを指定する。
  --private-key=FILE 秘密鍵にFILEを使用する。
  --private-key-type=TYPE 秘密鍵の種類にPEMかDERを指定する。
  --ca-certificate=FILE CA証明書にFILEを使用する。
  --ca-directory=DIR CAのハッシュリストが保持されているディレクトリを指定する。
  --random-file=FILE SSL PRNGの初期化データにFILEを使用する。
  --egd-file=FILE EGDソケットにFILEを使用する。
wget FTPオプション
  --ftp-user=USER ftpユーザ名にUSERを使用する。
  --ftp-password=PASS ftpパスワードにPASSを使用する。
  --no-remove-listing ".listing"ファイルを削除しない。
  --no-glob FTPファイル名のグロブを無効にする。
  --no-passive-ftp "passive"転送モードを使用しない。
  --no-retr-symlinks 再帰取得中に、シンボリックリンクリンクされたリンク先のファイルを取得する。(ディレクトリでは無い。)
  --preserve-permissions リモートファイルのパーミッションを保存する。
wget 再帰ダウンロードオプション
-r --recursive 再帰ダウンロードを行う。
-l --level=NUMBER 再帰ダウンロード時の最大階層深度をNUMBERに設定する。
  --delete-after ダウンロードが終了したらファイルを削除する。
-k --convert-links ダウンロードしたhtml中のリンクをローカルに変更する。
-K --backup-converted リンク変更前のファイルを*.origで保存する。
-m --mirror -N -r -l 0 --no-remove-listingを省略したもの
-p --page-requisites HTMLを表示するのに必要なファイル(画像等)を全て取得する。
  --strict-comments HTM中のコメントの処理を厳密に行う。
wget 再帰ダウンロード時のフィルタ
-A --accept=LIST 対象ファイルの拡張子を,区切りで指定する。
-R --reject=LIST 対象外ファイルの拡張子を,区切りで指定する。
-D --domains=LIST 対象ドメインを,区切りで指定する。
  --execute-domains=LIST 対象外ドメインを,区切りで指定する。
  --follow-ftp html中のftpリンクも対象とする。
  --follow-tags=LIST 対象タグ(html中の)を,区切りで指定する。
  --ignore-tags=LIST 対象外タグ(html中の)を,区切りで指定する。
-H --span-hosts 再帰中に別のホストも対象にする。
-L --relative 相対リンクのみを対象にする。
-I --include-directories=LIST 対象にするディレクトリ(フォルダ)を指定する。
-X --execute-directories=LIST 対象外ディレクトリ(フォルダ)を指定する。
-np --no-parent 親ディレクトリ(フォルダ)を対象外にする。
作成日:2008-06-16

Valid XHTML 1.0 Transitional 正当なCSSです!