通信用語の基礎知識 戻る
未来情報産業株式会社

robots.txt

辞書:電算用語の基礎知識 ソフトファイル種類編 (PTSOFTF)
読み:ロボッツ・ドット・テクスト
外語:robots.txt 英語
品詞:名詞
2001/09/10 作成
2008/05/31 更新

"A Standard for Robot Exclusion" に基づいて作られた、検索エンジンロボット(クローラー、スパイダーなど呼び方は様々)に対する設定ファイル。

Webサーバーのルートディレクトリに "robot.txt" または "robots.txt" という名のファイルを設置することにより、検索ロボットのアクセスを制御できる。

検索ロボットが自動巡回する時には、このrobot(s).txtが参照され、索引化が許可されているか否かを自動で判断する。

大手の検索エンジンサイトが使っているロボットは、この一般的な規則に従って作られたものだと考えられるが、中には、当然(?) "A Standard for Robot Exclusion" に基づいて作られていない、行儀の悪いロボットも存在する。スパム用にメールアドレスを収集してまわるようなタイプのロボットは、当然行儀など考えていないであろう。

例えば、一行めに "User-Agent: *"、二行めに "Disallow: /" と書いておけば、サイト内の全ての索引化を拒否することになる。

主な記述例は、次の通り。

  • サイト全ての索引化を拒否する場合

    User-Agent: *

    Disallow: /

  • 一部のディレクトリの索引化を拒否する場合

    User-Agent: *

    Disallow: /cgi-bin/

    Disallow: /image/

  • 特定の検索ロボットのみの索引化を許可する場合

    User-Agent: *

    Disallow: /

    User-Agent: Lycos

    Allow: /

回答を求める質問は受け付けておりません。戴いた質問等は、内容の更新をもって代えさせていただきます。

この情報であなたの疑問は解決しましたか?

はい いいえ

「はい」の場合、すぐに検索結果は見つかりましたか?

はい いいえ

この内容へのご意見等を数行以内でどうぞ(省略可能)

(個別の質問などは受けつけておりませんのでご了承願います)

内容の間違いに関するご指摘・ご意見も、歓迎しています。


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 6.04b (5-Nov-2011)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club