2007年12月05日
tipjarok_banner88x31_green.gif

ニュースサイトとウェブ魚拓のキャッシュ



先日、あるニュースサイトのウェブ魚拓を取ろうとしたところ以下のような画面になった。

gyotaku_cache.gif

「robots.txtによってキャッシュが禁止されており取得できません。」とのことで、調べてみると、

キャッシュの取得を禁止するにはどうすればいいですか?

以下の3つの方法のどれかを行うことでキャッシュの取得を禁止できます。

(1) 以下のMETAタグをHEADタグ内に書く
<meta name="robots" content="noindex,nofollow">

(2) ルートディレクトリにrobots.txtを設置して、"Megalodon"が取得不可能なパスを指定する
なお、robots.txtはキャッシュしておりますので、変更が反映されるまで長くて3日かかります。

(3) ウェブサイトオーナーとして削除依頼を行い、その際にキャッシュ禁止登録のチェックボックスをONにする

とのことみたい。
朝日、読売、産経、毎日のニュースサイトのrobots.txtを調べてみたところ読売だけ上記のような措置を取っているみたいだった。


看護師(ナース)のお仕事探しなら
  left2.gif  
薬剤師のお仕事探しなら(薬剤師専門コンサル付)
  left2.gif  
ヘルパー、ケアマネなど介護福祉のお仕事探しなら
  left2.gif  

« タクシーの不満点について | トップページ | 桜肉を食べた! - 馬刺しと馬肉ステーキ »






この記事を読んだ人はこんな記事も読んでいます



トラックバック

このエントリーのトラックバックURL:
http://shoulder.jp/mt/shoulder.cgi/7427




コメント

コメントしてください




保存しますか?


  


 

shoulder.jp | Copyright © Shoulder. All rights reserved. |  

 [PR] | 中古マンション | アルバイト | Yahoo | 東京ヘアサロン | 転出届 転入届 | 内田樹 | 恩田陸 | 東京レストラン | 社会福祉士 | 介護予防運動指導員 |