(cache) ニュースサイトとウェブ魚拓のキャッシュ

2007年12月05日

ニュースサイトとウェブ魚拓のキャッシュ

先日、あるニュースサイトのウェブ魚拓を取ろうとしたところ以下のような画面になった。

「robots.txtによってキャッシュが禁止されており取得できません。」とのことで、調べてみると、

キャッシュの取得を禁止するにはどうすればいいですか？

以下の３つの方法のどれかを行うことでキャッシュの取得を禁止できます。

(1) 以下のMETAタグをHEADタグ内に書く
<meta name="robots" content="noindex,nofollow">

(2) ルートディレクトリにrobots.txtを設置して、"Megalodon"が取得不可能なパスを指定する
なお、robots.txtはキャッシュしておりますので、変更が反映されるまで長くて3日かかります。

(3) ウェブサイトオーナーとして削除依頼を行い、その際にキャッシュ禁止登録のチェックボックスをONにする

とのことみたい。
朝日、読売、産経、毎日のニュースサイトのrobots.txtを調べてみたところ読売だけ上記のような措置を取っているみたいだった。

看護師（ナース）のお仕事探しなら
		<script language="javascript" src="/contents/011/887/469.mime7"></script><noscript><a href="http://ck.jp.ap.valuecommerce.com/servlet/referral?sid=2530065&pid=877717971" target="_blank" ><img src="/contents/011/887/461.mime7" height="60" width="234" border="0"></a></noscript>

薬剤師のお仕事探しなら（薬剤師専門コンサル付）
		<script language="javascript" src="/contents/011/887/470.mime7"></script><noscript><a href="http://ck.jp.ap.valuecommerce.com/servlet/referral?sid=2530065&pid=877717963" target="_blank" ><img src="/contents/011/887/462.mime7" height="60" width="234" border="0"></a></noscript>

ヘルパー、ケアマネなど介護福祉のお仕事探しなら
		<script language="javascript" src="/contents/011/887/471.mime7"></script><noscript><a href="http://ck.jp.ap.valuecommerce.com/servlet/referral?sid=2530065&pid=877717981" target="_blank" ><img src="/contents/011/887/463.mime7" height="60" width="234" border="0"></a></noscript>

« タクシーの不満点について | トップページ | 桜肉を食べた！ - 馬刺しと馬肉ステーキ »

この記事を読んだ人はこんな記事も読んでいます

トラックバック

このエントリーのトラックバックURL:
http://shoulder.jp/mt/shoulder.cgi/7427

コメント

Shoulder.jp

ニュースサイトとウェブ魚拓のキャッシュ

コメントしてください

RSS配信

Profile

カテゴリー

エントリー一覧

過去の月別

MovableType

Shoulder.jp	文字サイズ変更
ブログする男は秒きざみでずるくなる。

Shoulder.jp

ニュースサイトとウェブ魚拓のキャッシュ

以下は、「ニュースサイトとウェブ魚拓のキャッシュ」の関連エントリーです。

コメントしてください

RSS配信

Profile

カテゴリー

エントリー一覧

過去の月別

MovableType