お行儀が悪すぎるので、IPブロックしました。
既に取られている魚拓については無理ですが、これ以上の魚拓取得を防ぐためにIPブロックしました。
この点では、アクセスそのものを封じられるのはWordPressに軍配が上がります。レンタルブログではコメントは阻止できても、アクセスそのものを封じることはふつうできません。
archive.isというサイトですが、こいつはrobots.txtに従いません。また削除依頼も無視し続け、通常のブラウザになりすましてアクセスするためIPブロックを行いました。今後魚拓を取ろうとしても、Error 1007が表示されるようになっています(HTTPステータスコードは403が返されます)。
なお、IPv4でブロックしてもIPv6でアクセスしてくるため、IPv6でのアクセスを封じました。IPv6だけを使ってる人はまだまだ少数のはずですし。
ブロックしたIPレンジは、78.46.174.0/24です。78.46.174.128/27をブロックすれば事足りるようですが、CloudFlareのファイアウォールが/16または/24のCIDR表記にしか対応していなかったため、やむなく/24でのブロックを行いました。
Challengeに設定してもarchive.isはなぜか突破してしまうので、Blockに設定してあります。/24というそこそこ小さいレンジで設定したので、巻き込まれる人はごく少数化と思われますが。
これでも、引き続きTwitter等のログを取り続ける可能性は考えられます。こちらに関しては不可抗力ですので放置します。また、キャッシュを使った魚拓の取得を防止するため、noarchiveをheadセクションに追加しました。また、一部の記事のキャッシュ削除リクエストをGoogleに送信しました。
それでもテキストをコピペしたり、物理的に印刷したりする可能性もあります。これは不可抗力です。
何が問題かと言えば、本人の同意なくページを複製し第三者の名のもとに公開し、削除も受け付けないことが問題なのです。これは日本国内では違法行為です(2010年ころから違法になりました)。ウェブ魚拓がrobots.txtに従うのは、そうした法的リスクを避けるためです。
いずれにしろ、勝手にページを全文コピーされ転載されるのは気持ちの良いものではありません。小規模なサイトに対する対策は事実上困難ですが、とりあえずarchive.isによるページの取得はお断りします。技術的に封じました。