Wayback Machineのウェブ魚拓を拒否する方法と結果
Archive.todayは検索エンジンにインデックスするようになった
どーしてコピーの分際で私の真下に来るのかな。
開いたら広告だらけ。
Archive.todayはrobots.txtを無視
Why does archive.is not obey robots.txt?
どうしてrobots.txtに従わないの?
Because it is not a free-walking crawler, it saves only one page acting as a direct agent of the human user. Such services don’t obey robots.txt (e.g. Google Feedfetcher, screenshot- or pdf-making services, isup.me, …)
僕はクローラーではないからだよ。GoogleのFeedfetcherと同じさ。
https://blog.archive.today/から引用
確かにそうだけど、だったらインデックスされてんじゃねーよ!
Archive.todayはパソコンから開けなかった
私の環境ではパソコンWindowsから開けませんでした。
これはDNSの影響らしいです(1.1.1.1から別のものに変える)。
「このページは動作していません」
試しにスマホから開いたら開けたけど、サイトがモバイル対応されていないので見えにくい。
軽く考えた結果、VPN拡張機能を使って海外からアクセスしたらパソコンで表示できました。
Archive.todayのアーカイブを防ぐ方法
スクリプトをヘッダーに置く
| <!-- archive.today --> | |
| <script src="https://code.activetk.jp/archive-today.blocker.js" defer></script> |
ありがとうございます!
【悪質】archive.todayのアーカイブ作成を拒否する方法 | ActiveTK’s Note
リンクの否認を行う
ドメインを否認する(他にもあるかも)
・archive.fo
・archive.is
・archive.li
・archive.md
・archive.ph
・archive.today
・archive.vn
・archive.ph
・archive.ec(一旦消滅したけどらしいけど一応)
・archivecaslytosk.onion
・archiveiya74codqgiixo33q62qlrqtkgmcitqx5u2oeqnmn5bpcbiyd.onion
国外からのアクセスを拒否する
.htaccessで設定します。
海外からのアクセス(IP)を拒否するhtaccessの設定 #Security – Qiita
ipv4.fetus.jp: 国/地域別IPアドレス(IPv4アドレス)割り振り(割り当て)一覧
IPをブロック
現在、.htaccessでArchive.todayのIP「5.188.88.34」をブロックしていますが、またサーバー&国ごと変えるだろうから意味は薄いかと。
Archive.todayに魚拓を盗られてインデックスもされたらやるべきこと
DMCA著作権侵害を行う
メールで問い合わせ
聞く耳があるかどうかは不明。
webmaster@archive.md
ブログから問い合わせ
https://www.tumblr.com/のアカウントが必要。
https://blog.archive.today/
Archive.todayがページを削除することはない
will you remove a website archived from your site, under a formal DMCA notice?
DMCA著作権侵害報告をされたら削除する?
Usually, no.
やらないよー
1. DMCA applies only to US companies. And it is not something they must obey, it is about providing safe-harbor to Internet companies if they follow. Not being in the US, we do not receive this privilege.
DMCAはアメリカ企業だけに適用されるけど、俺らはアメリカに居ないし。
2. It is prone to bogus removals (there are studies on this topic https://www.google.com/search?q=ChillingEffect+bogus+dmca+notices). For example, Twitter has removed our logo from https://twitter.com/archiveis following a formal DMCA notice. Tumblr (where blog.archive.today is) received the same letter and ignored.
というか、虚偽の報告をされる時もあるし。
3. Indeed, relations with ISPs/registrars are slightly aggravated by ignoring DMCA notifications but voluntarily following them will not change anything. I disclosed a few days ago that even bare domains without any content were attacked and hijacked. A letter like “there are million stolen bitcoins on that server“ or simply something hysterical is more effective than formal ones. And much more often.
インターネットサービスプロバイダ (ISP)との関係が少し悪くなることもあるけど(※だからサーバーをちょいちょい移動)通知に従ったところで何も変わらんし。
We are close to Telegram in this respect: illegal content is removed by requests of authorities (or when we can predict the position of authorities) but “I do not like it and want to shut down“ wrapped in a form that mimics a lawyer’s letter – no. That undermines the idea of a webpage archive. If we follow this path, the first step will be to remove what we do not like ourselves.
というかーWebページのアーカイブ概念が覆されちゃうじゃん?
https://blog.archive.today/から引用