リファラスパム、うざったいですよね
brimley3(id:brimley3)さんに、リファラスパムについて考察が聞きたいというリクエストをいただいたので、簡単ではありますが私なりの考察と対策を書きたいと思います。
そもそもリファラスパムって何?という人がいるかも知れないので簡単に説明します。
リファラは「どのサイトからやって来たか」というリンク元(URL)の情報です。
アクセス解析などでユーザーがどこからやって来たか、被リンクのチェックを行うため、リファラ情報をチェックするのですが、あるリンク元、URLからの流入が多く記録されている・・・なんてことがあります。
確認のために実際にそのリンク元に行ってみると英語ばかりのページ、いかにも怪しい情報商材の販売ページ、エッチなページ・・・etc だったりします。
これはリファラ情報を偽装することで、サイト管理者にアクセスさせることを狙いにしているものです。
(その他、ユーザーエージェント情報なども偽装していることが多いですがここでは割愛します。)
被リンクが貼られていないのはもちろん(ていうかそんなサイトからの被リンクはいらないですが)、ボットを使ってアクセス解析にログを残しているので、実際にサイトにアクセスされていないことがほとんどです。
この手のサイトはウィルス感染やアクセス数の水増し、アフィリエイトのリンクを踏ませることを目的としていますので、こちらからアクセスをしないことが一番の対応方法です。
リファラスパムの対応方法
とはいえ、明らかに怪しいドメイン、URLだとすぐに分かるのですが、最近は短縮URLを使うことで、なかなか見分けがつかないこともあります。
実際にアクセスする前に検索エンジンでドメイン、URLを検索することである程度は分かりますので(その際、ダブルクオーテーション「"」でドメイン、URLを括ってください)、それで調べてみるのも一つの方法です。
(検索結果に引っかからない場合はそのページがインデックスされていない、つまりは「その程度のページである」という判断も出来ます。)
また、その手のサイトには二度とアクセスしないようにフィルタリングソフトを使うのも一つの方法です。
※ 下記にChromeブラウザの拡張機能が紹介されています。参考にしてみてください。
3分LifeHacking:目的別:見たくないサイトをブロックできるChrome拡張機能5選 (1/3) - 誠 Biz.ID
アクセス解析からもログを除外したい
こちらから該当のサイトにアクセスすることはある程度は防げますが、ボットは相手側が動かし続けているので、アクセス解析へのログは依然として記録されてしまいます。
そこで、アクセス解析からもログデータを除外する(正確に言えばフィルタリングを行う)方法を紹介します。
(今回の説明は「Google Analytics」を例とした、フィルタリングを行う方法です。)
1.Google Analyticsにログインし、「アナリティクス設定」をクリックします。
2.ビューの配下にある「フィルタ」をクリックし、更に右に表示された「新しいフィルタ」をクリックします。
3.下記の画面で必要事項を入力、選択していきます。
・フィルタ名はお好きな名前をつけてください。
(分かりやすいものがいいでしょう。)
・フィルタパターンは正規表現で入力します。
(ピリオドの前に半角のバックスラッシュを挿入します。)
※ 例はドメイン名「hogehoge.com」です。適宜変更してください。
4.最後に保存をクリックして完了です。
この方法だと一つのドメインしか除外できない、複数ある場合はその都度追加していかないといけないため、かなり面倒くさいのですが、極力やっておくほうがよいと考えられます。
結局はいたちごっこだけれど
とにかくアクセスしないこと
相手の目的は「該当のサイトにアクセス」をさせることです。
とにかくこちらからはアクセスしないこと、それしか対策はありません。
この手のスパムは手を変え品を変え行われるので、対策を行ってもいたちごっこになってしまいますが、何も対策をせずにいることはスパムをのさばらせることと同義でありますので、面倒くさいですが都度対策を行うことで防いでいきましょう。
(こうして対策を行うことはもちろん、相手の手法、手口を情報共有することも有効な手段になり得ます。)