ブロガーやアフィリエイターですと、記事を書く際に“引用”をすることがあると思います。その言及対象が、信頼性が薄かったり、炎上マーケティングを行っているサイトだったりする場合もあると思います。
そんなサイトにアクセスや被リンクを渡したくない、という思いを抱いたことがある方も多いのではないでしょうか?
SEOの神とも称される辻さん(辻正浩 | Masahiro Tsuji (@tsuj) | Twitter)が以下ツイートをしていました。
※神たるゆえんは、記事後半をご覧ください!
釣りタイトルはよくありますが、医療情報で「直ちに死」という釣り表現は初めて見た!>脳ヘルニアは進行すれば直ちに「死」?4つの症状と2つの主な原因とは|welq [ウェルク] | ココロとカラダの教科書。ヘルスケア情報まとめサイト https://t.co/DRzl1jdZIr
— 辻正浩 | Masahiro Tsuji (@tsuj) 2016年8月13日
※SEOを毛嫌いする方もいるかと思いますが、正しい意味でSEOを活用したり、広めることは有意義なことですし、辻さんに関してはそのような意志をお持ちで、その意思のもと活動されている方だと思っています。(私がそんなSEOを実践できているかは別問題!です…。)
このwelqの記事にある『脳ヘルニアは進行すれば直ちに「死」?』という表現と内容が正しいのか私自身には知識がなく判断がつきません。ただ、怪しそうには感じていますし、疑問符でごまかしているように感じます。
いちブロガー?として言及したいけどリンクを渡したくないサイトや記事というのはどうしてもあります。リンクを渡したくない理由としては、言及すればするだけ、その彼らを助長してしまうからに他なりません。
まずは結論:インターネットアーカイブ(archive.org、WaybackMachine)を使おう
@tsuj ブログなどでリンクを送りたくないサイトに対して言及する際、同じように魚拓を経由すれば元サイトにリンクは送られないのでしょうか??rel="nofollow"リンクよりも良いのか疑問に思いました。 お昼ご飯前に唐突な質問失礼しました。
— かつしん (@ktsn1129) 2016年8月13日
応援したくないページを紹介したいとき一番良いのは画像キャプチャ系サイトですが、HTMLソースを見せたい場合はrobots.txtブロックで検索エンジンが認識できないインターネットアーカイブかと。
— 辻正浩 | Masahiro Tsuji (@tsuj) 2016年8月13日
一部広告はクリックできるのであくまでもSEO観点で価値を渡さないためですが。
もうこれで解決です。
robots.txtでGoogleのクローラーをブロックしている魚拓系サービスを使えばいいとのことです。
使い方も超簡単!
Internet Archive: Digital Library of Free Books, Movies, Music & Wayback Machine
サイトに行き、赤枠に魚拓を取りたいURLを入力します。
日付を押します。(画像右下青字)
かんせいです。
※辻さんのお返事では、画像キャプチャー系の魚拓サービスがいいとありましたが、短期間しか保存できないサービスしかパッと見つけられませんでした。
※非会員は3日、無料会員は30日ログインしないと削除されるそうです。
インターネット・アーカイブって何?
WaybackMachine(インターネット・アーカイブ/archive.org)ってそもそもどんなものなのでしょう?
▼インターネットアーカイブ
インターネット・アーカイブ(The Internet Archive)は、WWW・マルチメディア資料のアーカイブのひとつを運営している団体である。本部はカリフォルニア州サンフランシスコのリッチモンド地区に置かれている。 アーカイブにはプログラムが自動で、または利用者が手動で収集したウェブページのコピー(ウェブアーカイブ)があり、これは「WWWのスナップショット」と呼ばれる。その他、ソフトウェア・映画・本・録音データ(音楽バンド等の許可によるライブ公演の録音も含む)などがある。アーカイブは、それらの資料を無償で提供している。
▼ウェイバックマシン
ウェイバックマシン (Wayback Machine)はインターネットアーカイブが保存するウェブアーカイブを閲覧することのできるサービスである。インターネットアーカイブのもっともよく知られたサービスの一つであり、ときに「インターネットアーカイブ」がウェイバックマシンと同義に使われることもある他、「ウェイバックマシン」がその背景のWebクローリングを含んだ意味で使われることもある。
私自身は、Wayback Machineとして認識していたので、今回調べてインターネット・アーカイブ≒ウェイバックマシンだと知りました。
これで終わりといえば終わりなのですが、そのままじゃこの記事の意味が無い! もう少し掘り下げてみたいと思います。
no follow noindex robots.txt(disallow)の使い分け
お恥ずかしい話ですが、nofollow、noindex、robots.txt(disallow)の差をしっかりと理解していませんでした。
「nofollow=リンクを渡したくない時に使う」、「noindex=Googleに来てほしくないページに入れる」程度の認識でした。
サイトのページをほとんどの検索エンジン ウェブクローラのインデックス登録対象から除外するには、次のメタタグをページの <head> セクションに挿入します。 <meta name="robots" content="noindex"> ページのインデックス登録を Google ウェブクローラのみが実行できないようにするには: <meta name="googlebot" content="noindex">
引用:メタタグを使用して検索インデックス登録をブロックする - Search Console ヘルプ
ザックリは合っていたようです。
robots.txt ファイルはサイトのルートに配置するファイルで、検索エンジンのクローラにアクセスされたくないサイトのコンテンツを指定します。
引用:robots.txt ファイルについて - Search Console ヘルプ
クローラーを拒否しているか否かは、その魚拓サービスによって異なると思われます。 サービスの設計上、Googleのクローラーを許可していることもあるのでしょう。
@ktsn1129 メディアとしてはnofollowでも広告クリックのあるアクセスは嬉しい場合も多いですねー。Web魚拓ならゼロかというとリンク先がインデックスされてるので違いますね。
— 辻正浩 | Masahiro Tsuji (@tsuj) 2016年8月13日
余談:辻さんはSEOにおける神なのだろうか?
私自身、辻さんと会ったこともなく、セミナーなども見に行った事がありません。 もちろん、利害関係もありません。
なんだか「神」と崇められる人を見ると怪しいと思いませんか???
では、Google先生に聞いてみましょう。
はい。これが答えの全てです。
前出の辻さんのページでご自身でサイト内に「SEO 神」という記載があったら失笑物ですが「神」という文字は1文字もありません。 「SEO 神」と言った記事で言及されていたり、aタグ内のリンクテキストにこのような記載が多いからだと想像しています。
ご自身で名乗らないのに神認定!
「私が神である。」
これを自身で言い始めると新興宗教のようになりそうです。
※調べたらドストエフスキーは近しいことを言っているようですが、本意は異なると思いました。
自身で名乗らず、人々から認められ「神」と崇められるのが正しい神の姿なのかもしれません。念のため、私自身は無神論者です。
最後に:welqの全てのページには…
以下記載があります。
当社は、この記事の情報及びこの情報を用いて行う利用者の判断について、正確性、完全性、有益性、特定目的への適合性、その他一切について責任を負うものではありません。この記事の情報を用いて行う行動に関する判断・決定は、利用者ご自身の責任において行っていただきますようお願いいたします。
少なくとも医療に関する情報にクエッションマーク一つ付けただけ、そして留意事項を記載したとしても、万が一の事態が起こった際は、その責はライターもしくは運営会社に残ります。
なんでこの記事を書くに至ったか??それはこの記事に端を発します。