先日Googleが、「検索結果を評価するガイドライン」を発表したことが話題になりましたが、今回は独自の調査やGoogle社員の発言から、検索順位の決定要因と考えられる項目を導き出し、発表した記事を翻訳してご紹介します。
Google公式のものではなく、あくまで1個人(会社)によるものですが、各要因の信憑性まで書かれており、非常に参考になる内容になっています。
全4回にわたってお送りしますので、お見逃しのないように。
Googleの順位決定要因
近年、Googleのオーガニック検索で上位表示するための情報が溢れかえっている。筆者は研究を通じて、それらの情報のほとんどど大多数が部分的に間違っているか、完全に間違っているかのどちらかだということを突き止めた。
それらの情報を鵜呑みにしてアドバイスしたり商品開発をしたりするのは危険である。正確な「要因」として残るのはたいてい、実際にはGoogleが「要因」として考えているものでは全く無く、ただのテクニックや間接的に相互関係があるだけのものがほとんどである。
しかし、Googleの利用している要因のかなり多くについて筆者は突き止めている。SEO知識というのはその辺のブロガーやフォーラムなどで得るものではない。本当に信頼のできる情報というのは下の3つからしか得ることができない。
- 特許情報
- Googleもしくはその社員の発言
- 科学的に正しく行われた実験
これらの情報があれば、Googleがどのように順位をつけているのかを突き止めることもできる。ちなみに議論の余地があるものやまったくの迷信に過ぎないものも含めた。また全ての要因はGoogleの一般検索の順位決定要因のみにフォーカスしている。
ランキング要因 – 目次
▼目次を見る(クリック)
- URL内のキーワード【100%】
- URL前半部分のキーワード【80%】
- タイトルタグ内のキーワード【100%】
- ページ内のキーワード密度【70%】
- ページのTF-IDF【80%】
- Hタグ内のキーワード (H1, H2, etc.) 【80%】
- 強調表示された単語【100%】
- キーワードの近隣性【80%】
- ALTテキスト内のキーワード【100%】
- 検索フレーズの完全一致【80%】
- 検索フレーズの部分一致【80%】
- ページ上部のキーワード【70%】
- キーワード語幹【100%】
- 内部リンクのアンカーテキスト【100%】
- ドメイン名がキーワード【70%】
- ドメイン名内のキーワード【100%】
- ドメイン全体のキーワード密度【70%】
- ドメイン全体でのTF-IDF【70%】
- ページ権威の分布【100%】
- オールドドメイン【70%】
- 新規ドメイン【70%】
- ハイフンで区切られたURL内のキーワード【80%】
- タグ前部のキーワード【70%】
- 長期にわたるドメイン登録【70%】
- Whois情報の公開【50%】
- HTTPS(SSL)の利用【100%】
- Schema.org【70%】
- 新鮮なコンテンツ【100%】
- ドメイン全体での新鮮なコンテンツ【50%】
- 古いコンテンツ【100%】
- ドメイン全体での古いコンテンツ【50%】
- 質の高い外部へのリンク【100%】
- 関連のある外部へのリンク【50%】
- 正しい綴りと文法【70%】
- 読解レベル【20%】
- リッチメディア【70%】
- サブディレクトリ【70%】
- メタ・キーワード【5%】
- モバイル・フレンドリー【100%】
- メタ・ディスクリプション【20%】
- Googleアナリティクス【5%】
- GoogleGoogleウェブマスターツール(※訳注Search Console)【5%】
- ccTLDと国内検索【70%】
- XML Sitemaps【5%】
- Salience of Entities【70%】
- フレーズと文脈【80%】
- ユーザー付近のWebサーバ【80%】
- 著者の評判【5%】
- rel=”canonical”タグの使用【20%】
- rel=”author”タグの使用【5%】
- rel=”publisher”タグの使用【5%】
- “www” サブドメインの使用【5%】
- 専用IPアドレス【5%】
- サブドメインの使用【50%】
- サブドメインの数【50%】
- AdSenseの使用【5%】
- HTMLコメント内のキーワード【5%】
- CSS/JavaScriptコメント内のキーワード【5%】
- CLASS、NAME、ID内のキーワード【5%】
- プライバシーポリシー【50%】
- 立証された住所【20%】
- 立証された電話番号【50%】
- アクセス可能なコンタクトページ【50%】
- コンテンツに対するコード割合【50%】
- メタ・ソースタグ【20%】
- もっとページにコンテンツを【50%】
- メタ・ジオタグ【20%】
- 表示タイトル前部のキーワード【70%】
- Hタグ前部のキーワード【50%】
- 他より奇抜なコンテンツ【80%】
- 自己より奇抜なコンテンツ【80%】
- サイト全体でのユニークスコア【70%】
- コメントの数【20%】
- ポジティブな感想のコメント【5%】
プラスに働く内部SEO要因74項目
内部SEO要因とは保有サイトを管理することで直接操作できるSEO要素のことである。
プラスに働く内部SEO要因では順位において良い結果をもたらす可能性のあるものについて述べる。このなかの幾つかの要素においては、乱用することにより、逆にマイナスの要因になってしまうものも含まれている。マイナス要素については後述する。
プラスになる内部SEO要因とは大雑把な言い方をすると、「コンテンツの内容」「あらゆる環境からのアクセシビリティ」「ユーザー体験への工夫」に関係するものである。
1.URL内のキーワード【100%】
ドメイン外のURL部分に含まれるキーワードや表現はそれらのクエリでの検索において、コンテンツとの関連性を確立する助けとなる。URLの長さが長くなりすぎたり、キーワードを繰り返し使用したりすることによりこの効果は薄れていく傾向にある。
ソース: Patent US 8489560 B1, Matt Cutts(http://www.stephanspencer.com/matt-cutts-interview/)
2.URL前半部分のキーワード【80%】
URL内のキーワード出現順番というものを要素化するとしたら、理論的に言えば前に出現するキーワードに比重がかけられているといえる. 少なくともマット・カッツの言葉を借りるなら「5単語くらいかそれ以降のキーワードにおいて効果は薄れていく」らしい。
ソース: Matt Cutts(http://www.stephanspencer.com/matt-cutts-interview/)
3.タイトルタグ内のキーワード【100%】
タイトルタグはサイト上の文章やページのタイトルを定義づけるものであり、同時に検索結果やSNS上でのシェア時におけるスニペット上にしばしば出現するタグである。 文字にもよるが、30文字を超えない範囲でつけることをおすすめする。URLと同じように、前半部分のキーワードに比重が置かれるという説が最も有力である。
ソース: US 20070022110 A1
4.ページ内のキーワード密度【70%】
テキスト内のキーワード密度。実践的なSEOでは過去に、5.5-6%のキーワード出現率が最も効果があると定義づけられたことがある。 確かに2000年代前半から中期にかけてはこの数字はかなり効果的であった。そのためGoogleはコンテンツ解析の方法を改良しており、2015年現在においてこの方法はほとんど効果がないと言って良いだろう。キーワードの出現率が高すぎた場合、手動対策の対象となる場合がある
ソース: Patent US 20040083127 A1
5.ページのTF-IDF【80%】
TF-IDF もしくは「単語の出現頻度及び逆文書頻度」とよばれるものについて述べよう。TF-IDFは通常計測した際のページ内キーワード密度よりも、「普通ではない」キーワードの出現率に対して重きを置くよう設計されている。 この計測方法では「その」のような、頻出する単語は計測から除外され、たとえば「Googleの順位決定要素」といった表現が、学問的教養を持った人間がそのトピックについて述べたドキュメントにおいて何回出現するのかを確定させることができる。
ソース: Dan Gillick and Dave Orr (http://googleresearch.blogspot.com/2014/08/teaching-machines-to-read-between-lines.html), Patent US 7996379 B1
6.Hタグ内のキーワード (H1, H2, etc.) 【80%】
Hタグ内のキーワードはページの主題を定義する際に強く比重のかけられるポイントである。H1タグに最も比重がかけられ、次にH2、H3と続くほど少なくなっていく。Hタグは訪問者のユーザー体験を向上させ、明確で記述的なHタグは直帰率を下げることが多くの研究で明らかになっている。
ソース: In The Plex (http://www.amazon.com/In-The-Plex-Google-Thinks/dp/1455875724), Penn State (http://accessibility.psu.edu/headingshtml/)
7.強調表示された単語【100%】
太文字や斜体、下線、大きめのフォントなどによって強調表示されたキーワードはページの主題を決定する際にHタグほどではないが大きな比重をかけられる。このことはマット・カッツやSEO研究家によって立証され、Googleの特許には「大きなフォントか太文字、もしくは斜体で記載されたテキストはそうでない通常のテキストに対して重い比重がかけられるかもしれない」と記述されている。
ソース: Matt Cutts (https://www.youtube.com/watch?v=awto_wCeOJ4), Patent US 8818982 B1
8.キーワードの近隣性【80%】
お互いの単語同士の近さはそれらの関連性を暗に示している。英語を扱える人にとってこの情報は驚くに値しないことであると思う。つまり、1つの文章内で「渋谷のピザ屋」について述べた文章のあるページほうが、「渋谷」と「ピザ屋」について別々の文章で述べているページよりも「渋谷 ピザ屋」というキーワードで上位表示される可能性が高い。
ソース: Patents: US 20020143758 A1, US 20080313202 A1
9.ALTテキスト内のキーワード【100%】
画像ファイルのALT属性は検索エンジンや画像を表示できない環境のユーザーに対してその画像の内容を示すのにつかわれる。これは特に画像検索での関連性の向上や、ユーザー体験の向上に繋がる。
ソース: Matt Cutts (https://www.youtube.com/watch?v=3NbuDpB_BTc)
10.検索フレーズの完全一致【80%】
Googleは検索クエリのうちほんの一部しかコンテンツに含まれていないページを返すこともある(もしくは全く含まれていないケースもある)が、特許によると「情報検索スコア(IR)」は検索フレーズの完全一致に高い点数をつけるように設計されている。具体的にあげるとするなら、特許の「検索クエリの全ての言い回しに完全一致するドキュメントは、一部一致するドキュメントよりも高い点数が与えられるべきである」という部分に当てはまる。
ソース: Patent US8818982 B1
11.検索フレーズの部分一致【80%】
これはGoogleの特許により立証されていることだが、ページが検索フレーズと完全一致するフレーズをコンテンツに有していた際、それはクエリとの関連性を強く認められIRスコアを高く付けられる。この過程においてGoogleに入力された検索クエリと完全一致しないフレーズしかコンテンツ内にないとしても、そのクエリで順位が付く可能性は十分にあることをGoogleは認めている。これは、色々なクエリでグーグル検索をした結果を鑑みても明らかである。
ソース: Patent US8818982 B1
12.ページ上部のキーワード【70%】
これは英語におけるきわめて自然な文法傾向といえるのだが、通常大事なことは先に言おうとする。これは文や文章、ページからHTMLのタグにいたるまで全てに当てはまることである。Googleもどうやらこの事実をあらゆる場所で適応しているようで、ページの上部やより目立つ場所のコンテンツに比重をおいているようだ。少なくともページレイアウト・アルゴリズムにおていてはサイトの上部(above-the-fold)にあるコンテンツが優先されるように設計されている。
ソース: Matt Cutts (http://insidesearch.blogspot.com/2012/01/page-layout-algorithm-improvement.html)
13.キーワード語幹【100%】
キーワード語幹とは単語の根っことなる部分を取り出し、同一基語を持つ単語を探すことである。キーワード出現率スコアのかさ増しが横行して、読めたものではないページが増えたことをうけ、2003年にフロリダ・アップデートとともにGoogleにより導入された。
ソース: Matt Cutts (https://www.youtube.com/watch?v=NpnnXt7CHMU)
14.内部リンクのアンカーテキスト【100%】
リンクのアンカーテキストは、そのリンクの飛び先をユーザーに伝えるためのものである。これはサイト内のナビゲーションを構成する上で重要な要素で、且つ乱用しない場合に限り「ココをクリック」などという曖昧な内部リンクよりもコンテンツとキーワードの関連性を高めるのに効果的である。
ソース: Google’s SEO Starter Guide (http://www.google.com/en//webmasters/docs/search-engine-optimization-starter-guide.pdf)
15.ドメイン名がキーワード【70%】
これは完全一致ドメイン(EMD)にも関連することだが、ドメインと検索クエリが完全一致しGoogleの定義する「商業クエリ」に当てはまる場合、順位にボーナスが与えられる。ブランドがそのブランド名で上位表示されるべきという構想のもとデザインされたものであったが、あまりにも悪用するケースが増えすぎたため、現在では多くの場合で効果が減少している。
ソース: Patent EP 1661018 A2, US 8046350 B1
16.ドメイン名内のキーワード【100%】
キーワードがドメイン名内に含まれる場合、順位にボーナスが与えられる。その比重は特定の検索クエリとドメイン名が完全一致する場合よりは低いが、ドメイン名以降のURLにキーワードが含まれる場合よりは高くなっている。
ソース: Patent EP 1661018 A2
17.ドメイン全体のキーワード密度【70%】
クリシュナ・バーラットはヒルトップ・アルゴリズムを導入する際にページランクの持つ問題点を次のように割り出した。「(ページランクによって)権威付けられたWebページが例え検索クエリに一致するコンテンツを有していたからといって、そのクエリのトピックについての権威であるとは限らない」。ヒルトップ・アルゴリズムはサイト全体の関連性を見て「専門的」というラベル付を行って検索結果の向上を行っていた。TF-IDFがページ単位での関連性を決定づけるものであるため、ヒルトップ・アルゴリズムが同じような機能を使ってドメインの「専門性」を決定づけていると推測したものである。
ソース: Krishna Bharat (ftp://ftp.cs.toronto.edu/pub/reports/csri/405/hilltop.html), Patent US 7996379 B1
18.ドメイン全体でのTF-IDF【70%】
もし2015年現在において「ターム頻度(TF)の代わりにキーワード密度なんて言葉を使おうものなら、SEOの専門家たちがこぞって怒り出すことだろう。その2つの単語はほぼ同義語といっても過言ではないのにかかわらずだ。キーワード密度とTF-IDFの要素比較をする際に重要となってくるのはIDFの部分、すなわち逆文書頻度(Inverse Document Frequency)に他ならない。Googleは副詞のような単語をTF-IDFを利用して除外し、トピックに対する自然なキーワード密度を動的に見積もっている。「どれくらいが自然なのか?」という比較計量をすると、時間とともに数値は減ってきているようである。
ソース: Dan Gillick and Dave Orr (http://googleresearch.blogspot.com/2014/08/teaching-machines-to-read-between-lines.html), Patent US 7996379 B1
19.ページ権威の分布【100%】
一般的にサイト全体からリンクされているページは権威が高くなり、そのページからのリンク、さらにその下となるにつれ権威は低くなっていく。同じような効果がトップページからリンクされているページに見られるが、これはほとんどのサイトにおいてトップページが一番リンクされているページだからである。この要因を最大限利用しようとして内部リンク構造を作ることはページランク・スカルプティングとして知られている。
ソース: Patent US 6285999 B1
20.オールドドメイン【70%】
完全に新しいドメインもアルゴリズムによって一時的なブーストがかかることがあるため混乱しがちだが、オールドドメインの方がほんのすこしだけ(マット・カッツがほんのちょびっとというところを強調していた)信用される。つまり、ぽっと出のドメインよりはブラックハットな一時的なドメイン利用でないと証明できる可能性がほんのすこし高いということである。
ソース: Matt Cutts (https://www.youtube.com/watch?v=-pnpg00FWJY)
21.新規ドメイン【70%】
新規ドメインは一時的な順位ブーストがかかることがある。特許には新しいコンテンツの決定方法についての協議がなされており、そこには「ドメイン登録日時のドキュメント開始日時の指標としての使用」に関する項目がある。マット・カッツによれば、この項目が順位に与える影響は相対的にかなり小さいものだということだ。言うならば、この項目は真新しいサイトや、タイムリーなニッチサイトが飛躍するのに十分なチャンスを与えられるために存在しているにすぎない。
ソース: Patent US 7346839 B2, Matt Cutts (https://www.youtube.com/watch?v=-pnpg00FWJY)
22.ハイフンで区切られたURL内のキーワード【80%】
URL内のキーワードを区切る理想的な方法はハイフンを利用することと言えるだろう。アンダーバーも利用できるにはできるが、プログラミングパラメーターと混同される可能性があるためあまり信頼性は高くない。全てのキーワードをつなげてURLに入れてしまうと、複数キーワードとしてみなされない可能性があり、結果どのキーワードでもURL内含有キーワードとしての効果の妨げとなることがある。ちなみにこれ以外の理由でハイフンを利用したからといって、順位に対してポジティブな影響をあたえるわけではない。
ソース: Matt Cutts (https://www.youtube.com/watch?v=AQcSFsQyct8)
23.タグ前部のキーワード【70%】
2000年代はじめに提唱されたSEO理論に、「最初の1/3ルール」というものがあった。これは我々の言語(英語)において、文であれタイトル、文章、ひいてはWebページ全体であれ、一般的に並び順は重要度順であることに起因している。
ソース: 考察による
24.長期にわたるドメイン登録【70%】
Googleは特許のなかで、長期にわたるドメイン登録がドメインの正当性を予測するのに信頼たるものであると直接明言している。考えてみればこれは、「短期的で、数の暴力に売って出てくる、イタチごっこ故に必要以上に長期登録するドメインを持たないWebスパム」に対抗するための手段なのかもしれない。
ソース: Patent US 7346839 B2
25.Whois情報の公開【50%】
Googleは彼ら自身のドメイン登録情報を調査する能力を低く見積もっているにも関わらず、ドメイン登録情報を利用したWebスパム選別のための特許をGoogleが保有しているというのはあまりに有名な話である。またマット・カッツが非公開whoisがペナルティ要因の引き金なる可能性があるという話をしているのを見たことがあるし、彼のブログの読者にニセのwhoisデータを報告するように促しているのを見たこともある。ただこれはあくまで、無意味にネガティブな要因になってしまわないように「石橋を叩いて渡る」程度のものにすぎないであろう。
ソース: Patent US 7346839 B2, Matt Cutts (https://www.mattcutts.com/blog/2006-pubcon-in-vegas-thursday-site-reviews/)
26.HTTPS(SSL)の利用【100%】
SSLはユーザーの情報入力をともなうか否かにかかわらず、2014年に正式にポジティブな順位要因として組み込まれた。ゲイリー・イリーズは2015年にSSLの重要性を低いものとし、ただ単なるタイブレーカーとしての役割にすぎないと表現している。数値スコアをベースとしているアルゴリズムが見ているサイトは何十億とあるのにもかかわらず、競争率の高いクエリにおいてタイブレーカーが意味をなしていることは意外と多い。
ソース: Google (http://googlewebmastercentral.blogspot.com/2014/08/https-as-ranking-signal.html), Gary Illyes (https://twitter.com/methode)
27.Schema.org【70%】
GoogleとYahoo!、Bing、Yandex の共同プロジェクトであるSchema.org の出現により、キーワードが潜在的にもつ理論データを理解できるようになってきた。その結果、検索結果ページは、我々のおなじみの「10この青いリンクページ」から大分進歩したといえるだろう。いまのところ構造化データの利用は、あらゆる種類の状況下で順位を伸ばす可能性を持っている。また伝統的な順位においても、entity salience(※訳注 とあるキーワードに対してGoogleが一般的に知られる情報を自動で結びつけて関連性を判断すること)として知られる順位要素を満たすことで有利になる可能性はある。
ソース: Schema.org (https://www.schema.org/), Matt Cutts (https://www.youtube.com/watch?t=37&v=OolDzztYwtQ)
28.新鮮なコンテンツ【100%】
技術的な正式名称を言うならば「鮮度依存するクエリにおけるコンテンツの新鮮度」となるだろうか。この項目では通常QDFと呼ばれる、すなわち新しいコンテンツということに価値を置く意味があるクエリに関して述べる。これは全てのクエリに対して適応されるわけではないが、特に情報分野におけるクエリなど、かなり多くの場合に適応される。この恩恵を顕著に受けているのが、ブランド出版サイトと言えるだろう。
ソース: Matt Cutts (https://www.youtube.com/watch?v=NNm0FZ40haU)
29.ドメイン全体での新鮮なコンテンツ【50%】
これはドメイン全体でのコンテンツの新鮮さを保った場合におけるパフォーマンスの確証されていない考察である。考えるに、リソースを全体的に見た時Googleはなるべく石化された情報が少ないことを推奨しており、更には情報の正確性・関連性、さらには少なくとも一部の重要な情報においてはサイトオーナーによる時折のアップデートや補足の追加をすることをGoogleは求めている。
ソース: Patent US 8549014 B2, Speculation
30.古いコンテンツ【100%】
Googleの特許には「あるクエリにおいては、古いドキュメントが新しい物より価値があるものもある」と記述されている。そこにはドキュメントの平均の古さを考慮して検索結果を表示する前に並び替える可能性があることも示唆されている。
ソース: Patent US 8549014 B2
31.ドメイン全体での古いコンテンツ【50%】
理論的に判断して、QDFのようなニュース系のコンテンツが優遇されるアルゴリズムがある以上、その逆の「古さ依存クエリ(QDO)」のようなものが存在する可能性は否定できないだろう。
Googleの口からQDOについての言及がなされたことがないことを考慮すると、QDFが働いていないときは、古いコンテンツの方が優遇されている可能性が高いと考えると辻褄があう。ただ、ドメイン全体でのコンテンツ新鮮さの項目同様、この理論を証明するに足る証拠は何もない。
ソース: 考察による
32.質の高い外部へのリンク【100%】
外部へのリンクは「ページランクの流出」を招く可能性があるにはあるが、Webサイトというものは本来行き止まりであるべきではない。Googleは「良いサイト」に対する外部リンクに評価を与える。マット・カッツの言葉を拝借するなら「我々(Google)のシステムは良いサイトに対してリンクすることを推奨している。」
ソース: Matt Cutts (https://www.mattcutts.com/blog/pagerank-sculpting/)
33.関連のある外部へのリンク【50%】
Googleが被リンクを分析してサイトの権威付けや関連性、文脈判断を行っているのと同様、外部へのリンクでも同じようなことをしていると考えるのは極めて自然なことである。ヒルトップ・アルゴリズムと結びつけることもできるだろうが、単なるリンク返しとしての慣例として行われているだけのことも多い。
ソース: Moz (https://moz.com/blog/external-linking-good-for-seo-whiteboard-friday)
34.正しい綴りと文法【70%】
これはBingの順位要素であるが、Googleのアミット・シンハルも次のように述べている。「我々もこれと同じようなことを求めている」つまり、綴と文法の正確性をコンテンツの質として考慮するということをだ。マット・カッツは2011年に「ずっと昔はね」という言葉とともにこの要素を使っていることを否定したが、何らかしらの要素で順位との相互関係はあるだろう。
例えば、一番最初のパンダ・アップデートではかなり誤字脱字と文法ミスの影響があったように感じた。それはともかく、コンテンツに関係のある要素が綴りと文法に左右されないはずがないだろう。
ソース: Matt Cutts (https://www.youtube.com/watch?v=qoFf6Kn4K98), Amit Singhal (http://googlewebmastercentral.blogspot.com/2011/05/more-guidance-on-building-high-quality.html)
35.読解レベル【20%】
検索結果ページのフィルタ(現在は存在しない)を作ったことを鑑みても、Googleはコンテンツの読解レベルを分析しているだろう。また、フィルタではGoogleの大嫌いなコンテンツ・ミルのような低品質なものは初級、学術文書は上級に振り分けられていた。しかし、今のところ読解レベルがランキングに関連付けられていることを示す証拠も研究結果もない。
ソース: Correlation Study (http://linchpinseo.com/seo-reading-level-college-websites?doing_wp_cron=1438687120.9494879245758056640625), 考察による
36.リッチメディア【70%】
画像検索や動画検索からより大きなトラフィックを生むようなリッチメディアは「質の高いオリジナルコンテンツ」とみなされるに足るものであるといえよう。動画はパンダ・アップデート2.5の決定要因として利用されたようでもある。ただ、今のところこの要素を確定させる確固たる証拠は発表されていない。
ソース: SEL on Panda 2.5 (http://searchengineland.com/google-panda-losers-today-show-winners-youtube-95257)
37.サブディレクトリ【70%】
カテゴリ別情報設計についてのSEO議論は、Googleがサイト全体のトピック分布を分析しているらしいという情報もあって、長いことなされてきた。これがランキングにもたらす影響がどれほどのものかははっきりとはわからない。ただGoogleはこの情報を構造化データの参考としているし、少なくともパンくずが検索結果ページに表示されるようになったので、より多くのページをランキングさせることはできる。
ソース: Google Developers (https://developers.google.com/structured-data/breadcrumbs)
38.メタ・キーワード【5%】
あるSEO専門家によればメタ・キーワードはもうSEOに何の意味も持たないらしい。これは迷信である。またGoogleが2015年現在メタ・キーワードをランキング要因に利用しているという意見を聞いたならそれもまた迷信に過ぎない。この2つの事実は同じ方法で証明することができる。競合の全くいない、つまり勝手にでっち上げたキーワードをメタ・キーワードにいれたページをインデックスさせ、そのキーワードで検索してみればいい。
覚えておいて欲しいのは、Googleだけがこの世の検索エンジンの全てではないということだ。そして、このタグによって恩恵を受けている動的サイトが星の数ほどいるということを。
ソース: Matt Cutts (https://www.youtube.com/watch?v=jK7IPbnmvVU), Experiment Page (https://northcutt.com/searchenginestunts.html)
39.モバイル・フレンドリー【100%】
モバイル・フレンドリーなサイトは著しい順位恩恵を受ける。今のところ、この要因で影響を受ける順位は、ユーザーがモバイル・デバイスを利用して検索をした場合の順位に限定されている。このことは、モバイルがSEOのなかでも主流になったことを意味し、2015年のモバイル・アップデートで決定的なものとなった。とはいえ、この流れになることを専門家たちは10年近く前から予見していたが。
ソース: Various Studies (http://searchengineland.com/mobilegeddon-beginning-not-ending-220512)
40.メタ・ディスクリプション【20%】
良いメタ・ディスクリプションというのは検索広告のような働きをする。AdWords上でのA/Bテスト をするためだけにこれだけ多くのAdWords代行会社が存在していることを見ても、この分野がどれほどマーケティング価値のあるものかということは明白である。ディスクリプション内のキーワードは順位に影響があると広く考えられていたこともあったが、2009年にマット・カッツがもう利用していないと明言した。
ソース: Matt Cutts (http://googlewebmastercentral.blogspot.com/2009/09/google-does-not-use-keywords-meta-tag.html)
41.Googleアナリティクス【5%】
多くの人がGoogleアナリティクスがすでに、もしくはそのうち順位決定要因になるのではということを示唆している。今現在のどんな証拠、マット・カッツが明確に発言したことも含め、Googleアナリティクスが順位に影響を与えている、もしくは与えるようになるという考えはまったくもって迷信に過ぎない。まさにGoogleの言うとおり、マーケターの強い味方になる究極のツールに過ぎない。
ソース: Matt Cutts (https://www.youtube.com/watch?v=CgBw9tbAQhU)
42.Googleウェブマスターツール(※訳注現Search Console)【5%】
Googleアナリティクス同様、Googleウェブマスターツールを利用することによる順位恩恵があることは確証されていない。そういうことではなく、Googleウェブマスターツールは他の順位要因を見つけ出すのには絶大な効果を発揮する。特に手動対応ペナルティとクロールエラーの原因解明などだ。
ソース: 考察による
43.ccTLDと国内検索【70%】
例えば.jpや.ukなどのCountry code TLDは、Webの国際化が進んだことも有り、そのドメイン対象国内での検索順位に良い影響をもたらすと信じられている。特に別の国のccTLDサイトと比べたとき顕著になると考えられている。
ソース: 考察による
44.XMLサイトマップ【5%】
強制ではないが、Googleにサイト上のより多くのページをインデックスさせるという目的があるならサイトマップは役に立つ。覚えておいて欲しいのはXMLサイトマップがランキングに良い影響を与えているというのは全くの迷信に過ぎないということだ。このことはGoogle自身や、その他多くの研究結果からも明らかである。
ソース: Susan Moskwa & Trevor Foucher (http://googlewebmastercentral.blogspot.com/2008/01/sitemaps-faqs.html)
45.Salience of Entities【70%】
時間とともにGoogleは単語やフレーズの解析そのものよりも、それらの持つ意味や理論的本質性というものの解析に重きを置くようになったようである。それはページ上に含まれているキーワードクエリというものを、一般ユーザーがどういうクエリに置き換えるのかを知るための研究である。わかりやすく例えると、どうしたら「肉料理の方法」という検索クエリで、どこにも「肉料理」というキーワードの出てこないステーキのレシピページを検索結果に返すことができるのかというようなことである。
ソース: Jesse Duniet, Dan Gillick (http://static.googleusercontent.com/media/research.google.com/en//pubs/archive/42235.pdf), Dan Gillick, Dave Orr (http://googleresearch.blogspot.com/2014/08/teaching-machines-to-read-between-lines.html), Patent US 20130132433 A1
46.フレーズと文脈【80%】
キーワード出現率が実質上意味を持たなくなってきたため、基本的なフレーズベースのインデックス理解は、ただたんにキーワードを全体に詰め込んだコンテンツよりも、全体的にかつ精巧に書き上げたコンテンツのほうが良い順位を与えられるものになっていると考えて間違いないだろう。Googleの特許の中でこの要素は「関連フレーズの同一性及び集団的関連フレーズ」と表現されている。
ソース: Patent US 7536408 B2
47.ユーザー付近のWebサーバ【80%】
Googleは多くのローカルクエリと伝統的なGoogleマップ検索、オーガニック検索では違う働きをする。同じことは国内検索と国際検索でも言える。サイトを、少なくとも検索ユーザーと同じ国内のサーバでホストすることは検索結果に影響を与えることがある。
ソース: Matt Cutts (https://www.youtube.com/watch?v=keIzr3eWK8I)
48.著者の評判【5%】
Googleによって2011年から2014年まで実験されていたオーサシップは、ブロガーが特定の著者の評判確立のために記事に「rel=”author”」を設置するようになったことにより目標達成した。オーサシップが終了したことはGoogleによって直接公表された。エリック・エンジはSearch Engine Land上でオーサシップの繁栄と没落についてとても良い追悼記事を公開している(http://searchengineland.com/goodbye-google-authorship-201975)。
ソース: John Mueller (https://plus.google.com/u/0/+JohnMueller/posts/HZf3KDP1Dm8)
49.rel=”canonical”タグの使用【20%】
rel=”canonical”タグは同一ページのURLを示唆するのに利用されている。これにより重複コンテンツによる評価減とペナルティを防ぐ事ができる。これはあくまでも提示であり、ときにはGoogleによって無視される場合がある。Googleによると、タグ利用による直接の順位貢献は一切ない。それらの事情を考慮しても、このタグを利用するのはとても良いことと言えるだろう。
ソース: Google (https://support.google.com/webmasters/answer/139066?hl=en)
50.rel=”author”タグの使用【5%】
rel=”author”タグの使用はかつてSEOアドバイスと順位要因仮説の大定番だったが、オーサシップの消滅とともに何の意味も持たなくなってしまった。rel=”author” にまつわるいかなる「おいしい話」も現在において全て迷信である。
ソース: John Mueller (https://plus.google.com/u/0/+JohnMueller/posts/HZf3KDP1Dm8)
51.rel=”publisher”タグの使用【5%】
rel=”author”同様、rel=”publisher”タグの使用もSEOの定番のアドバイスだった。 そしてやはり同様にオーサシップとともに消え去っていく運命にある。
ソース: John Mueller (https://plus.google.com/u/0/+JohnMueller/posts/HZf3KDP1Dm8)
52.“www” サブドメインの使用【5%】
SEOブロガーがよく言う勘違い甚だしい噂の1つが「www」から始まるURLの方が順位が良いというものだ。この噂の元となっているのはどのURLも「www」から始まるURLに統一しているサイトが多いからだろう。これをやっている理由は明白で、単純に同じコンテンツ・同じアドレスなのに「www」ありなしの2つの重複サイトができてしまわないようにし、マイナス要因になるのを防いでいるのである。
ソース: 考察による
53.専用IPアドレス【5%】
WebサーバのIPアドレスは地域ターゲットのマーケティングを行っている幾つかのケースにおいて役に立つ。もしも、スパムサイトだらけのIPに同居してしまったらマイナス要因になることもあるだろうし、またIPアドレスによってヒルトップ・アルゴリズムは2つの別々のサイトがはたして同一人物によって運営されているのか否かを特定したりしている。1つ言っておくなら、専用IPを使用することそのものがプラスのランキング要因として働くことはないということだ。
ソース: Matt Cutts (https://www.mattcutts.com/blog/myth-busting-virtual-hosts-vs-dedicated-ip-addresses/)
54.サブドメインの使用【50%】
サブドメイン(thing.yoursite.com)はしばしばGoogleによって、別サイトとしてみなされることがある。サブフォルダ(yoursite.com/thing/)との違いはココであると言えるだろう。2012年のマット・カッツいわく、サブフォルダもサブドメインも「だいたい同じ」で、そこまで違いが顕著に出ることはないが、ときどき出るらしい。2012年のパンダ・アップデートからのHubPagesの回復事例で、サブフォルダからサブディレクトリへの移管という方法が有ったのだが、そのことを鑑みるとまだまだ大きな要因であると思われる。
ソース: Matt Cutts (https://www.youtube.com/watch?v=_MswMYk05tk), Matt McGee and Paul Edmondson (http://searchengineland.com/google-panda-two-years-later-5-questions-with-hubpages-ceo-paul-edmondson-149767)
55.サブドメインの数【50%】
サイト上のサブドメインの数はサブドメインがそれぞれで全く別のサイトとして使用されている(無料のWebホスティングサービスやHubPagesのようなホスティングとSNSのハイブリッドサービスなどがよく使用している)のか、それとも単純に同一サイトの一部として使用されているのかを判断するための、最も顕著な要因といえる。例えば、何千ものサブドメインを有するサイトなら、それは同一テーマにそった1つのサイトとして存在しているわけではなく、それぞれのサブドメインごとに別の運営者がいると考えられる。
ソース: 考察による
56.AdSenseの使用【5%】
SEO偏執者がよく提案してくることがあるようだが、Googleによって完全に否定されている。AdSense利用による影響の証拠も、メディアマネタイズの方法による順位影響の証拠も見つかっていない。よってこれは迷信といえるだろう。
ソース: Matt Cutts (https://www.youtube.com/watch?v=V62Zrb5gFUU)
57.HTMLコメント内のキーワード【5%】
これは初期のSEO理論で、ほんのちょっとした実験で簡単に間違いを指摘することができる。適当にでっち上げた競合の存在しないキーワードをHTMLコメント内に埋め込んだページを用意し、それをインデックスさせる。そのキーワードで検索をかけて見れば検索結果に出てこないことがわかるだろう。
ソース: Experiment Page (https://northcutt.com/searchenginestunts.html)
58.CSS/JavaScriptコメント内のキーワード【5%】
これもひねくれた初期の SEO理論のひとつで簡単に暴けるものだ。上記のものと同様の実験をすればいい。
ソース: Experiment Page (https://northcutt.com/searchenginestunts.html)
59.CLASS、NAME、ID内のキーワード【5%】
これも上記と同様。
ソース: Experiment Page (https://northcutt.com/searchenginestunts.html)
60.プライバシーポリシー【50%】
とある体験が2012年にWebmaster World に投稿され、のちに大論争へと拡大していった、すなわち「プライバシーポリシーを載せていることはランキングにプラスになるのか?」議論である。Search Engine Roundtableの30%が「Yes」と回答し、Googleの方針には沿っているといえよう。依然として、仮説の域を出てはいないが。
ソース: SER Discussion (https://www.seroundtable.com/privacy-policy-google-seo-14899.html)
61.立証された住所【20%】
住所は通常のランキングにおいて、正当性を示しているのではないかと考えられている。もしかしたらGoogleは名前や住所、電話番号などを統括的に参照してローカルSEO(Googleマップでの検索)には組み込んでいるのかもしれない。また、「信頼できる連絡先情報の記載」はGoogleの品質調査員たちが確認するように指示されている項目である。
ソース: Search Engine Land (http://searchengineland.com/googles-quality-rating-guide-leaked-version-?ve-196619)
62.立証された電話番号【50%】
同上。
ソース: Search Engine Land (http://searchengineland.com/googles-quality-rating-guide-leaked-version-?ve-196619)
63.アクセス可能なコンタクトページ【50%】
正当性を示すものとして使われている可能性があるとする説もある。この項目は「Google品質評価ガイドライン」という文書の中で「ベストなサポート」という評価の項目で示されている。この文書内でGoogleは、評価者たちに「信頼できる連絡先情報」を探すことを求めている。
ソース: Search Engine Land (http://searchengineland.com/googles-quality-rating-guide-leaked-version-?ve-196619)
64.コンテンツに対するコード割合【50%】
「もっとコンテンツを、そしてなるべく少ないコードで」と提唱されたこのSEO理論は、2011年あたりから広まり始めた。知っている限りの情報で言えば、
1)ページ読み込み速度は要因として確証されている
2)Googleのもっているページ読み込み速度測定ツールは高性能で、データ伝達量がたった5kb減っただけでも感知できる
3)ほんのちょっとしたコードミスが評価減やペナルティの原因になることもある
以上のことより、すくなくともこの要素は間接的に相関関係をもつ可能性はある。
ソース: SitePoint Post (http://www.sitepoint.com/text-to-code-ratio/), SEOChatTool (http://tools.seochat.com/tools/code-to-text-ratio/)
65.メタ・ソースタグ【20%】
メタ・ソースタグは2010年にGoogleニュースで、ソース元をより正確にしめすために作られた。これらは「同時配信ソース(第三者と同時配信している場合)」と「オリジナルソース(あなたの記事がオリジナルの場合)」の2つの形態に分けられる。もし複数サイトで同一コンテンツを同時配信している場合、理論的に重複コンテンツペナルティを防ぐことができる。もしあなたのサイトの記事がオリジナルの場合は、このタグはrel=”canonical”タグによって上書きされる。
ソース: Eric Weigle (http://googlenewsblog.blogspot.com/2010/11/credit-where-credit-is-due.html)
66.もっとページにコンテンツを【50%】
SerpIQはコンテンツの長さがランキグに与える影響を調べるための面白い調査を行った。その結果、 2000-2500単語くらいのコンテンツが一番良いという結果に至った。ただ、その他の要因がどれほど影響しているのかの明白な調査がない。例えば、SNSでシェアされやすかったため結果としてリンクが沢山ついたとか、順位が良いことでさらに露出が増えて成長し続けているとか、クエリによって変化しているとかである。
ソース: SerpIQ (http://blog.serpiq.com/how-important-is-content-length-why-data-driven-seo-trumps-guru-opinions/)
67.メタ・ジオタグ【20%】
IPアドレスやccTLDと違い、マット・カッツによると「もしそうだとしても、まぁほとんど見ることはない」タグである。とはいえ、彼はこのタグをgTLD(.comのようなドメイン)のサイトを利用している場合、地域特定を行うために使用することを考えるよう提案している。つまり、ほぼほぼ役にたたないタグだとは認められているものの、国際化対応においては、ごくごく稀なケースでGoogleによって使われる場合があるということだ。
ソース: Matt Cutts (https://www.youtube.com/watch?v=JD0y0Jk-zzQ)
68.表示タイトル前部のキーワード【70%】
10年以上、キーワードから始まるタイトルのほうが、キーワードで終わるタイトルより順位が良くなるのかどうかの研究がなされてきた。簡単に調査することができ、殆どの場合において「キーワードから始まるほうが良い」という結果になる。もっと詳しい情報を載せているソースもある。Thumback.comの調査では、タイトルのキーワード順番の並び替えで20~30%程のトラフィック変化が起こった。また、彼らの調査の中で、一番トラフィックの良かったページのタイトルはキーワードから始まるものではなかったが、Googleによって検索結果ページではタイトルが書き換えられており(https://www.youtube.com/watch?v=L3HX_8BAhB4)、キーワードから始まるものになっていたようだ。
ソース: Thumbtack Study (https://www.thumbtack.com/engineering/seo-tip-titles-matter-probably-more-than-you-think/)
69.Hタグ前部のキーワード【50%】
Hタグは、キーワードの順番が影響しやすい要素の1つである。再びになるが「最初の1/3ルール」はこのたぐいの説明をするのに使いまわされているが、やはり最初の方のキーワードは比重が大きいのである。少なくとも試してみるくらいの価値はあるだろう。
ソース: 考察による
70.他サイトより独創的なコンテンツ【80%】
Googleの特許とこの要素に関するSEOの研究によれば、Googleは似たようなコンテンツに低い評価をつけるようである。この特許は、一度関連性のあるコンテンツのグループと決定されたら、一体どのコンテンツが記述的でユニークでそして(いい意味で)奇抜なのかを様々な方法で検証するよう設計されている。
ソース: Patent US 8140449 B1, SEO by the Sea (http://www.seobythesea.com/2008/11/google-using-novel-content-as-a-ranking-signal/)
71.自サイト内でより独創的なコンテンツ【80%】
Googleの特許によると、本物のユニークさ・奇抜さと言うのはコンテンツの精巧さと同じくらい評価されるべきで、それにより「ユニークスコア」というものをつけている。これはテキストの情報ブロックの定量と定性調査で決定される。知られている限りでは、Googleがユニークスコアをつける際に取る方法はたくさんの文書を比較するということだけである。重複コンテンツはサイト内・外両方の観点から決定されるが、おそらく「ユニークスコア」でも同じことが言えそうである。
ソース: Patent US 8140449 B1
72.サイト全体でのユニークスコア【70%】
クマールとバーラトの特許「ユニークコンテンツの見極め」には、どうやってそれぞれの文書の「奇抜さ」をスコアリングするのかが書いてある。サイト全体での平均ユニークスコアを要素に含むところは、サイト全体のコンテンツの薄さをみるパンダ・アップデートやサイト全体の専門性を見るヒルトップ・アルゴリズムに似ているといえよう。
ソース: Patents US 8140449 B1, US 8825645 B1, Speculation
73.コメントの数【20%】
数えきれないほどのソースやGoogleウェブマスターツール上でのある種の警告を見ても、Googleはユーザージェネレイトコンテンツを分けて分析できるようだ。コメントの量がコンテンツの質を決定する要因になっているかもしれないというSEO理論が存在したが、それを証明する決定的な証拠もない上、「たとえ私がGoogleでも」それを採用することはないだろう。どう考えても、簡単にスパム行為ができてしまうからである。
ソース: 考察による
74.ポジティブな感想のコメント【5%】
Googleはコメント内の意見をみてコンテンツの質を決定しているという仮説がある。そしてGoogleは製品レビューに向けられた感情表現を分析できることを認めているし、その特許も取得している。しかし、アミット・シンハルによれば、「もしネガティブなコメントが寄せられたページの順位を下げてしまったら、公平な情報判断ができなくなってしまうだろ?」という理由で、コンテンツの質の決定には利用していないとのことだ。
ソース: Amit Singhal (http://googleblog.blogspot.com/2010/12/being-bad-to-your-customers-is-bad-for.html), Patent US 7987188 B2
次回はマイナスに働く内部SEO要因をご紹介します。