NAVERまとめや知恵袋など邪魔なサイトを除外して検索できないかなぁと思っていたところGoogleカスタム検索という機能を使えば作れそうだということがわかってやってみたら、
めちゃくちゃノイズが少なくて快適な検索エンジンが作れてしまいました。
とくに商品名や型番でレビューを探すのに向いてます。
もくじ
邪魔なサイトを除外したGoogle検索
使用するにはこちらのページからどうぞ。(別タブで開きます)地道に除外設定を増やしてノイズを減らしていきました。
使い方は普通にGoogle検索するだけです。
とりあえず検索窓に何か入れて検索してみてください。NAVERまとめとか知恵袋とか根こそぎ除外された検索結果が出てきます。
具体的にどんな検索に向いているかと言うと、
商品レビューを見たくて商品名や型番で検索した時にAmazon・価格コムなどの通販サイトが表示されないので探しやすくなります。
調べ物・疑問を解決したい時にNAVERまとめ・知恵袋が表示されないので探しやすくなります。
検索から除外したサイト
主に以下のサイトを検索にヒットしないように除外しました。
- Amazon・楽天・価格コム
- その他通販サイト多数
- NAVERまとめ・キュレーションサイト
- 知恵袋などのQ&Aサイト
- 2ch転載
- 懸賞サイト
- 動画サイト
- SNS(Twitter・Instagramなど)
- 一部の辞書サイト
- アプリストア
これらのサイトはほとんど検索上位に出てこないはずです。
普通のGoogle検索とノイズレスサーチの比較
いわゆる「ググる」のと「ノイズレスサーチ」を比べてみると、知恵袋・NAVER・Amazonなどのドメインパワーが超強いサイトが無くなるので、今まで2ページ目以降にあったレビューサイトなどが1ページ目に表示されやすくなります。
実際に商品のビッグキーワードで検索した時に順位がどうなるのか見ていきましょう。
普通のGoogle検索の検索結果
↓こちらは普通にGoogleで「Panasonic GH4」を検索した結果です。
赤字の価格コム・Amazon・画像検索が邪魔でレビュー記事が下に追いやられてしまってますね。
ノイズレスサーチの検索結果
↓そしてこちらがノイズレスサーチで「Panasonic GH4」を検索した結果。
公式サイトとレビュー記事だけになってノイズが無くなりました。
あとサイト内のアイキャッチ画像が表示されるので記事の中身が非常にわかりやすくなります。
ここから先はかなり細かいことを書いてあるのでノイズレスサーチを使うだけなら見る必要はありません。
ノイズレスサーチはこちらからどうぞ。
検索対象から除外したサイトの詳細
除外したサイトの基準だとかをつらつらと書いてます。除外する判断基準まで見たい人はどうぞ。
Amazon・楽天・価格コムなどの通販サイトを除外
商品の実際に使ったレビューを見たいのにAmazon・価格コムが毎回毎回上位に表示されて邪魔になることって多いですよね。
わかったから!買う時になったら開くから今黙ってて!と叫びたくなるほど邪魔です。なのでECサイトは片っ端から除外しました。
楽天・Yahoo!ショッピングなどのモールサイトはもちろん自社ショップを運営している通販サイトも価格コムで目立つものをピックアップして除外しています。
検索する商品のジャンルによっては専門店型の自社ショップが出てくることがあるでしょうが大型モールショッピングサイトが無くなるだけでもかなりノイズが減ります。
これでもう「Fire TV Stick」とかの商品名だろうが「ニコン D5500」などの型番だろうがかなりの精度でレビュー情報を検索できるようになりました。
しかもブログ以外にメーカー公式サイトやGIGAZINEなどの総合情報サイトのレビューもヒットするのでGoogleブログ検索より充実した情報収集ができるようになりました。
NAVERまとめ・キュレーションサイトを除外
これも検索ノイズの代表格でとにかく「naverまとめ」が検索上位になりやすいにも関わらず中身は他サイトの画像を無断転載してほぼ引用で構成されている記事が多いので丸ごと除外しました。
他にも画像を引用してリンク貼るだけのまとめサイト・キュレーションサイトが乱立しているので上位に見かけたものをある程度除外しました。
ただしキュレーションサイトはジャンルも広く新しいサイトが雨後の筍のように登場するので今後ノイズが増える可能性はあるかもしれません。
知恵袋などのQ&Aサイトを除外
これもnaverまとめと同じくらい上位表示されてますが知恵袋はとくに情報操作・誘導目的・コピペ回答があって回答者も一般人なので情報の信頼性が低いのであまり参考にしないサイトの代表です。
他にもOKWebと派生サイトがあるので一通り除外しました。
2ch・2ch転載サイトを除外
2ch本体は除外するかどうか迷いましたが見たければ別途検索で良いんじゃないかと思うので除外しました。
「○○速」系の2ch転載は情報が重複してるものがドメインパワーによって表に出てきてるだけだしノイズになりやすいので目立つものは除外しました。
ただし2ch転載サイトはあまりにも数が多すぎて新しいサイトも出てくるのでノイズが増える可能性が高そうです。
懸賞サイトを除外
懸賞の商品が検索に引っかかることがあるので除外しました。もともとレビューサイトよりは上位に出てこないからそんなには影響しないと思いますが。
動画サイトを除外
動画を探すならYouTubeやニコニコ動画本体で検索したほうが精度が高くなるので除外しました。YouTubeのサードパーティ製サイトもある程度ブロックしています。
SNSサイトを除外
Twitter・Instagram・Tumblr・Vine・facebook・LinkedInなどのSNSサイトを除外しました。
メーカーの公式アカウントはわかりきった情報なので意外とノイズになることが多いです。
あとTwilog・Togetterなどのツイートまとめ系も除外しています。
一部の辞書サイトを除外
無料で公開されている辞書の内容を利用しているだけのサイトは除外しました。
基本的な単語の意味を調べたかったら普通にGoogleで「○○とは」検索すればすぐにわかりますし。
アプリや拡張機能のダウンロードサイトを除外
iTunesストア・GooglePlayストア・Chromeウェブストア(拡張機能)・Firefoxアドオン・Operaアドオンなどアプリストアを除外しました。
これらのサイトは最終的にアクションを起こす(ダウンロードする)時に訪問するので情報収集の段階ではノイズになりやすいですね。
英語サイトを除外
検索対象を日本語で書かれたサイトのみにしました。これによって例えば「withings ws-50」などの英語の商品名で検索した時に日本語のレビュー記事だけを見れるのでわかりやすくなります。
防ぎきれないアフィリエイトサイト
ちなみに「○○ おすすめ」とかで検索上位に出てきやすい典型的なアフィリエイトサイトはジャンルが多岐に渡っておりノイズになるサイトとならないサイトがあるためスルーしています。
「通販激安おすすめ」とかこってこてのサイトタイトルでも情報がまとまって参考になるサイトもあります。
それに相対的には情報がまとまっていないアフィリエイトサイトは上位に出てこないのでスルーしてもそんなに問題にならないかなと思ってます。
そもそも個人が日記的に書いた記事よりも最初から収益目的で動線がちゃんと作られて問題が解決するようにサイトが作られているなら検索した人にとっても有益である場合が多いですしね。
「-site:」検索演算子には限界がある
ちなみに「-site:example.com」のようにGoogleの検索演算子とマイナス検索を組み合わせれば任意のサイトを除外して検索することはできますがGoogleでは指定できる検索キーワードが32個までという制限があるので検索するためのキーワードで2個使ったとしたらマイナス検索は残り30個しかできないということになります。
それに検索窓の中に入力するのが大変なのでちょっと現実的な方法じゃありませんね。
昔はGoogleにサイトブロック機能があった
あまり知られていませんが2013年始め頃までGoogleには標準でサイトをブロックする機能があったそうです(自分はまったく知らなかった)
Google Chromeの拡張機能「Personal Blocklist」を2011年2月に公開。2011年3月には検索結果ページにもこの機能を導入していた。Googleに確認したところ、サイトブロック機能は今年(2013年)の1月には停止となっており、理由については利用者が少なかったためと説明。
検索結果に出てきたページをクリックし、その検索結果に再び戻ると「xxx.comの結果をすべてブロック」というリンクが出現します。
検索結果に再び戻らないとブロックするためのボタンが出てこないとのことなのであまり見かける機会は多くなかったんでしょうね。
また、2ch転載が多いライブドアブログとかはURLがサブドメインの形になっているので、
blog.livedoor.jp/サイトのアカウント
という形で前半のドメインの形が同じでGoogleのブロック機能を使うとライブドアブログが丸ごとブロックされてしまうという問題もありました。
一応今でもブロック機能の名残としてPersonal Blocklist (by Google)というGoogle純正のChrome拡張機能がありますが、実際にライブドアブログで試してみたら「blog.livedoor.jp」がブロックされてライブドアブログ全部まるごとブロックされてしまいました。
しかもURLを後から編集しようとしてもサブドメインのblogの部分しか変更できずjpの後ろは編集不可能なのでChrome拡張機能だときめ細やかなブロックはできないみたいです。
その点ではGoogleカスタム検索の除外設定のほうがサブドメインでも部分一致やワイルドカードが使えるので幅広く対応できます。
除外したサイトは数千個
大まかなノイズを除外するだけなら100個くらいでかなり効果があると思いますがそこからさらに様々なジャンルのECサイトや2ch転載サイトを除外したため数千個まで膨れ上がりました。
追記:どんどん追加していたら途中で除外設定ができなくなりました。どうやらGoogleアカウント1個につき5000URLまでしか登録できないようで上限まで達してしまったようです。そのため優先度が低いサイトを1000個ほど除外解除して除外設定は4000個弱まで減らしました。
公式ヘルプ:カスタム検索エンジンに追加できるページ数
上限があると知っていたらもっとノイズになりやすいものを優先して除外していたんですが2ch転載や買取サイトでかなり無駄な除外設定をしてしまったのが悔やまれます。
著者のフォローはこちら
<人気記事>
⇒デュアルディスプレイの接続方法とおすすめケーブルの選び方


いやー大手のレビューが見えなくなり、感謝
検索ワード次第では公式サイトが早々とヒットします。
PCパーツや家電のレビューサイトなんか掘るのが楽しみです。