【基礎・図解付き】Googleアナリティクスのページ抽出テクニック!ドリルダウンから正規表現まで。
たくさんのページがあると、ホームページの管理は本当に大変なものです。まして、分析ともなると、どこから手を付けていいのか途方にくれてしまうことも多々あります。
今回は、そんな忙しいWeb担当者の方に、Googleアナリティクスがちょっと便利につかえる抽出ワザを解説します。
ページの抽出など多くの場面で使いますので、ぜひマスターしてください!
1.ページの抽出【基礎編1】フィルタ
フィルタは、Googleアナリティクスを分析に使ううえでもっともベーシックな操作方法の一つです。
Googleアナリティクスは、アクセスされたページ情報を膨大にためているデータベースともいえます。そこから抽出(絞り込む)するテクニックはとても重要なのです。
フィルタは気軽に抽出できる
Googleアナリティクスを一度でも使ったことがあれば、フィルタはじつはすでに見たことがあります。レポート画面の表の上にあります検索窓がフィルタです。
フィルタは、表示されている表のデータから必要なものを抽出する操作です。
たとえば、「URLに/product/を含むもの」「コンバージョンの手前のページ(※実際にはURLですが)」「URLが数字だけのもの(後述)」など、多彩に抽出できます。
実際の抽出方法
まずはGoogleアナリティクスで以下の操作をしましょう。すると、アクセスされたページ群が表示されます。
行動>サイトコンテンツ>すべてのページ
次にフィルタに、抽出したいURLに含まれているキーワードを入力します。入力後、[ENTER]キーを押すと、該当するURLが抽出されます。
ただ、Googleなどの検索エンジンのように空白を含めて複数キーワードで抽出できません。その際には、後述のアドバンスを使います。
成果に貢献したページを抽出してみよう
実際にページを抽出し分析をしてみましょう。どのページがコンバージョン(成果)に貢献しているのかを調べます。
Googleアナリティクスでは、ページにおけるコンバージョンへの寄与度を「ページの価値」という指標で表しているので、それに着目します。
newsを含むURLとcurriculumsを含むURLとで抽出をします。すると表の上部に小計が表示され、それぞれ違う小計値になることがわかります。
上図のように、URLごとのコンバージョン貢献度であるページの価値に、大きな差があることがわかりました。つまり、curriculumsを含むページのほうが、より貢献しているといえます。curriculumsページをいっそう拡充するのか、newsページをテコ入れするのかは、運営次第ではあります。このようにしてフィルタをつかい、改善のきっかけをつかみます。
2.ページの抽出【基礎編2】アドバンスフィルタ
アドバンスフィルタは、検索窓のすぐ右にある「アドバンス」をクリックして使います。「AとBの両方を含むURL」「AとBを含み、かつCを含まないもの」といった複雑な抽出ができます。
アドバンスフィルタの使い方
「アドバンス」をクリックすると、以下のような入力エリアが表示されます。
「ディメンションと指標を追加」をクリックすると、条件を追加できます。また、条件は一致するものと除外するものとが選べます。
たとえば上図では、URLにnewsを含み、かつ直帰率が95%をこえるものを抽出しています。そして結果として、閲覧開始が42件や38件もありながら、ほとんどがそのページだけ見て離脱してしまったページが見つかりました。
もし、それらのページが1ページだけ見て帰らるようなものでなく、何ページも見てほしいような目次ページだったり、商品一覧ページだったりしたら、改善の余地があります。
3.ページの抽出【応用編】正規表現
正規表現というのは、あまり聞き慣れない言葉かもしれません。しかし、私たちはその恩恵をすでに受けています。
正規表現は高度なマッチング技術
たとえば、何かの入力フォームで数字しか入れてはいけないところを漢字を入力しエラーになる、ハイフン抜きの郵便番号を入力するフォームでそれ以外を入れてしまいはじかれる、などです。
これは、正規表現といって、より高度な抽出技術を使い、難しい条件での検出を可能にするものなのです。正規表現はすでに私たちの生活になくてはならないものとなっています。
高度な検出(マッチング)をし抽出する、それが正規表現です。
フィルタで正規表現を使ってみよう
正規表現はそれだけで本が一冊書けるほどの奥深い技術で、かつ伝統的なものです。インターネットが普及する前から、コンピュータの世界では培われてきました。
ですので、本記事では弊社ベーシックで、かつ利用シーンの多い3つをご紹介しましょう。
パイプ | ・・・もしくは(OR表現)
前述のアドバンスフィルタには、さりげなく「AND」と書かれていましたが、あれは「AかつB」という条件指定を示すものです。それに対し、「AもしくはB」という条件指定がORです。
ただ、それはアドバンスフィルタにはないため、正規表現で補います。表現としてはパイプ(|)で2つのキーワードを区切ります。
<ORの例>
news|topic ・・・・ newsかtopicを含むURLが抽出。
tokyo|osaka|aichi|fukuoka ・・・・ 東京か大阪か愛知か福岡を含むURLが抽出。
このようにパイプは、複数記述することも可能です。
ダラー $ ・・・文末限定
たとえば、topicという文字を抽出したいとき、/topic/2014 も、/2014/topic というページも抽出されてしまいます。どちらもマッチしていることには変わりません。
それを解決するのがダラー($)です。もしくはドルとも読みます。
<$の例>
/topic$ ・・・ /2014/topic が抽出。
14$ ・・・ /2014/topic は抽出されず、/topic/2014 が抽出される。
ハット ^ ・・・文頭限定
ダラーに対し文頭に限定して抽出しますのがハット(^)です。
<^の例>
^/topic ・・・ /topic/2014、/topic/2013、/topicnews/tokyo などが抽出。
14$ ・・・ /2014/topic は抽出されず、/topic/2014 が抽出される。
正規表現は奥が深い
いかがだったでしょうか。このように、たった1文字で複雑な抽出条件の指定ができる正規表現ですが、実はシステムによって差異があります。たとえば、Googleアナリティクスでは、正規表現では一般的記号とされる?が使えません。
また、正規表現はフィルタだけでなく、セグメントなど他の機能でもつかえる応用範囲の広い技術です。難解な表現ではありますが、修得するだけの価値のあるものといえます。
学習には、以下の書籍や公式ヘルプなどが役立ちます。また、古くからある技術のため、多くの情報がネットで収集可能です。ぜひ検索してみてください。
参考リンク:正規表現の概要 - アナリティクス ヘルプ
参考リンク:Amazon.co.jp: 正規表現ポケットリファレンス: 宮前 竜也: 本
4.普段のクリックも抽出です
訪問のキーワードでもランディングページでも閲覧ページでも、Googleアナリティクスでは、表内のどれかをクリックすると、さらに詳細がわかります。
そのような深く調べることをドリルダウン(深堀り)といいます。
ドリルダウンはその項目の更に詳しく掘り下げるという点では、条件をより絞り込んでいるともいえ、それは抽出といえます。
上図のように、クリックするごとに詳細(内訳)がわかり、その内訳は好みの項目でも調べられるのです。
例では、あるページについてドリルダウンし、その訪問のきっかけとなったキーワードを調べています。そのページは、どうやらTwitterの予約投稿に関する記事のようですが、もし内容に相違があれば修正するなど、チューニングしましょう。
5.まとめ
Googleアナリティクスは究極的にはデータベースです。私たちのホームページのアクセス状況を、常にデータとしてためています。
それをいかに抽出するかは、アクセス分析の本質的スキルとも言えます。ぜひともマスターしましょう。
・フィルタは特定文字列を含むURLを抽出できる。
・検索エンジンのように「空白」で「AND(AかつB)」抽出はできない。
・アドバンスフィルタを使えば、AND抽出ができる。
・正規表現は記号をつかって複雑な抽出ができる。
・ドリルダウンはもっとも身近な抽出方法。
データの抽出方法を学ぶことは、じつはGoogleアナリティクス活用のスキルアップの近道*です。
このニュースを読んだあなたにおすすめ
・アクセス解析のカリキュラム一覧
・アクセス解析における重要な用語
・Googleアナリティクスでソーシャルメディアの効果を調べる方法