読者です 読者をやめる 読者になる 読者になる

GoogleAnalyticsの新機能「加重並びかえ」の仕様と活用方法

ツール

数週間前から、GoogleAnalyticsのレポートで「加重並び替え」というオプションが選べるようになりました。

例えば、「キーワード」のレポートで「新規セッションの割合」でソートすると、その上部に「加重並び替え」というレポートが出てきます。


この「加重並び替え」という機能、実は今まで多くのアクセス解析ツールが抱えていた課題を取り除いてくれます。その内容を早速見てみましょう。

加重並び替えとは

例えばキーワードのレポートで直帰率が低いワードと高いワードを見つけて、サイト改善やリスティングなどに活かしたいと思ったことはありませんか?私は何度かあります。そこで、まずはキーワードレポートで「直帰率」の降順と昇順に並び替えてみましょう。どのような結果出るか?それは下記の通りです。


直帰率が高いワード

直帰率が低いワード


うーん。。。見ての通り、セッション数が0〜2件とほとんど改善幅がないものばかり出てきます*1


そこで、「加重並び替え」のチェックボックスにチェックを入れてみると、あら不思議!


直帰率が高いワード

直帰率が低いワード


直帰率が高いワードに関しては、直帰率が高いものが並んでいますが100%ではありません。そして、セッション数もさっきと変わって2桁後半〜4桁まで並んでいます。アクセス数がそれなりにあり、直帰率が高いワードが抽出出来ました。これは分析に使えそうですね!


というわけで、「加重並び替え」は単純に一つの指標(例:直帰率)で順番を並び替えず、もう一つの指標(例:訪問回数)も加味して、並び替えを行います。

加重並び替えのロジック

数学的な話が続くので、興味がない人は飛ばしてください。

1行でまとめると「キーワードの現在の数値」と「サイトの平均数値」を一定の比率で混ぜ合わせて計算した数値が加重並び替えで表示される数値」です。


GoogleAnalyticsのEvangelistのアヴィナッシュ氏のブログ記事(英語)にロジックの記載がありましたので、その内容を自分流に説明させていただきます。

※以下の説明はすべて「キーワード」ごとの「セッション数」と「直帰率」で加重並び替えをした例で進めます。


まず一つの前提を紹介します。

対象の数(例:セッション数)が少ないものは、精度が低くなります

これは大数の法則(Wikipedia)からも明らかです。サイコロを転がした時の出目の平均は3.5ですが、最初の数回転がしただけでは、この数値からかけ離れた数値になる事があります(例:1・1・4という出目だった場合は「2」です)。


例)サイコロの出目の平均値(「ウェブ分析論」より)


数が増えれば増えるほど、なるべき数値に近くなります。これをアクセス解析でも活かしたのが、加重並び替えです。


「加重並び替え」では、キーワードの訪問回数が多ければ多いほど、その「キーワードの直帰率」を正とし、訪問回数が少なければ少ないほど「全てのキーワードの直帰率」を正とします。


以下の図をご覧ください。

これは横軸に訪問回数を書いた図です。0〜100は実際の値ではなく、相対的な数値だと思ってください。キーワードAとキーワードBのそれぞれの相対的な訪問回数は「5」と「85」だとしましょう。そして、それぞれの直帰率の記載があります。


これらの情報を元にGoogleAnalyticsは「想定値」を計算します。そして、その想定値の昇順あるいは降順にキーワードを並べます。なお、この「想定値」は画面上には出てきません。計算方法ですが、基本的な考え方は以下の通りです。



キーワードAの計算方法を詳しく見てみましょう。

0.05*30% というのは、訪問回数5をパーセンテージで表した数値(= 5/100 = 5%)と、キーワードAの直帰率をかけています。つまり、30%という平均直帰率の5%の加重をかけたという事です。


0.95*50% というのは、訪問回数95をパーセンテージで表した数値(= 95/100 = 95%)と、全てのキーワードの直帰率をかけています。つまり、50%という平均直帰率の95%の加重をかけたという事です。


つまり、訪問回数が少ないキーワードAは、キーワードAの直帰率より、キーワード全体の直帰率の方が加重が大きい事になります。


そのため、キーワードAの直帰率は30%ですが、「想定値」はキーワード全体の直帰率である50%に近い、49%という数値になります。

キーワードBの数値も同じように考えてみてください。


加重をかけた値を出しているところから「加重並び替え」という名称がついているものと思われます。このように二つの値の加重を使うことによって、「より意味がある」データを出すことが出来ます。最初の0〜2件のセッション数しか出てこないレポートよりよっぽど使いやすいかと思います。


加重並び替えの使い方

直前に書いたとおり「より意味があるデータ」つまり、課題となりそうな情報、あるいは、参考になりそうな情報がより入手しやすくなりました。そこで、どの二つのデータを「加重並び替え」すれば良いかを紹介します。

キーワード × 直帰率

一つ目は今回の例題で使っていた「キーワード × 直帰率」です。特に「加重並び替え」で直帰率を降順に並び替えた物は、対策を考えたい優先度が高いキーワードになります。更にそのキーワードでのランディングページや新規率などを見てみましょう。また、直帰だけではなく「キーワード × コンバージョン率」も当然、役に立ちます。

参照元サイト × 新規率

新規やリピーターを連れてきている参照元がわかります。昇順・降順どちらでも、参考になる情報が入手できます。

キャンペーン × 直帰率

特に数多くのキャンペーンを行っている場合に有効です。特に有料で効果が悪いものに関しては、真っ先に見直すことを考えましょう。

ページ × $インデックス

$インデックスは一つ前の記事で説明しているので、そちらをご覧ください。この二つを掛け合わせる事によって、成果に貢献したページがわかります。


今までの並び替えですと、あるページに1アクセスだけあり、そこから成果にたどり着いた場合は1位に出てきてしまい、ある意味アクセス数が少ないほうが有利でした。しかし、今回の「加重並び替え」からもわかるように、実際にこのページがすごい成果に貢献するページかというと、そうではありません。


そこで加重平均を使えば、ある程度閲覧数があって、なおかつ貢献が高いページが一目でわかります。自分のブログでも試してみました。


まとめ

というわけでGoogleAnalyticsの新機能「加重並び替え」を紹介してきました。非常に便利な機能で、今までExcel等で行ってきた作業がなくなりました。ただ、すべての指標同士で「加重並び替え」ができるわけではありません。例えば「ページ × 直帰率」や、サイト内検索のレポートで加重並び替えができません。


また、アドバンスドセグメントを使えば、加重平均を使わなくても、特定のアクセス数以下のキーワードを除くといった細かい設定が可能です。


しかし、課題となるあるいは、参考となる情報を見つける「最初のSTEP」としては、今までより手間が軽減されることは間違いありません。サイトを分析していることに時間を使うより、それを活用する事を時間を使いたいので、これは嬉しい実装ではないでしょうか。


*1:数字が0件のワードが発生する理由は、http://a2i.jp/faq/topic/100 をご覧ください。GAの仕様です