GoogleAnalyticsのセッション定義変更とその影響

※2011年8月20日に流入元部分をアップデート

GoogleAnalyticsの公式ブログで、8月11日よりセッションの定義が変わったとのアナウンスがありました。

Update to Sessions in Google Analytics

米国のブログでの告知になりますが、日本版でも既に反映されているようです。

追記(2011/08/15)
日本語のブログでも記事が上がりました。日本では反映が8月12日のようです。
詳しくは以下リンクをご確認下さい。

Google アナリティクスのセッションの定義変更について


今回の変更がどのような物だったかを理解するため、現在と新しい仕様を説明いたします。そしてその結果が今までのレポートにどのような影響を与えるかを確認してみましょう。「どういう影響があるの?」という事を簡単に知りたい場合は、スクロールしていただいて「数値への影響」の見出しから読んでいただければと思います。



先に結論を書いておくと、以下のとおりになります。


「数値に影響を与える変更は2つ。多くのサイトでは数値への影響は軽微あるいは、気づかない程度と思われる。」



今までの定義

1)ページ間の遷移が30分以内
2)日の終わり
3)ブラウザを閉じたとき

新しい定義

1)ページ間の遷移が30分以内
2)日の終わり
3)トラフィックソースの値が変わったとき
具体的には、utm_source, utm_medium, utm_term, utm_content, utm_id, utm_campaign,gclid, 流入元検索エンジン, 検索キーワードのいずれかが変わった時



今までの定義も確認しておきましょう。

1)ページ間の遷移が30分以内

こちらはGoogleAnalyticsの計測データが30分以内にGoogleのサーバーに飛び続ける限りセッションは繋がることを意味します。以下の図をご覧ください。

ページ間の遷移が30分以内の場合は同じセッションですが、30分を超えると新しいセッションが始まります*1


この定義だけを見ると、セッションの途中で外部に出て30分以内に戻ってきた場合、同じセッションとしてカウントされます。以下の図をご覧ください。


2)日の終わり

30分以内に遷移をし続ければセッションが永遠に繋がるかというと、それではいつまでも集計が完了しないため、上限が設けられています。それが、「日の終わり」という2つ目のルールになります。こちらも新しいセッションの定義で変わっていません。つまり23時58分にサイトにアクセスして、次のページが翌日の0時5分にアクセスした場合、この2つのアクセスは別のセッションとなります。



旧3)ブラウザを閉じた時

これは、名前の通りブラウザを終了した場合は、その後に再度ブラウザを起動して、30分以内にアクセスしても新しいセッションになる事を意味しています。新しいルールではこの仕様が無くなりました。つまり、今後はブラウザを閉じることはセッション生成のルールに影響を与えないことを意味します。


※参考:Google AnalyticsCookieを使ってセッションを管理しています。そのためブラウザが変わればこのCookieが変わるため、Chromeであるページにアクセスして、その後に30分以内にFirefoxで同じサイト内の別のページをアクセスしたとしても、セッションは別々になります。これに関しては新しいルールでも変わりません。


新3)トラフィックソースの値が変わったとき

ここが今回の大きな変更点です。ちょっと理解が難しいですね。「トラフィックソースの値」とはそもそも何を指しているのか。以下の変数が該当する事が公式ブログでは記載されています。

変数名 意味 変数例
utm_source キャンペーンのソース utm_source=google
utm_medium キャンペーンのメディア utm_medium=cpc
utm_term キャンペーンのキーワード utm_term=アクセス解析
utm_content キャンペーンのコンテンツ utm_content=テキストリンク2
utm_campaign キャンペーンのキャンペーン名 utm_campaign=winter01
gclid GoogleAdwordsで利用されている、広告パラメータ gclid=00001
utm_id Urchinで利用されている広告パラメータ utm_id=A0001
検索エンジン 流入元の検索エンジン Yahoo!Googleなど
検索キーワード 流入元の検索キーワード Twitter」「アクセス解析」など

上の5つの変数はURL生成ツールなどで利用されている5つの変数になります。広告やメールマガジンからのリンクなど、自分がリンクURLを指定出来る時に利用して、広告効果の計測などに良く使われています。これらの値が変わった場合は新しいセッションになります。

gclidとutm_idはそれぞれUrchin*2Adwordsで利用している広告パラメータでも値が変わるたびに別のセッションとなります。


最後の2つはリファラーを取得しているutmrという変数を元に判断しています。



以下の画像をご覧ください。


メールマガジンにある2つのリンクにそれぞれ違うutm_contentの値がついているとします。この場合は、直前の2つのページ間の遷移が30分以内でも、utm_contentの値が変わったタイミングで新しいセッションになります。8月11日以前は上記の場合は1つのセッションという風に定義されていました。



上記が仕様になりますが、以下の2点を気をつける必要があります。


1)「ノーリファラー」「参照サイト」は新しいセッションの条件に含まれない

検索エンジンやキーワードが変わると新しいセッションになりますが、「ノーリファラー」や検索エンジン以外のリファラーをもつ「参照サイト」での流入があった場合は、新しいセッションの開始にはなりません。


以下の画像を御覧ください。


テストケース1:
1.検索エンジンから流入
2.30分以内の参照元ドメインhttp://www.google.co.jp/ig)から流入
3.30分以内にノーリファラーから流入


見ての通り、3回サイトに流入していますが、最初の検索エンジンのみが流入とみなされ、訪問回数は「1」、ページビュー数は「3」となっています。



テストケース2:
1:Googleから流入
2:30分以内にYahoo!から流入


こちらのように検索エンジンが違う場合は新しいセッションとみなされ、訪問回数は「2」になります。



2)サイト内でトラフィックソースの値を使っている場合

通常、「トラフィックソースの値」はサイト外からサイト内の流入のために使われるものです。しかし、サイト内の遷移でも「トラフィックソースの値」を使って内部のキャンペーンの効果計測に利用されている事があります。例えばサイト内にあるキャンペーンページから商品一覧ページへのリンクにパラメータをつける事で、キャンペーンページからの流入である事を捕捉するためといった使い方です。


先程のリファラーと違い、トラフィックソースの値はセッションの最初だけではなく途中でも計測出来ます。今まではこの方法でも大きな問題は無かったのですが、値が変わるたびに新しいセッションとなってしまうため、サイト内での遷移がブツ切れになってしまいます。利用している方は数値に大きな変化が無いかをGoogle Analyticsで確認しましょう。





数値への影響

では、今回の変更によって計測されている数値にどのような変化が発生するのでしょうか?今回の変更は主に2つです。


1)ブラウザを閉じるとセッションが切れていたのが、繋がるようになった
2)トラフィックソースの値が変わってもセッションが繋がっていたが、切れるようになった


というわけで、2つの条件はそれぞれの変化が相殺しあう形になります。


そのため数値がどれくらい「ずれるか」は上記2つの割合に依存し、ここはサイトによって変わってきます。例えば先程の、サイト内で「トラフィックソースの値」を使っている場合は、セッションが切れることによる影響が大きくなります。



では、具体的にどの数値が変わるのかを確認してみましょう。


セッションがより切れるようになった「トラフィックソースの値が変わることによってセッションが切れる」方の変化を見てみましょう。「ブラウザを閉じるが無視される事になった」場合の変化は下記に書いてある内容の逆になります。

※それぞれサイト全体とページ単位の値に影響
※ロジックを元にした筆者が影響あると考えたレポートなので、全てのレポートを網羅できていない可能性が高いです

セッションが切れた場合に「増える」値

・訪問回数
検索エンジン/参照元ドメイン/ノーリファラーからの流入数
・直帰数(直帰率
・リピーター

セッションが切れた場合に「減る」値

・平均滞在時間
・平均ページビュー数
・新規訪問率

セッションが切れた場合に「分布が変わる可能性がある」値

・コンバージョン率
・リピート回数
・リピート間隔
・滞在時間
・平均訪問ページビュー
・PC環境系のレポート
・ネットワーク環境系のレポート
・モバイル系のレポート
・上位のランディングページ/離脱ページ
・目標への遷移/目標到達プロセス
・(新GoogleAnalytics)のマルチチャネルレポート
etc...


結構、多くのレポートの影響があることがわかります。セッションがより分割されやすくなることによって、「訪問回数」が増えたり、訪問単位でカウントしている「平均ページビュー数」が減ったりする事は特に説明が必要無いでしょう。


「分布が変わる可能性がある」のところは少しわかりづらいですが、例えば「PC環境>ブラウザ」を例に見てみましょう。こちらのレポートは「訪問回数」単位でブラウザのカウントを行なっています。ChromeのほうがInternet Explorerと比較して「よりセッションが切れやすい条件にマッチする」事が多い場合は、Chromeの比率が増える形になります。


もう一つ例としてコンバージョン率を紹介いたします。コンバージョン率は(コンバージョン数)÷(訪問回数)として考えた時に通常は減るのですが、Google Analyticsでは「サイトに10分以内の滞在」などをコンバージョンとして設定できますが、この場合はセッションが切れることによって、分子であるコンバージョン数が増える方向に向かいます*3。しかしこのような設定をしているケースは少ないかと思いますので、基本コンバージョン率は減ると考えて間違いないでしょう。



どう扱えば良いのか?

2つの変更がそれぞれ相殺しあうため、サイトによっては変化があった事に気づかないかもしれません。また、それぞれの割合が少ない可能性も大いにあります。もし数値が8月11日を境に、あるレポートの値が数十%変わったという場合は、今回変更があった箇所が影響を与えている可能性があります。私が持っているアカウントの中から20個ほどプロファイルをピックアップして確認してみたところ、気付ける範囲での変化はありませんでした。



今回の変更に関しては、セッションという定義を考えたときにはよりわかりやすい方向に変わったかと、個人的には思います。しかし事前アナウンスが無かった事は少し気になります。また、上記に「わかりやすい方向」と書いたものの、未だにアクセス解析ツールによって、セッションの定義は違います。


例えばVisionalistはGoogleAnalyticsと同じで日をまたぐとセッションが切れますが、SiteCatalystであれば日をまたいでもセッションは切れません。またVisionalist/SiteCatalyst共に広告パラメータが変わってもセッションは切れない仕様となっています。


普段サイトの分析を行う上ではそれほど気にはならないのですが、ある日を境にルールが変わっているというのは少しわかりづらいですね*4



取り留めもなく書いて来ましたが、数値に変化がない場合はあまり気にせず今まで通りの利用するのが良いでしょう。変換のための係数と掛け出しはじめると、かえって大変な事になるかと思います。

*1:厳密にはページだけではなく、カスタムイベントなども含まれます

*2:Google Analyticsの元となったツール。現在も有料版として提供されています

*3:分母である訪問回数も増えるので、必ずコンバージョン率が増えるわけではありませんが

*4:かと言って、過去に遡っての再集計はGoogleにとっても利用者にとってもより大きなデメリットがあるかと