本ブログでのアトリビューション連載第5弾です。今回はアトリビューションを行うために必要なデータを紹介いたします。
【バックナンバー】
「アトリビューション分析」連載 その1:アトリビューションとは?
「アトリビューション分析」連載 その2:アトリビューション評価の難しさ
「アトリビューション分析」連載 その3:アトリビューション評価に必要なデータ その1
「アトリビューション分析」連載 その4:アトリビューション評価に必要なデータ その2
前回はアトリビューション分析を行うために必要なデータをまとめました。次はそのデータを加工するというSTEPになるのですが、その前に分析のロジックとなる、アトリビューションの評価モデルを考えてみましょう。
1.従来のセッションモデル
セッションモデルの場合は、成果に繋がった流入が成果と紐づきます。「コンバージョンをさせた流入が偉い!」という考え方ですね。
しかし集客施策には「初回に向いている」あるいは「最後に向いている」といった特徴があります。例えば外部のバナーなどは初回流入の比率が高くなりやすい傾向にあります。これはユーザーがそのワードを検討していなくても、その情報が出てきてついクリックしてしまうという特徴があるからです。しかしメールマガジンからの流入などはそもそもサイトに来ていないと登録が出来ることはほぼ無いので、初回流入になりえません。
これを基本的な考え方として、他のモデルを見ていきましょう。
2.初回モデル
セッションモデルと逆の発想です。1回目にそもそもサイトに来なければコンバージョンする事が出来ないのだから、初回が一番偉い!という考え方です。
しかし、初回が全てというのもそれは言い過ぎではないか?というのがこのモデルの問題です。コンバージョンするのにかかる平均流入回数が1とか2回ならこのモデルを使うのも選択肢の一つです。しかし、複数回の流入が必要な場合、そもそもユーザーが初回に何で流入してきたかを覚えていることはマレです。そこに全部成果を当ててしまうのはどうか?という考え方もあります。
3.Head & Tailモデル
頭と尻尾という名前の通り、最後も大切・最初も大切という事であれば、最初と最後を均等に評価しよう!というモデルになります。つまり最初:50% 最後:50%という考え方です。もちろん1回でコンバージョンした場合は、最初=最後=100%になります。
最初と最後を評価しているので、1あるいは2よりは少し考えられているモデルになります。しかし、最後にたどり着くためにはやはり間の流入も大切なのでは?という考えが脳裏をよぎります。次のモデルも見てましょう。
4.均等配分モデル
1つの成果を、それぞれの流入に割り当てるというモデルです。5回の流入後に成果があり、売上が2,000円だった場合は、それぞれに400円に配分するというモデルです。
このモデルは悪くないモデルかと思います。2回でコンバージョンすればそれぞれの1,000円、10回でコンバージョンすればそれぞれに200円といった形で、流入回数分の重み付けも可能です。ただ、あくまでも均等に割り当てているので、1回目につれてくることも、10回目につれてくることも同じという評価になってしまいます。
5.セッションコンバージョンを加味した逆分析モデル
こちら、事前に各施策のセッション単位でのコンバージョン率を相対化しておき、それにあわせて分配を行うというモデルです。例えばセッション単位で以下のようなコンバージョン率だとします。
リスティング | 2.5% |
SEO | 5.0% |
メールマガジン | 6.0% |
ノーリファラー | 7.5% |
このコンバージョン率を各施策の評価点とします。つまりノーリファラーで流入してくる方がリスティングで流入してくるよりコンバージョンする可能性が高いので、良い点数をつけてあげようという考え方です。
例えば以下のような流入があるとします。
この場合、それぞれの評価は
リスティング=17% (2.5 ÷(2.5+5.0+7.5))
ノーリファラー=50% (7.5 ÷(2.5+5.0+7.5))
SEO=33% (5.0 ÷(2.5+5.0+7.5))
となります。
このモデルは流入に対する重み付けを行おうという考えから生まれています。しかし結局セッションベースの評価になってしまっているため、セッションベースの結果と大差が無い結果が出てしまいます。ちょっと使いづらいモデルかなと思います。
6.流入回数の重み付けモデル
これは均等配分に似ているのですが、流入回数に重み付けを行おうというモデルです。ここで行う重み付けは、実際のコンバージョンの発生分布です。例えば、以下のような情報があるとします*1
流入回数別コンバージョン発生率(流入を100%として、各流入回数に分配しています)
回数 | コンバージョン割合 |
1 | 5% |
2 | 10% |
3 | 15% |
4 | 15% |
5 | 20% |
6 | 15% |
7 | 5% |
8 | 5% |
9 | 2% |
10以上 | 8% |
例えば4回目でコンバージョンが発生した場合
流入1:5点 =11% 5÷(5+10+15+15)
流入2:10点 =22% 10÷(5+10+15+15)
流入3:15点 =33% 15÷(5+10+15+15)
流入4:15点 =33% 15÷(5+10+15+15)
といった形で、より成果に繋がりやすい確率の流入を持ってきた施策を偉いと考える方式です。上記のデータの場合例えば8回目にコンバージョンしたとしても、5回目の比重を一番高くするという考え方になります。
この方法であれば、流入回数はもちろん、過去のデータを元に成果の発生のしやすさを元に重み付けが出来ます。しかし、3日で10回訪問する人も、1年で10回訪問する人も同じ10回と考えてしまう部分は難点です。集計の難易度はあがるものの時間で見る事で課題の一部は解決出来るかと思います。
7.誘導力モデル
これは、次の遷移につなげた割合とコンバージョン率を元に評価を分配するというモデルです。2点間の施策の誘導率を事前に集計をします。
例えば
リスティング→バナー→★SEO
という遷移が複数あったとします。
リスティング流入500件のうち、次にバナーで入ってきたのが200件とします。そして、200件のうちSEO流入に効いたのが50件とします。そしてSEO流入でのコンバージョンが10件としましょう。
この場合、リスティングの次の流入への誘導力は40% (200/500) そして、バナーの次の流入誘導力は25%(50/200)、SEOのコンバージョン力は20%(10/50)になります。この3つの比率で成果を分配するという考え方です。
計算すると以下のような分配になります。
リスティング:47% =40/(40*25*20)
バナー:29% =25/(40*25*20)
SEO:24% =20/(40*25*20)
この方法は、「次に送り込む力」という今までの方法とは違った観点から分配を行っています。成果に繋がった部分だけコンバージョン率にしているため、この数字によって全体が大きく変わってきます。コンバージョン率が低い場合は分配があわせて小さくなります。ここでは2点間を見ていますが、3点間にする、あるいは施策の組み合わせによって評価するといった応用の分析も可能かと思います。
まとめ
7つのモデルを確認してきました。どれが正解という事はありません。それぞれに良さがあり悪さがあります。どのモデルを採用するかは、実際に複数のモデルで分析してから判断するという考え方もあります。大切なのは、そのモデルで実際に施策を調整してみたら、予想とおりの結果に近いかという事になります。
モデルを紹介したところで、次回は実際の分析をどのように進めていくかを紹介したいと思います。引き続き、よろしくお願いいたします!
【バックナンバー】
「アトリビューション分析」連載 その1:アトリビューションとは?
「アトリビューション分析」連載 その2:アトリビューション評価の難しさ
「アトリビューション分析」連載 その3:アトリビューション評価に必要なデータ その1
「アトリビューション分析」連載 その4:アトリビューション評価に必要なデータ その2
★告知
5月24日(火)にTwitterとFacebookの分析に関するセミナーを行います@銀座
件名の通り、銀座でセミナーを行わせていただく事になります。2時間でソーシャルメディアの分析について盛り沢山お話ししたいと思っています。
お時間の都合が着く方はぜひ!