えいきちのデータ分析

えいきちのデータ分析

データ分析の理解を進めるブログ

〜Tableau〜 【現代の必須スキル】コホート分析を学ぼう!

f:id:eikichix:20200509085527j:plain



今回はコホート分析をTableauでやってみたいと思います!
前回まではRFM分析を行っておりました。もしご興味があれば以下をご参照下さい!
eikichix.hatenablog.com

コホート分析(cohort analysis)とは?

直訳すると「同世代分析」。データをある属性でまとめて分析する手法のことです。
今回は各々の属性を時系列推移で表したものを比較分析したいと思います。
具体的には初回注文時期ごとの顧客定着を時系列で表現します。

Tableau操作

参考書に沿って操作し、私の見解を含めて説明します。


前準備

「初回注文日」計算フィールド

f:id:eikichix:20200509092426p:plain

顧客ID毎の初回注文日を表したいので、顧客IDをFIXED関数の初項におき、MIN関数でオーダ日を指定しています。 ある顧客IDの一番値が小さいオーダ日=一番古いオーダ日=初回注文日 というロジックです。

「3Q後顧客維持率計算」フィールド

f:id:eikichix:20200509093357p:plain

顧客を初回注文したQ単位で括って表示するためのフィールドです。

[初回注文日からの経過時間]は前回作成したものですが少しおさらいをすると
分析単位を「year, quarter, month, day」で変更できるパラメータです。

データペイン内のディメンション横にある「▼」>「パラメータの作成...」
f:id:eikichix:20200509094206p:plain

設定内容は以下ご参照下さい。
f:id:eikichix:20200509094357p:plain

IIFの条件の「ATTR([初回注文日からの経過時間])=3」とは、初回注文日からの経過時間をquarterで設定しているとすると「初回注文日から3Q経過した顧客」に絞って表示することになります。
3の部分を変えることで2Q経過や4Q経過の表示も可能です。

分析作業

フィールド配置

フィールドを以下のように配置します。
※オーダ日と初回注文日は「四半期」かつ連続設定で配置します。
f:id:eikichix:20200509100202p:plain

連続設定は列配置フィールドの「▼」から以下のように設定します。
f:id:eikichix:20200509100411p:plain


表計算による割合集計

行シェルフの「顧客数(COUNTD)▼」>「簡易表計算」>「表計算の追加」を選択します。
f:id:eikichix:20200510090034p:plain

表設定は以下のように。
f:id:eikichix:20200510090956p:plain
四半期(オーダ日)の切り口での最初の値(=初回注文日の顧客数)を分母にして割合を出す設定です。分子は各々のオーダ日の顧客数になります。

ちなみに参考書では「次を使用して計算」で「特定のディメンション」を選択していますが今回は特定にしなくてもよいと判断しました。列シェルフには「四半期(オーダ日)」しか存在しないので。


色設定

見やすくするために色設定を行います。
マークシェルフの「色」>「色の編集」から以下のように設定をします。ここは見やすければよいのでご自由に設定でもOKです。
f:id:eikichix:20200510092250p:plain
f:id:eikichix:20200510092538p:plain


3Q後顧客維持率の設定

前準備で作成した「3Q後顧客維持率」を行シェルフへ配置します。
ここで見やすくするための設定を加えます。
※3Q後顧客維持率のマークシェルフへ設定して下さい。
1.「四半期(初回注文日)」をラベルに配置
2.「3Q後顧客維持率」をラベルに配置
3.棒グラフ設定
4.サイズ設定で棒グラフの幅を調整

f:id:eikichix:20200510094012p:plain


顧客数をサイズで表現

最後に顧客数をサイズへ設定します。
※集計顧客数(COUNTD)のマークシェルフへ設定して下さい。
f:id:eikichix:20200510094620p:plain


結果/考察

グラフの表示は以下になりました。
f:id:eikichix:20200510094337p:plain


考察1 新規顧客数の下降トレンド

100%ライン上の折れ線のサイズがQ経過につれて細くなっている。折れ線は初回注文Q毎に表示されていることより、新規顧客数が減少していることが分かる。 対策を打てば売上/利益拡大の足掛かりになるかもしれない。

考察2 顧客維持率の上昇トレンド

折れ線全体を見るとQ経過につれて上昇トレンドになっている。これは顧客が戻ってきていることを表している。イベントを増やして対策した結果が現れているのであれば効果が出ていることが見て取れるので今後も継続すべきとの意思決定判断材料となる。


番外編

棒グラフ存在意義問題

3Qに絞って表現した棒グラフですが、上記の折れ線グラフで分析ができてしまったので存在意義にクエスチョンが出てしまいました。
f:id:eikichix:20200510100413p:plain

存在意義として3Qのみの顧客維持率が見やすいでは弱いと感じたので、Qを動的にパラメータで設定できるようにしようと思います。


経過時間パラメータ作成

動的な数値設定をするためにパラメータを以下の設定で作成します。
f:id:eikichix:20200510100939p:plain


3Q後顧客維持率計算をコピーして内容変更

別フィールド作成のため、「3Q後顧客維持率」を複製して以下のように編集します。
f:id:eikichix:20200510101141p:plain
具体的には「3」の部分を「[経過時間]」に変更しただけです。この「[経過時間]」がパラメータ数値で設定できるようになるわけです。

フィールド配置

以下のように
1.「顧客維持率(可変)」を行シェルフに配置(既存フィールドと入替)
2.「顧客維持率(可変)」をラベルに配置(既存フィールドと入替)
3.「経過時間」を「パラメーターコントロールの表示」設定
f:id:eikichix:20200510102750p:plain

結果

右下に表示されたダイアルを変更することで経過Qを操作し、各々で棒グラフを動的に変更できるようになりました。

4Q経過表示
f:id:eikichix:20200510101714p:plain

7Q経過表示
f:id:eikichix:20200510103201p:plain



まとめ

今回はコホート分析でした。
自分なりの解釈と工夫をすると記憶にも残るし、ええ感じです。 引き続き勉強していきたいと思います。
皆さんへの情報提供の援助にもなれば幸いです。




参考書
https://www.amazon.co.jp/Tableau%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90-%E5%85%A5%E9%96%80%E3%81%8B%E3%82%89%E5%AE%9F%E8%B7%B5%E3%81%BE%E3%81%A7-%E7%AC%AC2%E7%89%88-%E5%B0%8F%E9%87%8E-%E6%B3%B0%E8%BC%94/dp/4798059838