えいきちのデータ分析

えいきちのデータ分析

データ分析の理解を進めるブログ

〜Tableau〜 【実践スキル】顧客分析をTableauでやってみよう1

f:id:eikichix:20200425184225j:plain

今回は顧客分析手法の1つRFM分析を行いたいと思います。

RFM分析とは?

RFMは3つの頭文字をまとめたもの

1. Recency

顧客が物を購入した最終注文日

2.Frequency

顧客が物を購入する頻度

3.Monetary

顧客が購入した金額

この3つの頭スペルを取ってRFM分析と名付けられています。
この分析の場合は顧客が何を買ったかには注目せずに上記3つに絞って分析することがポイント。
注文最終日からの経過日数で離反傾向を把握したり、購入頻度や売上の大小で全体のインパクトを評価することが可能です。


Tableau操作

基本は参考書に沿って操作します。



個人的に理解したいところや、つまづいたところを以下にメモ。

前準備

DATEDIFFのエラー

基準日を固定化するために参考書ではわざわざパラメータ作成を行なっていたので疑問に思い、DATEDIFFに文字列を入れてみたらダメでした。 パラメータ等のペイン要素で日付時刻を入れなければならない仕様でした。
f:id:eikichix:20200430102316p:plain

DATETRUNC関数

初使用なのでメモ。基準に基づいて切り捨てた新しい日付を返す変数。
f:id:eikichix:20200430102942p:plain


分析作業

ディメンジョン変換(Recency & Frequency)

Recencyをディメンジョン変換します。
購入回数の切り口で分析するためだと理解。
f:id:eikichix:20200430103652p:plain
f:id:eikichix:20200430103846p:plain

Frequencyも同様。
f:id:eikichix:20200430104007p:plain


ディメンション変換と箱ひげ図(Monetary)

Monetaryは箱ひげ図の利用が勉強になったので少し詳しめに。
Monetaryは上記2つとは異なり、ディメンション変換後に連続データとして意味があるものなので連続値として配置。
f:id:eikichix:20200430105104p:plain

結果
f:id:eikichix:20200430105218p:plain

参考書と棒グラフの幅が異なることで違和感がある方はマークシェルフのサイズで選択できます。
f:id:eikichix:20200430105324p:plain

売上は顧客毎にばらつきが大きいので全部含めると誤ったインサイトとなりそう。(外れ値の脅威)ここで箱ひけ図の登場。
アナリティクスから箱ひげ図をドラッグアンドドロップすると出現。
f:id:eikichix:20200430110014p:plain

この上部ヒンジ(第一四分位数)から下部ヒンジ(第三四分位数)の範囲にデータが集まっていることを示しているのでこれを基準にグループ化すれば良さそう。箱ひげ図がすぐに作れるのは本当に便利。


四分位数と中央値

アナリティクスの中に四分位数と中央値との表示があったので何が違うのか配置してみた
f:id:eikichix:20200430110709p:plain

箱ひげ図のひげがないバージョン。
うん。箱ひげ図がよいです。


その範囲をもとにグループ範囲を確認するためのパラメータ(Monetary区分)と計算フィールドを作成して配置。Monetary区分は100,000で設定しました。
f:id:eikichix:20200430113735p:plain


まとめ

今回はDATATRUNC関数と箱ひげ図の使用方法にフォーカスを当てました。
次回も引き続きRFM分析を進めてきます。
それではー

参考書
https://www.amazon.co.jp/Tableau%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90-%E5%85%A5%E9%96%80%E3%81%8B%E3%82%89%E5%AE%9F%E8%B7%B5%E3%81%BE%E3%81%A7-%E7%AC%AC2%E7%89%88-%E5%B0%8F%E9%87%8E-%E6%B3%B0%E8%BC%94/dp/4798059838