〜Tableau〜 【実践スキル】顧客分析をTableauでやってみよう1
今回は顧客分析手法の1つRFM分析を行いたいと思います。
RFM分析とは?
RFMは3つの頭文字をまとめたもの
1. Recency
顧客が物を購入した最終注文日
2.Frequency
顧客が物を購入する頻度
3.Monetary
顧客が購入した金額
この3つの頭スペルを取ってRFM分析と名付けられています。
この分析の場合は顧客が何を買ったかには注目せずに上記3つに絞って分析することがポイント。
注文最終日からの経過日数で離反傾向を把握したり、購入頻度や売上の大小で全体のインパクトを評価することが可能です。
Tableau操作
基本は参考書に沿って操作します。
個人的に理解したいところや、つまづいたところを以下にメモ。
前準備
DATEDIFFのエラー
基準日を固定化するために参考書ではわざわざパラメータ作成を行なっていたので疑問に思い、DATEDIFFに文字列を入れてみたらダメでした。 パラメータ等のペイン要素で日付時刻を入れなければならない仕様でした。
DATETRUNC関数
初使用なのでメモ。基準に基づいて切り捨てた新しい日付を返す変数。
分析作業
ディメンジョン変換(Recency & Frequency)
Recencyをディメンジョン変換します。
購入回数の切り口で分析するためだと理解。
Frequencyも同様。
ディメンション変換と箱ひげ図(Monetary)
Monetaryは箱ひげ図の利用が勉強になったので少し詳しめに。
Monetaryは上記2つとは異なり、ディメンション変換後に連続データとして意味があるものなので連続値として配置。
結果
参考書と棒グラフの幅が異なることで違和感がある方はマークシェルフのサイズで選択できます。
売上は顧客毎にばらつきが大きいので全部含めると誤ったインサイトとなりそう。(外れ値の脅威)ここで箱ひけ図の登場。
アナリティクスから箱ひげ図をドラッグアンドドロップすると出現。
この上部ヒンジ(第一四分位数)から下部ヒンジ(第三四分位数)の範囲にデータが集まっていることを示しているのでこれを基準にグループ化すれば良さそう。箱ひげ図がすぐに作れるのは本当に便利。
四分位数と中央値
アナリティクスの中に四分位数と中央値との表示があったので何が違うのか配置してみた
箱ひげ図のひげがないバージョン。
うん。箱ひげ図がよいです。
その範囲をもとにグループ範囲を確認するためのパラメータ(Monetary区分)と計算フィールドを作成して配置。Monetary区分は100,000で設定しました。
まとめ
今回はDATATRUNC関数と箱ひげ図の使用方法にフォーカスを当てました。
次回も引き続きRFM分析を進めてきます。
それではー