えいきちのデータ分析

えいきちのデータ分析

データ分析の理解を進めるブログ

〜Tableau〜 LOD INCLUDE関数の理解

f:id:eikichix:20200126222756j:plain

BIツールを勉強しようとTableauを始めました。
その中で理解しにくいなーと思うものをまとめていこうと思います
今後余裕が出てきたらPowerBIやOracleBIなどにも手を出していこうと模索中

基本的には参考書を読んでつまづいたところを調べてここに載せようかなと思ってます

現在使用参考書はこちら
www.amazon.co.jp



皆さんの理解の援助にもなれば幸いです


今回の内容はLOD計算のINCLUDE関数についてまとめようと思います

LODとは Level of Detail の略で日本語では詳細レベルと訳されます
Tableauでそれに属するのは3つで

  1. FIXED
  2. INCLUDE
  3. EXCLUDE

とあります

FIXEDは参考書の中でこの関数は目的が明確だったので理解できたのですが
INCLUDEは使用する目的が理解できず(私のおつむの問題もありますが)
まとめようと思いました

INCLUDE関数の記述としては
f:id:eikichix:20200418090238p:plain

となっていて これを使って作成したグラフが
f:id:eikichix:20200418090409p:plain

こうなりますよ
とのことです


で?何が嬉しいのだろう?


となりました

そもそも全体売上平均との違いはどうなるのだろうと思い
列に売上ピルを追加して比較しました(平均にすることを忘れずに)

f:id:eikichix:20200418090915p:plain

うん。違う

いやいや、そもそも平均(売上)って何の平均?

ドツボにハマってきたので、一度スケールを小さく自分でデータを作成してTableauに食わせることにしました

f:id:eikichix:20200418102344p:plain

顧客Aさんと顧客Bさんがいて、それぞれ5回ずつ椅子、もしくは机を購入したとしました

全体平均と顧客売上平均の違いがこちら
f:id:eikichix:20200418102758p:plain

上記よりまとめると

全体平均: 売上合計/レコード数(行数なので今回は10)

顧客売上平均:売上合計/顧客ユニーク数(AとBなので今回は2)

というロジックであることを理解
さらに購入品切り口でグラフ表示にて比較
f:id:eikichix:20200418103556p:plain

上記より椅子に焦点を絞ってまとめると

全体平均: 椅子売上合計/椅子レコード数(行数なので今回は5)

顧客売上平均:椅子売上合計/顧客ユニーク数(AとBなので今回は2)

であることを理解

ここでやっと
INCLUDE関数を使用することで指定したディメンションをビューに存在していなくても使用して算出できるということは理解できた


Tableau標準のサンプルデータに戻り
一番最初に作成したグラフに行き着く前のグラフはこれなんだろうなと作ってみた
f:id:eikichix:20200418105146p:plain

平均(売上)メジャーを使用して、カテゴリ、サブカテゴリ、顧客名を切り口に表現したもの、現在の粒度が顧客名なので
今回は篠原明美さん(誰)に焦点を絞ってまとめると

全体平均: 篠原明美さん椅子売上合計/篠原明美さんレコード数

を篠原明美さんの項目に棒グラフで出しているものになるというもの

これでは分かりづらいし、そもそも表現しているものに意味がないので
顧客平均で表現しようとなったのが一番最初のグラフになる

これで繋がったし、ロジックもわかったのでここまでにしたいと思います



ただ、

サブカテゴリ別の顧客売上平均を出すことで何が嬉しいの?

については顧客売上平均が高い=商品価値がある
ということなのだろうと表面的理解はできたけど
本質理解できていないので、これは誰かに助言をいただきたい所存です

今回理解するにあたり、以下の内容も参考になりました
INCLUDEは中間テーブルを作成するイメージなのかと認識した後、理解が加速しました ご参考まで

ex-ture.com