はじめに
どうも、おはこんばんちわ。
お茶太郎です。
今回は、前回に続き「ちょっとTableauに興味があるけど、どう始めて良いかわからない」という方向けに、無料でできるTableauの味見方法です。
前回、気象データで棒グラフ・折れ線グラフを作成しました。
今回は、色の設定やツールヒント(マウスオーバーした時にポップアップ表示される情報)の設定計算式を作って、必要な数字を表示する方法など細かな調整をしていきます。
みなさんのデータドリブンの第一歩のきっかけになれば幸いです。
体験してみよう
地域別に分析してみよう!!
さて、前回からの続きです。
今、月別降水量(棒グラフ)と累積降水量(折れ線グラフ)が表示されています。

これを地域の視点でデータを切り分けて分析してみましょう。
左側のデータ、ディメンションの中に【地域】があります。
これを列のシェルフにドロップします。

前回のBlogで、「ディメンションの切り口で集計される」と説明しました。
今回、地域というディメンションの情報を使いましたが、この地域の切り口でデータが集計されることを確認しましょう!
また、行/列の機能もここで確認しておきましょう!
列シェルフにドロップした地域ピル(飲み薬のカプセルのような形のものをピルと言います)を行シェルフにドロップしてみましょう。
行方向に地域の切り口でデータが集計されました。
集計の方法を見直そう
下の折れ線グラフは累積を表しています。
ただし、今は地域を跨った状態で累積されています。
地域を跨いで累積する意味はありません。
そこで集計方法を変更して、地域ごとの累積値を算出する方法に変更しましょう!
「合計(合計降水量)▼」(累積値とした方のピル)の▼を選択、「表計算の編集…」を選択します。

すると、メニューが表示されます。
今回は、「ペイン(横から下へ)」を選択します。
すると、地域ごとの累積値が集計されるようになりました。
この編集画面では、細かな集計方法を指定することができます。
今回は入門編のため、詳細な操作方法は割愛しますが、色々試してみてグラフの変化を確認してみましょう!
~~ ここの「注意事項」はとても重要なことです!! ~~
あなたがもしデータドリブンする立場の方であるならば、決して忘れないでください!!
Tableauでは簡単に意図したグラフを描画したり、データを集計することができます。
ただし、あくまで機械的な機能でしたありません。
簡単にできるということは、データとTableau、双方の知見がなければ意図したものと違うものが簡単に作れてしまうということです。
データに意味を持たせる、その時間違ったデータ・表現をしてしまうことは間違った意思決定に繋がります。
これがビジネスの世界であれば、一つ間違えばとてつもない損失につながる可能性もあります。
簡単にできるからこそ、データの持つ意味・Tableauの機能をきちんと理解した上で、データビジュアライゼーションを進めていきましょう!!
色で区別する
続いて、Vizを色分けしてみましょう。
色シェルフにデータをドロップしてみましょう。
既に列シェルフに選択済みのピルはCtrlを押しながらドロップすると、コピーできます。
Ctrl押さないでドロップすると移動してしまいますので、注意してください。
累計のカードにドロップしたので、累計の折れ線グラフが地域別に色分けされました。

続いて棒グラフのカードに、「日照時間」をドロップしてみます。
メジャーである「日照時間」を色に指定したため、量の増減でグラデーションが付いた青い色が付きました。
日照時間の長短の色が青のグラデーションではイメージにそぐわないと思います。
色を変えてみましょう!!

続いて、色の編集をクリックします。
「色の編集」ウィンドウが表示されます。

今回は、日照時間が短い時に青、長い時にオレンジとしたグラデーションにしたいと思います。
「パレット(P):」をクリックし、「オレンジ-青の分化」を選択します。
更に、「□反転」にチェックを入れると、青→オレンジのグラデーションとすることができました。

降水量の過多(棒グラフの長短)と日照時間の長短(色)を同時に表現することができました。
複数の事象を表現の違いで簡単に表せる、Tableauの得意分野です。
地域ごとの折れ線グラフを一つのグラフで表現することもできます。
次のように設定してみましょう。



ちなみに、このVizはシート名(シートタグの名称)を「地域ごとの折れ線グラフ」に変更しました。
それに伴いViz上に表示されている名称も「地域ごとの折れ線グラフ」に変わりました。
※色に「地域」を指定した時点で詳細に設定したのと同じ状況となります。詳細の「地域」は削除しても地域別に色分けされた折れ線グラフが描画できます。
フィルターで地域を絞り込む
「フィルター」に「地域」をドロップ
ドロップと同時にフィルタ選択のウィンドが表示されるので、「東京」を選択
地域を簡単に切り替えられるようにしましょう。
フィルターの「地域: 東京▼」の▼をクリック。
表示されるメニューから、「フィルターを表示」を選ぶ。
今回は「(すべて)」を選択できないようにしたいので、表示しないようにしましょう。
下記のように「” すべて”の値を表示」のチェックを外してください。
フィルターに表示されている地域名称を北の北海道から、南の那覇の順に並び替えることもできますが、今回は初心者向けの説明なので割愛いたします。
ご了承ください。
累積の降水量が全体の何パーセントか知りたい
数式を作り、この数字を計算していきます。
サイドバー上部にある▼をクリックして、メニューを開きます。
「計算フィールドの作成…」を選択してください。
下記のように数式を入力します。
- 数式名: 累積降水量の全体比率
- 数式: RUNNING_SUM(SUM([合計降水量]))/WINDOW_MAX(RUNNING_SUM(SUM([合計降水量])) )

数式の意味はこんな感じです。
~分子~
RUNNING_SUM(SUM([合計降水量])) →『「合計降水量」の合計』の累積
~分母~
WINDOW_MAX(RUNNING_SUM(SUM([合計降水量])) ) →【『「合計降水量」の合計』の累積】の最大値→合計降水量
~式の意味~
累積の降水量を合計の降水量で割っている。すなわち、全体に対する比率を算出
作った数式をツールヒントに表示
数式『累積降水量の全体比率』を折れ線グラフカード内のツールヒントシェルフにドラッグします。
これで、折れ線グラフ上のツールヒントに「累積降水量の全体比率」が表示されるようになりました。
折れ線グラフにマウスポインタ―を移動してみましょう!!
数字書式設定
表示される数字をパーセント表記に変更します。
数式右側の▼をクリック → 「規定のプロパティ」選択 → 「数値形式…」選択
パーセンテージ → 小数点[2]で小数点以下二けた表記とする
ツールヒントの表示内容調整
ツールヒントですが、いろいろな情報が味気なく表示されています。
これを変更していきましょう。
<地域>の気象データ
2020年1月から<月(日付)>までの累積降水量は、<合計(合計降水量) の 合計 の累計>
2021年6月までの累積降水量の<集計(累積降水量の全体比率)>
ツールヒントはこの設定画面で指定した書式で表示されます。
文字サイズ、色、太文字設定などできますので、お好きな設定をしてください。
保存
ということで、ここで終わりにしたいと思います。
前回同様、Publicに保存して終了しましょう。
こんな感じで、Web公開されるはずです。
最後に
ということで、前回に引き続きVizを作成していきました。
この先、ダッシュボードをつくって複数のVizを表示したり、もっと複雑な数式をつくったりしていきます。
ただ、今回の内容だけでも数値をグラフ化・分析することはできるはずです。
まずは、Tableauをいろいろ触ってみて、機能や可視化の楽しみ方を経験してみてください。
今回累積の降水量比率を簡素化するために地域別に表示する仕様としています。
今回つくった数式では、複数の地域を同時に表示するとその合計値が分母となってしまい、正しい比率が計算できません。
それを正しく計算するためには少し難しい計算式を書かなくてはなりません。
今回は、はじめの方向けの内容ですので、簡素な数式を正しく表示できるVizをつくっています。
また、2010年からの気象データも公開しておきました。
このデータを使って、データから「気づき」を見つけてみてはいかがでしょうか?
気象データ_2010-2021_20210703_お茶太郎.csv
それでは、今回はこれにて。
それではまた。。。ノシ~~~