【さっくり】ちょっとTableau触ってみたいっていうあなたへ01【体験】

はじめに

どうも、おはこんばんちわ。
お茶太郎です。

今回は、「ちょっとTableauに興味があるけど、どう始めて良いかわからない」という方向けに、無料でできるTableauの味見方法をご紹介していきます。

みなさんのデータドリブンの第一歩のきっかけになれば幸いです。

参考書籍
お薦め書籍、上げておきます。

入門書
Tableauによる最強・最速のデータ可視化テクニック

データドリブンカルチャを組織に浸透させたい方に
データドリブンの極意

環境の準備

サンプルデータ

データは、気象庁公開の気象データを使います。
下記リンクをクリックするとGoodleドライブ上のCSVファイルが開きます。
気象データ_20210703_お茶太郎.csv(2020年1月1日~2021年6月30日、札幌・仙台・東京・名古屋・大阪・福岡・那覇の観測所データ)
自身のPCにダウンロードして使ってください。

使用するTableau

今回は、フリーで使えるTableauPublicを使います。
※上記リンク、ブログ作成当時のサイトがなくなり、
英語版サイトにキックされます。

メールアドレスを入力して、インストーラをダウンロードしてください。

お茶太郎
インストーラ立ち上げると、連絡先入力かなにか求められると思うぞ。
まあ、いい感じに入力していってくれ。
ニガウリくん
Publicは、フリーで使える代わりに作ったVizがWeb上に保存(公開)されます。
機密性の高い業務情報などでVizを作成しないでください!!
最近の改修でTOP画面に表示するかしないか設定できるようです。
公開したくないものは表示しない設定にしましょう!
ただし、やはり機密性の高いものはWeb上に保存しない方が良いでしょう!
お茶太郎
Viz保存する時に、保存先のTableauPublic(Web上の公開環境)の設定効いてくるかもしれねー。
良しなに環境作ってくれ。
ちなみに、俺の環境はここだ。
こんな感じで公開されるからな。
注意
Public(アプリケーション)は、Web上のPublic(同じ名前でややこしいが、こちらはWeb環境)に保存・公開されます。
くれぐれも、公開してはいけない機密情報でVizをつくらないようにしましょう。
PublicはDBサーバ接続ができないなど一部制限がありますが、初めて体験するには十分な機能を体験することができます。

体験してみよう

起動

インストールがおわったら、早速TableauPublic(以下、Tableau)を立ち上げてみましょう。
私の環境はWindowsです。この環境ベースで説明を進めていきます。

ウィンドウメニュークリックすると、インストールしたTableauがリストの中に表示されていると思います。
ほかのアプリケーション同様、このアイコンを選択してTableauを起動しましょう。

起動すると、このような画面が表示されると思います。

データソースの選択と確認

左側【接続】[ファイルへ]メニューの「テキスト ファイル」を選択してください。
ファイル選択ウィンドウが開きますので、先ほどダウンロードしたサンプルファイル「気象データ_20210703_お茶太郎.csv」を選択してください。

データソースを選択すると、Tableau画面に戻り、「データソースタグ」が選択された状態になります。
選択したデータソースがプレビュー表示されています。
データの型が間違いないかなど、ここで確認できます。
型が間違っていた場合は、ここで変更することができます。

Viz作成

使うデータを選択できたら、早速Vizをつくってみましょう。

 

ウィンドウ下に「シート1」というタブがありますので、それを選択しましょう。

なんとなくエクセルのピボットに似ている画面がでてきましたね。
ざっくりですが、色を付けて機能の対比をしてみます。
行・列・フィルタの概念はほとんど同じです。

値の使い方が少し違います。
列/行にドロップしたメジャーの項目が、値として集計されます。
メジャーについては後述の「メジャー/ディメンション」「連続/不連続」についてを参照ください。

私はだいたい赤枠の行・列(行シェルフ/列シェルフといいます)に指標をドロップして、グラフを作っていきます。

お茶太郎
まあ、だいたいこんな感じだ。
なんとなく、ここまでイメージ程度で理解できたら、適当にいじって見ろ。
ものごと習うより慣れろ!だ。
データ表示について
データは、「名前順でソート」「データソースの順序でソート」選べます。
デフォルトは名前順ですが、私の用意するデータは並び順にもこだわりがある(手を抜くこともあり)ため、
データソースの順番で表示するようにしています。

データは、「ディメンション」「メジャー」という種類に分けられ、表示されます。
ディメンション:集計することのない項目。このディメンションの切り口で集計される。
メジャー:集計できる数値。この数値が、ディメンションに切り口で集計される。
「メジャー/ディメンション」「連続/不連続」について
「メジャー」「ディメンション」の分類の他に、Tableauでは「連続」「不連続」の分類でデータを取り扱います。
この分類はとても重要となります。
これについては、Satoshi Ganekoさんがnoteで詳しくまとめられています。
詳細は、こちらをご参照ください。

他、Tableau活用で重要となる8つの事柄について説明されています。
本格的にがTableauを使いたい方は、是非ご一読ください。

時系列グラフの作成

Tableauは自由度が高いアプリケーションです。
同じものを作るにしても、いくつか設定する(できる)場所が異なります。
異なる場所で設定して、同じもの・同じようなものができあがります。
とても奥が深いアプリケーションですが、ここでは簡単な手順例を紹介しながら、Vizを作っていきます。

お茶太郎
シンプルに覚えてもらえるように説明していくからな。
ニガウリくん
豊富な引き出しなど、持っていないくせにw

 

とりあえず、ドラッグ&ドロップ

「日付」を列に、「合計降水量」を行にドロップしてみましょう。
Tableauは、優しいアプリケーションなので、選んだデータを元にそれっぽいものを独自で判断してVizを作ってくれます。
今回は、日付を【年】の切り口で、合計降水量の【合算】を折れ線グラフで表現してくれました。

 


ディメンションの「日付」を切り口にして、メジャーの「合計降水量」を合算してくれています。

注意
データを取り扱う時は、データの中身を意識して取り扱うようにしましょう!!
今回のデータは、「2020年1月1日~2021年6月30日」の気象データ。
2021年は半年しかありません。
このデータを年で表現すること自体不適切です。
データを中身を理解しながら、可視化表現する。
大切なことです!!

月次の棒グラフにしてみよう

出来たグラフですが月の棒グラフに変更してみましょう。

 

まずは日付を月で集計
列のところにある、【年(日付)】の▼をクリックするとメニューが表示されます。
このメニューで、【●年 2015】になっているところを、【月 2015年5月】に変更します。
今選択されている年のすぐ下【月 5月】ではなく、少し離れたところにある【月 2015年5月】を選んでください。

これだけで、グラフが年から月の時系列に変わりました。

注意
ここですぐ下にある【月 5月】を選ぶと、西暦を無視した各月の合計値で集計されます。

例えば、過去5年の月別平均降水量などを表現したい時はこちらで指定しましょう。

続いて、折れ線グラフを棒グラフにします。
左側、マークと書かれている部分(カードといいます)の【自動▼】の▼をクリックすると
グラフのタイプを選択できます。
棒グラフを選んでみましょう。

これで、棒グラフの完成です。

 

平均値だって簡単

「合計(合計降水量)▼」の▼をクリック → メジャー(合計)を選択 → 【平均】を選択

これで、平均値が表示されます。

【Ctrl+z】で元に戻す
アプリケーションなので【Ctrl+z】で、ひとつ前に戻すこともできます。
今、平均値の数値をひとつ前の状態にもどして、合計値にしてみましょう。
次のステップは、合計値の状態から作業再開となります。
お茶太郎
BIツールにもよるんだが、Webアプリケーションだと、【Ctrl+z】ができねーのもあるんだよな。
戻れるのは便利だな。

他の集計方法と並べてデータを可視化

「合計(合計降水量)」をマウスでつまんで、Ctrlを押しながら【行】の空白部分へドラッグすると、
コピーすることができます。

グラフも複製されます。

コピーした「合計(合計降水量)」を累計に変更すると、合計と累計のグラフが簡単に作れます。

棒グラフに変更する。
この時、「合計(降水量)」をコピーしたことで、カードが増えました。
カードは、下記のような状態です。
3つあるカードは、それぞれクリックで展開できます。

コピー、累計に変更した「合計(合計降水量)」を折れ線グラフにしてみましょう。

グラフが変わりましたね。

保存

とりあえず、今日はここまで。
保存をして終わりとします。

メニュー 「ファイル」 → 「Tableau Publicに保存(S)…」を選択。
名前を付けて保存してください。

Web環境上の「Tableau Public」の保存のため、メールとパスワードを聞かれるかもしれません。
環境準備済みの方はその環境のパスワードを入力しましょう。
まだ環境作っていない方は、「今すぐ無料で作成」を選択し、環境を作りましょう。

こんな感じでVizが保存(公開)されました。

お茶太郎
2022年10月のバージョンでは、公開非公開を選択できるから、よしなに設定しろよな。

 

最後に

今日は、ここまでといたします。

まとめ
次回までに、ここまでやってきたこと応用して適当にVizいじってみてください。
それなりに機能を理解することができると思います。

Tableauは奥が深いアプリケーションです。
深い底を目指すとめまいがします。
まずは、適当にいじって簡単に表現できるものからチャレンジしましょう!!

とりあえず、2010年からのデータも公開しておきます。
災害が続いています。過去のデータから気づきを見つけてみましょう。
気象データ_2010-2021_20210703_お茶太郎.csv

次回は、色の設定やツールヒント(マウスオーバーした時にポップアップ表示される情報)の設定
計算式を作って、必要な数字を表示する方法などご説明いたします。

ここまでお付き合いいただき、ありがとうございました。

それではまた。。。ノシ~~~~