はじめに
どうも、おはこんばんちわ。
お茶太郎です。
今回は、「ちょっとTableauに興味があるけど、どう始めて良いかわからない」という方向けに、無料でできるTableauの味見方法をご紹介していきます。
みなさんのデータドリブンの第一歩のきっかけになれば幸いです。
環境の準備
サンプルデータ
データは、気象庁公開の気象データを使います。
下記リンクをクリックするとGoodleドライブ上のCSVファイルが開きます。
気象データ_20210703_お茶太郎.csv(2020年1月1日~2021年6月30日、札幌・仙台・東京・名古屋・大阪・福岡・那覇の観測所データ)
自身のPCにダウンロードして使ってください。
使用するTableau
今回は、フリーで使えるTableauPublicを使います。
※上記リンク、ブログ作成当時のサイトがなくなり、
英語版サイトにキックされます。

メールアドレスを入力して、インストーラをダウンロードしてください。
まあ、いい感じに入力していってくれ。
機密性の高い業務情報などでVizを作成しないでください!!
最近の改修でTOP画面に表示するかしないか設定できるようです。
公開したくないものは表示しない設定にしましょう!
ただし、やはり機密性の高いものはWeb上に保存しない方が良いでしょう!
Public(アプリケーション)は、Web上のPublic(同じ名前でややこしいが、こちらはWeb環境)に保存・公開されます。
くれぐれも、公開してはいけない機密情報でVizをつくらないようにしましょう。
PublicはDBサーバ接続ができないなど一部制限がありますが、初めて体験するには十分な機能を体験することができます。
体験してみよう
起動
インストールがおわったら、早速TableauPublic(以下、Tableau)を立ち上げてみましょう。
私の環境はWindowsです。この環境ベースで説明を進めていきます。
ウィンドウメニュークリックすると、インストールしたTableauがリストの中に表示されていると思います。
ほかのアプリケーション同様、このアイコンを選択してTableauを起動しましょう。
起動すると、このような画面が表示されると思います。

データソースの選択と確認
左側【接続】[ファイルへ]メニューの「テキスト ファイル」を選択してください。
ファイル選択ウィンドウが開きますので、先ほどダウンロードしたサンプルファイル「気象データ_20210703_お茶太郎.csv」を選択してください。
データソースを選択すると、Tableau画面に戻り、「データソースタグ」が選択された状態になります。
選択したデータソースがプレビュー表示されています。
データの型が間違いないかなど、ここで確認できます。
型が間違っていた場合は、ここで変更することができます。

Viz作成
使うデータを選択できたら、早速Vizをつくってみましょう。
ウィンドウ下に「シート1」というタブがありますので、それを選択しましょう。
なんとなくエクセルのピボットに似ている画面がでてきましたね。
ざっくりですが、色を付けて機能の対比をしてみます。
行・列・フィルタの概念はほとんど同じです。
値の使い方が少し違います。
列/行にドロップしたメジャーの項目が、値として集計されます。
メジャーについては後述の「メジャー/ディメンション」「連続/不連続」についてを参照ください。
私はだいたい赤枠の行・列(行シェルフ/列シェルフといいます)に指標をドロップして、グラフを作っていきます。

なんとなく、ここまでイメージ程度で理解できたら、適当にいじって見ろ。
ものごと習うより慣れろ!だ。
データは、「名前順でソート」「データソースの順序でソート」選べます。
デフォルトは名前順ですが、私の用意するデータは並び順にもこだわりがある(手を抜くこともあり)ため、
データソースの順番で表示するようにしています。

データは、「ディメンション」「メジャー」という種類に分けられ、表示されます。
ディメンション:集計することのない項目。このディメンションの切り口で集計される。
メジャー:集計できる数値。この数値が、ディメンションに切り口で集計される。
「メジャー」「ディメンション」の分類の他に、Tableauでは「連続」「不連続」の分類でデータを取り扱います。
この分類はとても重要となります。
これについては、Satoshi Ganekoさんがnoteで詳しくまとめられています。
詳細は、こちらをご参照ください。
- Note連載記事「Tableau 8つのハードルを越える。」をスタートします。
- Tableau 8つのハードルを越える①「メジャーとディメンション」
- Tableau 8つのハードルを越える②「連続と不連続 その1」
- Tableau 8つのハードルを越える③「連続と不連続 その2」
- Tableau 8つのハードルを越える④「連続と不連続 その3」
- Tableau 8つのハードルを越える⑤「メジャーのディメンションへの変身、ディメンションのメジャーへの変身」
他、Tableau活用で重要となる8つの事柄について説明されています。
本格的にがTableauを使いたい方は、是非ご一読ください。
時系列グラフの作成
Tableauは自由度が高いアプリケーションです。
同じものを作るにしても、いくつか設定する(できる)場所が異なります。
異なる場所で設定して、同じもの・同じようなものができあがります。
とても奥が深いアプリケーションですが、ここでは簡単な手順例を紹介しながら、Vizを作っていきます。
とりあえず、ドラッグ&ドロップ
「日付」を列に、「合計降水量」を行にドロップしてみましょう。
Tableauは、優しいアプリケーションなので、選んだデータを元にそれっぽいものを独自で判断してVizを作ってくれます。
今回は、日付を【年】の切り口で、合計降水量の【合算】を折れ線グラフで表現してくれました。
ディメンションの「日付」を切り口にして、メジャーの「合計降水量」を合算してくれています。
データを取り扱う時は、データの中身を意識して取り扱うようにしましょう!!
今回のデータは、「2020年1月1日~2021年6月30日」の気象データ。
2021年は半年しかありません。
このデータを年で表現すること自体不適切です。
データを中身を理解しながら、可視化表現する。
大切なことです!!
月次の棒グラフにしてみよう
出来たグラフですが月の棒グラフに変更してみましょう。
まずは日付を月で集計
列のところにある、【年(日付)】の▼をクリックするとメニューが表示されます。
このメニューで、【●年 2015】になっているところを、【月 2015年5月】に変更します。
今選択されている年のすぐ下【月 5月】ではなく、少し離れたところにある【月 2015年5月】を選んでください。
続いて、折れ線グラフを棒グラフにします。
左側、マークと書かれている部分(カードといいます)の【自動▼】の▼をクリックすると
グラフのタイプを選択できます。
棒グラフを選んでみましょう。
平均値だって簡単
「合計(合計降水量)▼」の▼をクリック → メジャー(合計)を選択 → 【平均】を選択

これで、平均値が表示されます。
アプリケーションなので【Ctrl+z】で、ひとつ前に戻すこともできます。
今、平均値の数値をひとつ前の状態にもどして、合計値にしてみましょう。
次のステップは、合計値の状態から作業再開となります。
戻れるのは便利だな。
他の集計方法と並べてデータを可視化
「合計(合計降水量)」をマウスでつまんで、Ctrlを押しながら【行】の空白部分へドラッグすると、
コピーすることができます。

グラフも複製されます。
コピーした「合計(合計降水量)」を累計に変更すると、合計と累計のグラフが簡単に作れます。
棒グラフに変更する。
この時、「合計(降水量)」をコピーしたことで、カードが増えました。
カードは、下記のような状態です。
3つあるカードは、それぞれクリックで展開できます。
コピー、累計に変更した「合計(合計降水量)」を折れ線グラフにしてみましょう。
グラフが変わりましたね。

保存
とりあえず、今日はここまで。
保存をして終わりとします。
メニュー 「ファイル」 → 「Tableau Publicに保存(S)…」を選択。
名前を付けて保存してください。
Web環境上の「Tableau Public」の保存のため、メールとパスワードを聞かれるかもしれません。
環境準備済みの方はその環境のパスワードを入力しましょう。
まだ環境作っていない方は、「今すぐ無料で作成」を選択し、環境を作りましょう。
こんな感じでVizが保存(公開)されました。
最後に
今日は、ここまでといたします。
それなりに機能を理解することができると思います。
Tableauは奥が深いアプリケーションです。
深い底を目指すとめまいがします。
まずは、適当にいじって簡単に表現できるものからチャレンジしましょう!!
とりあえず、2010年からのデータも公開しておきます。
災害が続いています。過去のデータから気づきを見つけてみましょう。
気象データ_2010-2021_20210703_お茶太郎.csv
次回は、色の設定やツールヒント(マウスオーバーした時にポップアップ表示される情報)の設定
計算式を作って、必要な数字を表示する方法などご説明いたします。
ここまでお付き合いいただき、ありがとうございました。
それではまた。。。ノシ~~~~