お茶太郎のデータドリブン運用ルール(O-DDR) ダッシュボード編

はじめに

<以下、前回・前々回ブログと同じ書き出しです>

データドリブンの仕事に10年近く携わってきた。

前職の環境上、対象とする顧客・業界はとてつもなく広かったのだが、データドリブンという狭い領域で仕事をしてきて、困ったことがあった。
それは、仕事を進める上でのルールが無かったことだ。

人の生活の表面的な部分では、法律のような明示的ルール、習慣・慣習という暗黙のルール。
世の中はルールというものがあるからこそ、他者とのやりとりがスムーズにできる(それでもトラブルも多いですが)。

では、データドリブンにおける仕事のルールはいかがでしょう?
そもそも、私の前職では新しい業務の立ち上げを一人でしていたため、ルールなど存在しませんでした。
一人でやっている分にはルールなどなくても困らないのですが、業務が増えてきたり、人の出入りが発生したり、複数のプロジェクトが同時進行したりとなったところ、混乱と共有の為の負荷増大が起こりました。

そんな状況下で、走りながら作っていったルール、これからデータを扱う中でこうしていこうと思うルールをここにまとめておく。
運用ルールで目指す目標は、アドホックな業務について「共有を簡単に」「作業のデグレードによるやり直しを回避」「数年後でも作業フロー確認が容易にできること(手順がそのままフローを示すことでマニュアル作成を極力無くす)」などです。

転職により環境が大きく変わりました。
前職の経験を忘れないための備忘録、およびこれから一緒にお仕事をすることとなるかもしれないパートナーへ向けてのルールブック、そしてお仕事をする上で運用にお困りの方の一助になれば幸いです。

第三回は、Tableauでの計算式等作成方法と恣意的なグラフ作成です。

注意
あくまで若輩者の運用ルールです。
大きな気持ちで見守っていただければと思います。
もし、もっと良いルールがあれば、ご指導いただければ幸いです。
コメント欄にコメント頂けますでしょうか?

Tableauでの計算式等ルール(お茶太郎のルール)


計算式作成時には式名称の最初に分類名を付ける。

お茶太郎
数式をいくつもつくると、元データのフィールドと作成した数式が混ざってしまって、探す手間が増える。
だから、名称の最初に数式がまとまって表示され、かつ内容がわかるように、分類名を付けることにしたぞ。
補足
名称は、アンダースコアで文字を囲む。これで視認性があがる。
現時点でのルールは、以下の通り

  • _C_ : 計算式
  • _G_ : グループ
  • _LOD_ : LOD計算
  • _P_ : パラメータ
  • _ビン_ : ビン

そのままですが、視認性はあがりました。

あとは、複雑な数式になったときには、コメントを入れる。
【//】をつけるとコメントになります。

 

グラフの恣意的な表現について

 

続いて、データの表現方法について、考えておきます。
データを可視化する時、Preattentive Attributesという概念があります。

補足
Preattentive Attributesの説明はここでは割愛いたします。
ご興味ある方は、上記リンクのGoogle検索結果ページから、各サイトにジャンプしてご確認ください。
色や形状で、データを強調して、読み手の負荷を低減し、必要な情報を効率的に伝えるもの(あってるかな?。。。)です。
また、表示する数値の範囲を調整するなど無駄な余白をなくしながら、伝えたいことを強調する時もあります。

この時、特に意識していることが「恣意的な表現にならないか」です。
強調するということは、言い換えれば【無駄】な情報を削り取ること、見えづらくすることだと思います。
それは、データの可視化で重要なことではあります。
ただ、気を付けなくてはならないのが、【無駄】という価値基準です。
この【無駄】が普遍的なものなのか、VizのViewにとって本当に不要なものなのか、考えながらデータを可視化しないといけないと思うのです。

例えば、下記のグラフを見てどのような印象を受けるでしょうか?

このグラフは、直近3週間のコロナ感染者の推移をサルビア共和国と比較したものです。
4段階ある警戒レベルの最も深刻なレベル【感染が拡大していると思われる】へ引き上げられたという状況でも、恣意的にグラフを加工すると印象は大きく変わってしまいます。

お茶太郎
「あぁ、まだそんなに心配するこたーねーな」って感じになるわな。

では、改めて下記データを使って印象操作できるようなVizを目指してみましょう!!
データ出展:Novel Coronavirus (COVID-19) Cases Data
https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000068

どのような印象となるかを主眼とするため、あえてコメントはいれません。


日本の感染者数(7日移動平均あり)


感染者数 US-Japan


表示期間を短くしてみる


比較対象を加える


表示する数値の範囲を限定する


まとめ

今回は、他のデータとの比較、表示する範囲の調整でどのように印象が変わるかを試してみました。
色やサイズによっても印象がどう変わるか試してみるのも良いでしょう。

忘れてはならないことは、「重要な部分を強調するが、恣意的にReaderを誘導するようなVizはつくらない」

モラルをもって、正しい分析・可視化を心がけてきたいと思います。

それでは、今回はこれにで。。。

駄文にお付き合いいただき、ありがとうございました。
では、またノシ~~~~~~

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です