お茶太郎のデータドリブン運用ルール(O-DDR) フォルダ編

はじめに

データドリブンの仕事に10年近く携わってきた。

前職の環境上、対象とする顧客・業界はとてつもなく広かったのだが、データドリブンという狭い領域で仕事をしてきて、困ったことがあった。
それは、仕事を進める上でのルールが無かったことだ。

人の生活の表面的な部分では、法律のような明示的ルール、習慣・慣習という暗黙のルール。
世の中はルールというものがあるからこそ、他者とのやりとりがスムーズにできる(それでもトラブルも多いですが)。

では、データドリブンにおける仕事のルールはいかがでしょう?
そもそも、私の前職では新しい業務の立ち上げを一人でしていたため、ルールなど存在しませんでした。
一人でやっている分にはルールなどなくても困らないのですが、業務が増えてきたり、人の出入りが発生したり、複数のプロジェクトが同時進行したりとなったところ、混乱と共有の為の負荷増大が起こりました。

そんな状況下で、走りながら作っていったルール、これからデータを扱う中でこうしていこうと思うルールをここにまとめておく。
運用ルールで目指す目標は、アドホックな業務について「共有を簡単に」「作業のデグレードによるやり直しを回避」「数年後でも作業フロー確認が容易にできること(手順がそのままフローを示すことでマニュアル作成を極力無くす)」などです。

転職により環境が大きく変わりました。
前職の経験を忘れないための備忘録、およびこれから一緒にお仕事をすることとなるかもしれないパートナーへ向けてのルールブック、そしてお仕事をする上で運用にお困りの方の一助になれば幸いです。

注意
ビックデータの取り扱いはしていなかったので、Windowsで取り扱える2G以下のファイル、エクセルの処理が対象となります。
また、素人が経験上考え、対応してきたルールです。
大きな開発などされる企業のルールには及ばないかもしれません。
もし、もっと良いルールがあれば、ご指導いただければ幸いです。
コメント欄にコメント頂けますでしょうか?

初回は、フォルダ、ファイルの運用ルールです。

フォルダ、ファイル名称のルール

フォルダ名のルール

案件(プロジェクト)フォルダの運用ルール

Nas上で共有する場合、フォルダ名にルールがないと検索するのに時間がかかります。
フォルダが見つからなかったため、新規にフォルダを追加作成し続け、結果として同じようなフォルダが乱立するケースが良くあります。
フォルダ作成のルールを明示化すれば、このような混乱を避けることができます。

個人用PC内のフォルダも同じルールで運用していけば、メンバーが増えた時などの共有時もスムーズにできると思います。

案件(プロジェクト)フォルダ名称ルール

  • 『年月(yyyymm)+”_”+企業名_案件名』をフォルダ名に入れる
  • 同じクライアントからの発注で複数案件が発生する場合は、『年月+”_”+企業名』でまずフォルダを作成。その下に案件ごとのフォルダ『年月(yyyymm)+”_”+案件名』とする。

 

お茶太郎
まず、案件ごとのフォルダは時系列で管理できるように頭文字に数値を付けた方が良いぞ。
いきなりクライアント名・案件名にしてしまうと、案件が名称でソートされるから最新で動いている案件を見失うからな。
で。。。フォルダ名の頭文字は通し番号でも良いけどな、年月の方がいつ頃から始まっている案件かわかるからおじさんは好きだぞ。
いつ頃の案件かわかれば、誰に聞いた方が良いか(古株・中堅・新人など)判断できるからな。
通し番号にしても、結局誰に確認しようかと考えるとき、フォルダの作成日・更新日を確認することになるからな。
フォルダ名に入れておけばいいんだよ。

 

業務ステップ別のフォルダ名称ルール

案件別フォルダ内には業務内容別のフォルダを作成します。
この時、業務のステップごとにフォルダを分けていきましょう。
イメージとしては「初期問合せ」→「見積・スケジュール検討」→「企画・仕様確認」→「データ加工」→「Viz作成」などとなります。

ステップ別フォルダ名称ルール

  • ソート順の最初は『_Work』
    このフォルダは、下位階層でも準備する。ごみ箱に入れる前のごみ予備軍フォルダのイメージ。
    「いらないかもしれないが、消すと不安」というものが貯まる。
    結局消せずに残って、NASの容量を圧迫する。
    業務完了時には、「_Work」フォルダ削除も検討しましょう。
    ただ、残している事が救いになることが稀にあります。
  • 業務のステップごとのフォルダ『数値三桁(nnn)+”_”+ステップ名』とする。
    時系列に並び順がわかれば、日付10桁でもOK。
  • ステップは、問合せから最終納品へ、作業のステップ手順となるようにナンバリングしていく。

お茶太郎
ここの頭文字は通し番号だぞ。
業務の進み具合がわかるように、ナンバリングしていくぞ。
あと、仕事していると「データ間違ってました。こちらを使ってください」なんてことが起きて、受領データ以下の作業をやり直すことが意外にある。
そのときは、「20201105_BU」みたいなフォルダを作って、「003_受領データ」以降のフォルダを全部ぶち込む。そのフォルダは、そのまま「_Work」フォルダにぶち込め!!
そして、003以降再度やり直す。

この時、再利用の必要性がなければ、過去の下位フォルダ、ファイルは綺麗に削除。空の状態のフォルダをつくる。再利用が必要であれば、「_Work」フォルダからコピーだな。

あと、複数フォルダ(ステップ)をまとめて圧縮してZipファイルにしてしまうのも、お薦めだ!!

データ差し替えなどによる後戻りって、結構バタバタする。
データなどのデグレード(間違って古いもの使わないように)に気を付ける事とやり直しができる状態とすること。
最新の状態、正しいデータが何なのか、チームで混乱しないように管理することが重要だぞ!!

 

ステップ別フォルダ運用ルール ①見積フォルダ例

まずは見積フォルダの運用を例に説明します。
ここでも、「_Work」フォルダを使いましょう。

ステップ別フォルダ運用ルール ①見積フォルダ例

  • ソート順の最初は『_Work』
    運用は同じ。「いらないかもしれないが、消すと不安」というものが貯まる。
    過去に提出したが没になったものは、どんどんここに退避しましょう。
  • ステップフォルダ内には、最終ファイル(ここであれば、見積とスケジュール)を残す。
  • ファイル名には、そのファイルがFIXした日付(yyyymmdd)を付ける。
    FIX前の途中段階であれば作成日を入れる。
  • 見積提出時のメールもファイルとして、そのまま残す。

 

お茶太郎
ここのフォルダは、古い情報は「_Work」フォルダに、最新はここの階層という運用にするぞ。
ここに、古いものと新しいものが残っていると、数年後に確認した時にどれが最新かわからなくなるからな。
ファイル名に「最新」「最終」なんてつけてはいけないぞ。
どれが最新かわからない、「最新」ファイルが乱立することになるからな。

あとな、見積送付時のメールをフォルダに残しておくと、後々助かるぞ。
できれば、メールはASPサービスとかじゃなく、専用のメーラーアプリを使うと良いぞ。
メール自体をフォルダにドラッグ&ドロップすれば、そのままメール内容をファイルとして残せるからな。
「どのメールでやりとりしたか」がわかると、誰が絡んでいたのか、どんなやりとりをしていたかがわかるから便利だぞ。わざわざメモなんかに残す必要もないしな。
あと、メールのタイトルがわかるだけでも、その後のやりとりもメール検索すれば、確認できて便利だぞ。

とにかく、「数年度」もしくは「いつ誰が見ても」【わかる状態】にしておくことだ。

「企画」段階、「データ受領」なんかも運用は同じだぞ。
「常に最新状態のみ残す」だぞ。
最新の状態を残すのが重要だが、むしろ古いファイルを退避するのが重要と思ってもらっても構わないくらいだ。
「念のため」って思って残すのは良いが、最新と同じ階層に混ぜてしまうことで混乱が生じるからな。
すべて「_Work」にぶち込んでおけ!!

 

ステップ別フォルダ運用ルール ②データ加工フォルダ例

次にデータ加工のステップの例。
まあ、加工に限らず、作業のステップが発生する場合はここの運用を参考にしてください。
前職では、Excel&Accessでのデータ加工が多かったので、それを例に説明していきます。
古い体制の業務でしたね。

ステップフォルダ運用ルール ②データ加工フォルダ例

  • ソート順の最初は『_Work』
    運用は同じ。
  • 作業のステップに合わせて、ナンバリング。『数値三桁(nnn)+”_”+ステップ名』。
  • 丁寧に履歴を残したい場合は、「000_」は作業開始のスタートとする最新データをここにも残す。受領データと同じファイルになる。
  • ファイル数が多くなる場合は、最終データを『999_』としておくのもおすすめ
お茶太郎
フォルダ名、ファイル名の基本は、手順に合わせてソートされるように、ナンバリングすることだな。

ここの順番がわかりにくいと、プロジェクト終了の数年後に業務確認することとなった時に苦労することになるぞ。
具体的な確認手順を考えると、まずはタイムスタンプ見ながらどの順番で作業をしたか見ることになる。しかし、タイムスタンプは上書きされると変わっちまうからな。
タイムスタンプで判断できないし信用できねーから、タイムスタンプで順番確認してもしなくても、結局各ファイルをひとつずつ開いて、内容と処理をした順番を確認することになるよな。
処理の手順がわからないファイル群を一つ一つ確認しながら、ステップを追体験するというパズルのようなことをしなくてはならなくなる。
だから、作業ステップに従い、頭文字でナンバリングしておくと、後々楽になるんだぞ。

そして、加工ステップの最初、「000」ナンバーは受領・抽出などしたスタートデータにすることをお勧めするぞ。
業務完了数年後に作業を確認しなくてはならなくなった場合、ここにスタートのデータがあると、安心できるからな。
ただし、「受領フォルダ」との二重管理になるため、世代管理がややこしくなるデメリットもある。今を簡単にして将来少し困るか、今面倒なことをして将来の保険とするかの二択だな。

 

ステップフォルダ運用ルール ③その他

Viz(MotionBoardであればダッシュボード)作成に関する資料や最終データの保存にも、必要であればフォルダを作っておく。
泥臭い運用になるが、もしデータを社内で加工するならば、ここのフォルダを用意することも検討しましょう。

最後に

まず、第一回目はフォルダとファイルの管理について、お茶太郎が勝手に決めた手順を紹介いたしました。

実務を通じて感じた事は、ルールを明示化し、共有することでマニュアル作成が不要になったり、共有のための負荷が軽減したりとメリットがあるということ。

この手順がスタンダードにならなくても良いですが、何かしらのスタンダードができればデータドリブンに携わる人々の仕事が楽になると思っております。
そのきっかけにでもなれば、幸いです。

それでは、本日はこれにて。。。
最後までお付き合いいただき、ありがとうございました。
次は、エクセルファイルでのデータ加工ルールを書いていきます。

それでは、また。。。
ノシ~~~~~