収集フェーズにおける主課題:「データが手に入らない」

データがなければどうにもならない

「意思決定と分析のプロセス」の各フェーズはそれぞれがとても大きな問題だ。その中でも本ガイドでは収集フェーズに注目する。

その理由は、どんな分析でも材料となるデータがなければどうにもならないからだ。

この状態は単一の原因ではなく、2段階の構造に分けて捉える必要がある。

  1. そもそも存在しない(記録されていない、残っていない)
  2. 存在はするが手元にない(アクセスできない、使えない形式)

教科書では「必要なデータが手元にある前提」で話が進むが、実際にはこの収集フェーズで詰まるケースが非常に多い。

だからこそ、分析に入る前に、「そのデータは本当に存在するか?」「今、使える状態にあるか?」という確認が不可欠になる。

データがそもそも存在しない

  • 業務として記録されていない
  • 過去は保存していなかった(ログの保存期間が短い等)
  • 欲しい単位・粒度でそもそも作られていない(例:日次が必要だが月次しかない)
  • 不可視なプロセスに依存している(例:人的判断、電話対応、口頭依頼)

この場合、データは「作られていない/残っていない」ため、分析に使うことはできない。対応策は、大きく分けて2つある。

1つは、将来に向けて記録ルールを整備する/仕組みを変えることだ。今後のためにログを残す、記録粒度を見直す、システム改修を行うなどの対応を行う。

もう1つは、必要になってから生成・獲得を開始する。ただしこの場合、過去にはさかのぼれない。

データは存在するが手元にない

  • 他部署・ベンダーが管理していてアクセスできない
  • 申請・承認が必要でスムーズに取得できない
  • APIやデータ連携の仕組みが整っていない
  • 特定の担当者に依存しており属人化している
  • データ形式や保存場所がバラバラで見つけられない
  • 外部データで費用がかかるため取得を断念せざるを得ない

この場合、「あるのに取れない」という構造になっており、技術的・組織的な対応が求められる。