収集フェーズにおける主課題:「データが手に入らない」
データがなければどうにもならない
「意思決定と分析のプロセス」の各フェーズはそれぞれがとても大きな問題だ。その中でも本ガイドでは収集フェーズに注目する。
その理由は、どんな分析でも材料となるデータがなければどうにもならないからだ。
この状態は単一の原因ではなく、2段階の構造に分けて捉える必要がある。
- そもそも存在しない(記録されていない、残っていない)
- 存在はするが手元にない(アクセスできない、使えない形式)
教科書では「必要なデータが手元にある前提」で話が進むが、実際にはこの収集フェーズで詰まるケースが非常に多い。
だからこそ、分析に入る前に、「そのデータは本当に存在するか?」「今、使える状態にあるか?」という確認が不可欠になる。
データがそもそも存在しない
- 業務として記録されていない
- 過去は保存していなかった(ログの保存期間が短い等)
- 欲しい単位・粒度でそもそも作られていない(例:日次が必要だが月次しかない)
- 不可視なプロセスに依存している(例:人的判断、電話対応、口頭依頼)
この場合、データは「作られていない/残っていない」ため、分析に使うことはできない。対応策は、大きく分けて2つある。
1つは、将来に向けて記録ルールを整備する/仕組みを変えることだ。今後のためにログを残す、記録粒度を見直す、システム改修を行うなどの対応を行う。
もう1つは、必要になってから生成・獲得を開始する。ただしこの場合、過去にはさかのぼれない。
データは存在するが手元にない
- 他部署・ベンダーが管理していてアクセスできない
- 申請・承認が必要でスムーズに取得できない
- APIやデータ連携の仕組みが整っていない
- 特定の担当者に依存しており属人化している
- データ形式や保存場所がバラバラで見つけられない
- 外部データで費用がかかるため取得を断念せざるを得ない
この場合、「あるのに取れない」という構造になっており、技術的・組織的な対応が求められる。