メタデータの例

メタデータの例

メタデータの例を挙げる。こんな種類があるという参考用であり、ここに挙げたものがすべてではない。

基本情報

  • テーブル名
  • カラム名
  • データ型
  • スキーマ名
  • 主キー
  • パーティションキー
  • ソートキー

内容の意味・構造

  • カラムの定義
  • 単位
  • 粒度(例:日次、ユーザー単位)
  • 値の範囲・コードリスト
  • デフォルト値
  • NULL許容性

技術属性・物理情報

  • 保存場所(データベース名、ストレージパス)
  • ファイル形式(Parquet / CSV / JSON 等)
  • エンコード方式
  • 圧縮形式
  • インデックス・パーティション構成
  • 容量・レコード数(最新/累計)

運用・管理情報

  • 更新頻度(リアルタイム、日次、週次)
  • データ提供元システム・API
  • データオーナー(部門・担当者)
  • 運用担当者(問い合わせ窓口)
  • 保守契約・SLA

セキュリティ・制限

  • 利用権限(閲覧・編集・削除)
  • 機密区分(公開/社内/要承認/秘)
  • 個人情報・要配慮個人情報の有無
  • マスキング・暗号化有無
  • アクセス制御ポリシー
  • ログ監査設定

品質・統計情報

  • 件数(最新スナップショット)
  • 欠損率
  • ユニーク数
  • 主要指標の統計値(平均・中央値・最大・最小)
  • 異常値・外れ値の有無
  • 品質チェック結果(過去履歴含む)

関連・依存関係

  • 外部キー
  • 派生元テーブル(リネージ)
  • 関連テーブル/ビュー
  • 関連ダッシュボード・レポート
  • 依存するETL処理・バッチ

利用者・アクセス状況

  • 主な利用部門・チーム
  • 主要ユーザー
  • 最終利用日時
  • 利用頻度
  • アクセスログ・利用統計

バージョン・変更履歴

  • スキーマ変更日
  • 変更内容(追加・削除・型変更)
  • 旧カラム名・互換情報
  • マイグレーション履歴
  • 過去バージョンの参照方法

モデル・分析適性

  • 時系列分析可否
  • 目的変数としての利用可否
  • 説明変数としての利用可否
  • リーケージ(未来情報混入)の有無
  • 分析における注意点(バイアス、サンプリング)

表示・ラベル情報

  • BI上の項目名
  • 表示ラベル(略称、ユーザーフレンドリー名)
  • 表示順序
  • グループ化・階層ラベル

自動化・連携設定

  • ETL処理名
  • DAG名(Airflow等)
  • 更新トリガー(イベント/スケジュール)
  • ワークフローID・ジョブID
  • 依存ジョブ/連携システム

データ鮮度・タイムライン

  • 最新更新日時
  • データ遅延時間(実測値)
  • SLA(最大遅延許容)
  • バックフィル有無・期間

利用文脈・意図

  • 利用目的(分析・業務・外部提供)
  • 想定シナリオ(例:顧客分析、KPI監視)
  • ターゲットユーザー層(アナリスト/経営層/オペレーション)

データ生成・取得元

  • 元システム・サービス名
  • データ生成タイミング(リアルタイム/バッチ)
  • 収集方法(ETL/ELT/ストリーム)
  • データ収集開始日(履歴の起点)

法務・コンプライアンス

  • 適用法規(個人情報保護法、GDPR 等)
  • データ保持期限
  • 削除・匿名化ポリシー
  • 監査証跡の保存有無

パフォーマンス・容量

  • データ量の推移(レコード数・サイズ)
  • 増加速度(件数/日)
  • パフォーマンス指標(クエリ速度、スキャン量)
  • インデックス・キャッシュ利用状況

可用性・復旧

  • バックアップ有無と頻度
  • リストア手順
  • 災害対策(DRサイト有無)

データリネージ(系譜)

  • 上流・下流テーブルの一覧
  • 加工・変換の主要ステップ
  • リネージ図へのリンク

モニタリング・アラート

  • 監視対象メトリクス(遅延、欠損率、件数変動)
  • アラート発報条件・閾値
  • アラート通知先(Slack / PagerDuty 等)
  • 担当窓口(オンコール連絡先)

将来計画・メモ

  • 廃止予定・リプレース計画
  • 改修予定(スキーマ追加、列削除)
  • 管理者メモ・非公式情報