メタデータの例
メタデータの例
メタデータの例を挙げる。こんな種類があるという参考用であり、ここに挙げたものがすべてではない。
基本情報
- テーブル名
- カラム名
- データ型
- スキーマ名
- 主キー
- パーティションキー
- ソートキー
内容の意味・構造
- カラムの定義
- 単位
- 粒度(例:日次、ユーザー単位)
- 値の範囲・コードリスト
- デフォルト値
- NULL許容性
技術属性・物理情報
- 保存場所(データベース名、ストレージパス)
- ファイル形式(Parquet / CSV / JSON 等)
- エンコード方式
- 圧縮形式
- インデックス・パーティション構成
- 容量・レコード数(最新/累計)
運用・管理情報
- 更新頻度(リアルタイム、日次、週次)
- データ提供元システム・API
- データオーナー(部門・担当者)
- 運用担当者(問い合わせ窓口)
- 保守契約・SLA
セキュリティ・制限
- 利用権限(閲覧・編集・削除)
- 機密区分(公開/社内/要承認/秘)
- 個人情報・要配慮個人情報の有無
- マスキング・暗号化有無
- アクセス制御ポリシー
- ログ監査設定
品質・統計情報
- 件数(最新スナップショット)
- 欠損率
- ユニーク数
- 主要指標の統計値(平均・中央値・最大・最小)
- 異常値・外れ値の有無
- 品質チェック結果(過去履歴含む)
関連・依存関係
- 外部キー
- 派生元テーブル(リネージ)
- 関連テーブル/ビュー
- 関連ダッシュボード・レポート
- 依存するETL処理・バッチ
利用者・アクセス状況
- 主な利用部門・チーム
- 主要ユーザー
- 最終利用日時
- 利用頻度
- アクセスログ・利用統計
バージョン・変更履歴
- スキーマ変更日
- 変更内容(追加・削除・型変更)
- 旧カラム名・互換情報
- マイグレーション履歴
- 過去バージョンの参照方法
モデル・分析適性
- 時系列分析可否
- 目的変数としての利用可否
- 説明変数としての利用可否
- リーケージ(未来情報混入)の有無
- 分析における注意点(バイアス、サンプリング)
表示・ラベル情報
- BI上の項目名
- 表示ラベル(略称、ユーザーフレンドリー名)
- 表示順序
- グループ化・階層ラベル
自動化・連携設定
- ETL処理名
- DAG名(Airflow等)
- 更新トリガー(イベント/スケジュール)
- ワークフローID・ジョブID
- 依存ジョブ/連携システム
データ鮮度・タイムライン
- 最新更新日時
- データ遅延時間(実測値)
- SLA(最大遅延許容)
- バックフィル有無・期間
利用文脈・意図
- 利用目的(分析・業務・外部提供)
- 想定シナリオ(例:顧客分析、KPI監視)
- ターゲットユーザー層(アナリスト/経営層/オペレーション)
データ生成・取得元
- 元システム・サービス名
- データ生成タイミング(リアルタイム/バッチ)
- 収集方法(ETL/ELT/ストリーム)
- データ収集開始日(履歴の起点)
法務・コンプライアンス
- 適用法規(個人情報保護法、GDPR 等)
- データ保持期限
- 削除・匿名化ポリシー
- 監査証跡の保存有無
パフォーマンス・容量
- データ量の推移(レコード数・サイズ)
- 増加速度(件数/日)
- パフォーマンス指標(クエリ速度、スキャン量)
- インデックス・キャッシュ利用状況
可用性・復旧
- バックアップ有無と頻度
- リストア手順
- 災害対策(DRサイト有無)
データリネージ(系譜)
- 上流・下流テーブルの一覧
- 加工・変換の主要ステップ
- リネージ図へのリンク
モニタリング・アラート
- 監視対象メトリクス(遅延、欠損率、件数変動)
- アラート発報条件・閾値
- アラート通知先(Slack / PagerDuty 等)
- 担当窓口(オンコール連絡先)
将来計画・メモ
- 廃止予定・リプレース計画
- 改修予定(スキーマ追加、列削除)
- 管理者メモ・非公式情報