基本KPIや応用KPIが決まり,
データパイプラインとワークフロー管理
データパイプライン (以下,
また,
ワークフロー管理 とは,
パイプラインを実現するのに,
- 自分でスクリプトを書く
(リトライ制御などもスクリプトの中に記述する)。 - Jenkinsを用いる
(Jenkinsには依存解決, エラー通知など, ワークフロー管理に必要な機能がある)。 - JP1を用いる
(国内のIT部門では定番のワークフロー管理システム)。
しかし,
ETLツールとの違い
ところで,
ETLツールは,
今後,
ワークフロー管理の役割
前提として,
大量のデータを扱う場合,
ここで最後のアウトプットで予期せぬエラーが発生し,
ワークフロー管理の役割のひとつは,
もうひとつ重要な役割が,
そこで必要になるのが
最後に必要なのが,
これらが,