データ・フロー

Data Flowは、フルマネージドのサーバーレスApache Sparkサービスであり、分析のために大規模な分散データ処理を実行するために使用されます。これにより、チームは、Sparkクラスタのプロビジョニングや管理を行わずに、バッチETL/ELTパイプライン、データ準備、機能エンジニアリングおよび集計を実行できます。データ・フローは、実行ごとにオンデマンドで計算をプロビジョニングし、自動スケーリングして、ジョブが完了したらリソースを解放します。これにより、断続的およびスケジュールされたワークロードのコスト効率の高い実行が可能になります。このサブジェクト領域では、データ・フロー・プールとその詳細を追跡できます。

ビジネス上の質問

サブジェクト領域は、次のビジネス上の質問に回答できます。

  • データ・フロー・プール数はいくつですか。
  • プールで現在アクティブに使用されているノードの数はいくつですか。
  • プールを現在使用している実行数はいくつですか。
  • 現在アクティブなデータ・フロー・プールはいくつですか。
  • プール数は時間とともにどのように変化しましたか(毎月)。
  • コンパートメント全体のプール数はいくつですか。

論理モデル

データ・フロー・サブジェクト領域は、関係駆動型の論理モデルに基づいています。

次の図は、データ・フロー・プールのファクト表がディメンション表とどのように関連しているかを示しています。


プール、コンパートメント、リージョン、テナンシおよび日付ディメンションに接続されたデータ・フロー・プール表との関係図。

メトリック詳細

このサブジェクトエリアのファクトフォルダには次の基準が含まれます。

データ・フローのメトリック詳細
メトリック 摘要
データ・フロー・プール数 ファクト・ビューのocira_fact_keyからのCOUNT(ocira_fact_key) (ocira$fact_keyにマップ)
アイドル・タイムアウト(分間) プールに構成されているアイドル・タイムアウトを指定します
プール・メトリックのアクティブな実行数 プールを現在使用している実行の数が表示されます。
アクティブに使用されたプール・メトリックのノード数 このプールで現在アクティブに使用されているノードの数を指定します