OCIデータ・フローSQLエンドポイントの分析の概要

Oracle Analytics Cloudを使用して、オブジェクト・ストレージ、データ・レイクおよびアプリケーションのOCIデータ・フローSQLエンドポイントからのデータを分析します。

データ・フローSQLエンドポイントは、開発者、データ・サイエンティストおよび上級アナリストが、データの対話型問合せをデータ・レイク内のデータが存在する場所で直接行えるように設計されています。

OCIデータ・フローSQLエンドポイントを使用する利点

  • 大量のイベントおよび時系列データを、パフォーマンスのために移動して要約することなく、データ・レイク上でインプレースで分析できます。
  • 複数のアプリケーションおよびデータ・ストア(たとえば、エンタープライズ・リソース・プランニング)のデータをオブジェクト・ストレージに統合し、データの発生元に関係なくアドホック問合せを実行できます。
  • 抽出や事前集計を省略して、任意のレベルの粒度でライブ・データを処理できます。そのため、データを準備する際の時間と労力を節約できるだけでなく、より強力な分析機能を利用できます。
パフォーマンスのベスト・プラクティス


  • Sparkクラスタ層で索引作成およびキャッシュを活用するために、単一の表またはビューに基づくデータセットを作成します。複数表の結合に基づくデータセットはサポートされていますが、推奨されません。
  • OCIデータ・フローSQLエンドポイント・クラスタを構成する場合、次のようにincrementalCollectをtrueに設定します:

    spark.sql.thriftServer.incrementalCollect=true;

OCIデータ・フローSQLエンドポイントからのデータのビジュアル化

Oracle Analytics Cloudワークブック・エディタで、複数のOCIデータ・フローSQLエンドポイントの表またはキューブを追加します。表またはキューブを選択すると、分析のためにディメンション列とメジャー列をデータセットに追加できます。