OCIデータ・フローSQLエンドポイントの分析の概要
Oracle Analytics Cloudを使用して、オブジェクト・ストレージ、データ・レイクおよびアプリケーションのOCIデータ・フローSQLエンドポイントからのデータを分析します。
データ・フローSQLエンドポイントは、開発者、データ・サイエンティストおよび上級アナリストが、データの対話型問合せをデータ・レイク内のデータが存在する場所で直接行えるように設計されています。
OCIデータ・フローSQLエンドポイントを使用する利点
- 大量のイベントおよび時系列データを、パフォーマンスのために移動して要約することなく、データ・レイク上でインプレースで分析できます。
- 複数のアプリケーションおよびデータ・ストア(たとえば、エンタープライズ・リソース・プランニング)のデータをオブジェクト・ストレージに統合し、データの発生元に関係なくアドホック問合せを実行できます。
- 抽出や事前集計を省略して、任意のレベルの粒度でライブ・データを処理できます。 そのため、データを準備する際の時間と労力を節約できるだけでなく、より強力な分析機能を利用できます。
パフォーマンスのベスト・プラクティス
Sparkクラスタ層で索引作成およびキャッシュを活用するために、単一の表またはビューに基づくデータセットを作成します。 複数表の結合に基づくデータセットはサポートされていますが、推奨されません。- OCIデータ・フローSQLエンドポイント・クラスタを構成する場合、次のように
incrementalCollect
をtrueに設定します:spark.sql.thriftServer.incrementalCollect=true;
OCIデータ・フローSQLエンドポイントからのデータのビジュアル化
Oracle Analytics Cloudワークブック・エディタで、複数のOCIデータ・フローSQLエンドポイントの表またはキューブを追加します。 表またはキューブを選択すると、分析のためにディメンション列とメジャー列をデータセットに追加できます。