このアーキテクチャは、Oracle Data and AIサービスを使用して幅広いエンタープライズ・データ・リソースからのデータを処理できるクラウド・データ・レイクの能力を示しています。データは、Oracleの内外の両方で様々なソースから検出され、変換用に取り込まれます。RAWデータを測定可能かつ実用的なデータに変換するには、様々なステージでデータを処理する必要があります。
- 検出
- 収集
- 変革
- キュレーション
- 分析、学習、予測
- 測定と行動
次の機能は、Oracle Cloud Infrastructure (OCI)リージョン全体にわたります:
- ガバナンス
- セキュリティ、アイデンティティおよびアクセス管理
- オンプレミスFastConnectは、柔軟なコンピュートとOCIの柔軟なストレージ機能により、オンライン・データ転送を実現しています
- OracleとAzure Interconnectのパートナシップにより、クラウドへの移行とクラウド・ネイティブ・アプリケーションの構築が可能になります。
リージョンは、物理コンポーネントまたは機能コンポーネントを収容する機能レイヤーに分割されます。
- 検出ステージ:エンタープライズ・アプリケーション、Azureおよびその他のデータベース、Oracle Data Cloud、Webクリック、イベント・ストリーム、センサー、メディア、ファイル・オブジェクト・ストアなど、様々なソースからデータを検出できます。
-
Data Refineryレイヤー:データは、このレイヤーの「取込み」ステージを通過します。
- バッチ取込み(OCIデータ統合、ODIおよびDBツール)サービスは、アプリケーション・データを消費します。Oracle Autonomous Data Warehouseは、洗練されたアプリケーション・データを消費します。データ永続性プラットフォーム・レイヤーのクラウド・ストレージは、RAWデータを消費します。
- データ・キャプチャ(GoldenGateおよびODI)およびバルク転送(FastConnect Data Transfer、MFT、CLI)では、生データをすべてのデータ・リファイナリ・パスからデータ永続性および処理レイヤーのクラウド・ストレージに移動できます。
- Streaming Ingest (Streaming Service、 Big Data Service)サービスは、イベント・ストリーム・データを消費します。ストリーミング処理(GoldenGate Stream Analytics)サービスは、ストリーム・データを利用し、データ永続性および処理レイヤーのクラウド・ストレージに転送します。
-
データ永続性および処理レイヤー:データは「変換」ステージおよび「キュレーション」ステージを通過します。このレイヤーを使用すると、現在のビジネス・ビューを表示するためのデータ・ナビゲーションが容易になります。
データ永続性および処理レイヤーは、使用するデータベース・テクノロジがリレーショナルであるか非リレーショナルであるかに基づいてデータを構造化します。ガバナンス(データ・カタログ)は、このレイヤーを通過すると、アプリケーション・データおよびRAWデータに適用されます。
-
アクセスおよび解釈レイヤー:データは分析、学習および予測ステージを通過します。このレイヤーにより、アナリティクス、機械学習およびAIサービス(異常検出など)を使用して、データへのアクセスおよび修復の準備が整います。Oracle Analytics Cloudサービスを使用して、絞り込まれたアプリケーション・データをビジュアル化できます。データ・サイエンティストは、機械学習(データ・サイエンス、OMLノートブック、OML)サービスを利用して、使い慣れたユーザー・インタフェースを使用してモデルを構築およびトレーニングできます。機械学習は、トレーニング・モデルに使用できるRAWデータを消費します。ストリーミング・アナリティクス(GoldenGate Stream Analytics)サービスは、データ・ビジュアライゼーションを提供し、データのアクセスおよび解釈を可能にします。
APIゲートウェイおよびファンクションを通じて使用可能なAPIは、開発者が独自のアプリケーションを構築し、機械学習およびAIサービスを使用して生データを活用するために使用できます。
- メジャーとアクション・ステージ: Oracle Applications Data Warehouseでは、分析済データを活用し、そのデータを使用して学習し、結果を予測できます。拡張分析、ダッシュボードとレポート、機械学習モデル、データ主導型アプリケーション、AI対応サービスなどのメリットすべては、測定を使用して予測を行うことで実現されます。組織は、データ主導型のアプリケーションを使用してデータ主導型のビジネス上の意思決定を行うことで、データを収益化できます。機械学習モデルのトレーニング、ダッシュボードとレポートの作成、拡張分析を行うことができます。