ビジネス・レポートおよび予測のためのOracle Modern Data Platformの使用について

この設計では、ビジネス・レポートと予測にOracle Modern Data Platformを使用することを検討します。

企業が社内および社外のソースから大量の製品販売データを持つユースケースについて考えてみます。履歴および最近の売上データには会社にとって価値がありますが、ほとんどの場合、日々の業務で使用されるのは最近の月または年のデータのみです。このデータのコンシューマは、レポート、分析および予測にこのデータを使用するビジネス・ユーザーです。従業員の生産性を最大化するために、レポートやダッシュボードで結果を迅速に戻したいと考えています。

従来、企業は前述のようなユースケースを報告するために、リレーショナル・データベースに基づくデータウェアハウスに依存していました。ただし、これらの実装にはいくつかの制限があり、スケーラビリティとパフォーマンスはそれらの制限の中で最も顕著です。

アーキテクチャ

より最新のアプローチは、OCI Object Storageで構成されるデータレイクハウス・アーキテクチャ、Hadoop、Spark、Columnarなどのビッグ・データ・テクノロジ、またはレポート用の従来のデータベースを使用することです。

Oracle Cloud Infrastructure(OCI)には、最新のデータ・プラットフォームのすべての側面に対応する幅広いツールとサービスがあります。In this solution, we look at a small subset of OCI services that address the architectural requirements.

  1. OCI Object Storage: An internet-scale, high-performance storage platform that offers reliable and cost-efficient data durability.分析データ、およびイメージやビデオなどのリッチ・コンテンツを含む、あらゆるコンテンツ・タイプの非構造化データを無制限に格納できます。
  2. Oracle Big Data Service: 様々なビッグ・データのユースケースおよびワークロード用に設計された管理対象Hadoopサービス。特定のタスクを処理するために使用される存続期間の短いクラスタから、低コストで最高レベルのセキュリティで組織の要件を満たすように水平にスケール・アップできる存続期間の長いクラスタまで。
  3. Oracle Autonomous Database: エラスティックにスケーリングされ、高速問合せパフォーマンスを提供する、使いやすい完全自律型データベース。サービスとして、Autonomous Databaseは、データベース管理を必要としません。
  4. Oracle Analytics Cloud: A scalable and secure public cloud service that empowers business analysts and consumers with modern, AI-powered, self-service analytics capabilities for data preparation, visualization, enterprise reporting, augmented analysis, and natural language processing.

次の図は、アーキテクチャを示しています。
oci-modern-data-reporting-arch.pngの説明が続きます
図oci-modern-data-reporting-arch.pngの説明

oci-modern-data-reporting-arch-oracle.zip

前述の各アーキテクチャ・コンポーネントは、次の方法で連携して動作します。
  • OCI Object Storageレイヤーは、大量のデータを格納するための信頼性とコスト効率に優れた方法を提供します。Object Storageを使用することで、複数のツールおよびサービスで使用できる共通の永続性データ・ストアを使用できます。これにより、データ処理レイヤーをストレージから独立してスケール・アップまたはスケール・ダウンすることもできます。
  • Oracle Big Data Service処理レイヤーは、大量のデータを収集、変換および集計するためのプラットフォームを提供します。
  • データベース・レイヤーは、キュレートされたデータを使用してクライアント・レポート・ツールを提供する高速で効率的な方法として機能します。最近のデータまたは関連データ(あるいはその両方)のみが、このレイヤーに保持されます。
  • Oracle Analytics Cloudでは、データを視覚化し、予測を行うことができます。

このアーキテクチャでは、次のコンポーネントがサポートされています。

  • OCI Data Integration

    Oracle Cloud Infrastructure Data Integrationは、様々なデータ・ソースからAutonomous Data WarehouseOracle Cloud Infrastructure Object StorageなどのターゲットOracle Cloud Infrastructureサービスにデータを抽出、ロード、変換、クレンジングおよび再構築する、フルマネージドのサーバーレス・クラウドネイティブ・サービスです。ETL (extract transform load) leverages fully-managed scale-out processing on Spark, and ELT (extract load transform) leverages full SQL push-down capabilities of the Autonomous Data Warehouse in order to minimize data movement and to improve the time to value for newly ingested data.ユーザーは、直感的でコードレスなユーザー・インタフェースを使用してデータ統合プロセスを設計し、統合フローを最適化して最も効率的なエンジンとオーケストレーションを生成し、実行環境を自動的に割り当ててスケーリングします。Oracle Cloud Infrastructure Data Integrationは、インタラクティブな探索およびデータ準備を提供し、データ・エンジニアがスキーマ変更を処理するルールを定義することでスキーマ・ドリフトから保護するのに役立ちます。

  • ストリーミング

    Oracle Cloud Infrastructure Streamingは、リアルタイムで使用および処理できる継続的な大容量データ・ストリームを収集するための、スケーラブルで耐久性の高いフルマネージド・ストレージ・ソリューションを提供します。ストリーミングは、アプリケーション・ログ、運用テレメトリ、Webクリック・ストリーム・データなど、大量のデータを収集するために使用できます。また、パブリッシュ/サブスクライブのメッセージング・モデルでデータが連続して順番に生成され、処理されます。