Microsoft Azure SynapseおよびOracle Autonomous Databaseを使用したマルチクラウド分析パイプラインのデプロイ
このアーキテクチャでは、Azure統合ランタイム(IR)を使用して、Azure Synapse Analyticsのプライベート・エンドポイントを作成します。Synapseトラフィックは、プライベートOracle Interconnect for Azureを介してOCI上のOracle Autonomous Database on Shared Exadata Infrastructureのプライベート・エンドポイントにルーティングされます。
- マルチクラウド・データ分析パイプラインがリアルタイムのビジネス・インサイトを提供
- Oracle Autonomous Databaseは、低TCOの機械学習主導型マネージド・サービスを提供します
- Oracle Interconnect for Azureは、専用の高帯域幅の低レイテンシのネットワーク接続を提供します
- Azure Synapse Analyticsは、データ統合、エンタープライズ・データ・ウェアハウスおよびビッグ・データ分析を統合します
アーキテクチャ
このアーキテクチャは、Oracle Cloud Infrastructure (OCI)上のOracle E-Business SuiteおよびMicrosoft Azure上のAzure Synapse Analyticsを使用した一般的なマルチクラウド・デプロイメントを示しています。
Oracle E-Business Suiteフル・スタックはOCIにデプロイされます。本番Oracle E-Business Suiteデータは、Oracle Cloud Infrastructure GoldenGateを使用してOracle Autonomous Data Warehouseにリアルタイムでレプリケートされます。Azure Synapse Analyticsは、Oracle Interconnect for Azureを通じてデータ・ウェアハウスに直接アクセスします。Oracle Interconnect for Azureは、AzureとOCIの間の専用の高帯域幅および低レイテンシ接続を提供します。
次の図は、このリファレンス・アーキテクチャを示しています。
図multicloud-data-analytics-pipeline-azure.pngの説明
multicloud-data-analytics-pipeline-azure-oracle.zip
オンプレミス・アプリケーションおよびユーザーは、VPNまたはOracle Cloud Infrastructure FastConnectやAzure ExpressRouteなどの専用接続を介して両方のクラウドに接続します。
OCIとAzureの間のプライベート相互接続では、プライベートIPまたはエンドポイントを使用してトラフィックをルーティングします。プライベート・エンドポイントを使用するAutonomous Databaseは、Azureとの相互接続を使用してOCIリージョンにデプロイされます。Azure Synapse Analyticsは、Oracleデータベースのプライベート・エンドポイントを持たないPlatform-as-a-Service (PaaS)製品です。ただし、Azureは、仮想マシン(VM)にデプロイし、Oracle Autonomous DatabaseとAzure Synapseの間にブリッジできる、自己ホスト型の統合ランタイム(IR)を提供しています。Azure Managed Virtual Network (VNet) for Synapseワークスペースは Oracle Database for Azure VNetに直接接続できないため。IRをデプロイするには、自己管理VNetが必要です。
自己ホスト統合ランタイム・ホストにはネットワーク帯域幅の制限があり、必要なウィンドウ内で大量のデータを自律型データベースからAzure Synapse Analyticsに転送するには十分ではない可能性があります。高可用性のために複数のIRをデプロイすることをお薦めします。
OCIには、次のコンポーネントがあります。
- リージョン
Oracle Cloud Infrastructureリージョンは、可用性ドメインと呼ばれる1つ以上のデータ・センターを含むローカライズされた地理的領域です。リージョンは他のリージョンから独立しており、広大な距離で(複数の国または複数の大陸にまたがる)リージョンを分離できます。
- 可用性ドメイン
可用性ドメインは、リージョン内の独立したスタンドアロン・データ・センターです。各可用性ドメイン内の物理リソースは、他の可用性ドメイン内のリソースから分離されているため、フォルト・トレランスが提供されます。可用性ドメインどうしは、電力や冷却、内部可用性ドメイン・ネットワークなどのインフラを共有しません。そのため、ある可用性ドメインでの障害がリージョン内の他の可用性ドメインに影響することはほとんどありません。
- 仮想クラウド・ネットワーク(VCN)およびサブネット
VCNは、Oracle Cloud Infrastructureリージョンで設定する、カスタマイズ可能なソフトウェア定義のネットワークです。VCNは、従来のデータ・センター・ネットワークと同様に、ネットワーク環境の完全な制御を可能にします。VCNには重複しない複数のCIDRブロックを含めることができ、VCNの作成後にそれらを変更できます。VCNをサブネットにセグメント化して、そのスコープをリージョンまたは可用性ドメインに設定できます。各サブネットは、VCN内の他のサブネットと重複しない連続した範囲のアドレスで構成されます。サブネットのサイズは、作成後に変更できます。サブネットはパブリックにもプライベートにもできます。
- Bastionサービス
Oracle Cloud Infrastructure Bastionは、パブリック・エンドポイントがなく、ベア・メタルや仮想マシン、Oracle MySQL Database Service、Autonomous Transaction Processing (ATP)、Oracle Container Engine for Kubernetes (OKE)、およびSecure Shell Protocol (SSH)アクセスを許可するその他のリソースなど、厳密なリソース・アクセス制御を必要とするリソースへの制限および時間制限付きのセキュア・アクセスを提供します。Oracle Cloud Infrastructure Bastionサービスでは、ジャンプ・ホストをデプロイおよび保守せずにプライベート・ホストへのアクセスを有効にできます。さらに、アイデンティティ・ベースの権限と集中管理された監査済および期限付きSSHセッションにより、セキュリティ・ポスチャが向上します。Oracle Cloud Infrastructure Bastionを使用すると、要塞アクセス用のパブリックIPが不要になり、リモート・アクセスを提供する際の手間や潜在的な攻撃対象領域が排除されます。
- ロード・バランサ
Oracle Cloud Infrastructure Load Balancingサービスは、単一のエントリ・ポイントからバックエンドの複数のサーバーへの自動トラフィック分散を提供します。
- Oracle E-Business Suite
Oracle E-Business Suiteは、組織による適切な意思決定、コスト削減、パフォーマンスの向上を可能にする統合ビジネス・アプリケーション・スイートです。顧客関係管理、サービス管理、財務管理、人材管理、プロジェクト・ポートフォリオ管理、高度な調達、サプライ・チェーン管理、バリュー・チェーン・プランニングおよびバリュー・チェーン実行のソリューションを提供します。
- Oracle E-Business Suiteクラウド・マネージャ
Oracle E-Business Suite Cloud Managerは、Oracle Cloud Infrastructure上のOracle E-Business Suiteのすべての主な自動化フローを駆動するWebベースのアプリケーションです。新しい環境のプロビジョニング、それらの環境でのライフサイクル管理アクティビティの実行、オンプレミスからの環境のリストアなどが含まれます。
Oracle E-Business Suite Cloud Managerは、Oracle E-Business Suiteデータベース管理者(DBA)が毎日実行する多様なタスクを簡素化するように設計されています。
- Oracle Cloud Infrastructure GoldenGate
Oracle Cloud Infrastructure GoldenGateは、オンプレミスまたは任意のクラウドに存在するソースからのデータ取込みを可能にするフルマネージド・サービスであり、Oracle Autonomous Data Warehouseへのデータの侵入性と効率的な取得のためのGoldenGate CDCテクノロジを活用して、関連情報をできるだけ迅速に利用できるようにします。
- Autonomous Database
Oracle Autonomous Databaseは、トランザクション処理およびデータ・ウェアハウス・ワークロードに使用できるフルマネージドの事前構成済データベース環境です。ハードウェアの構成や管理、ソフトウェアのインストールを行う必要はありません。Oracle Cloud Infrastructureでは、データベースの作成、およびデータベースのバックアップ、パッチ適用、アップグレードおよびチューニングが処理されます。
- データ・セーフ
Oracle Data Safeは、完全に統合されたリージョン別クラウド・サービスであり、Oracleデータベース内の機密データおよび規制対象データを保護するための完全な機能セットを提供します。Data Safe also supports on-premises databases, Oracle Exadata Database Service on Cloud@Customer, and multicloud deployments.Oracle Databaseのすべてのお客様は、Oracle Data Safeを使用して構成とユーザー・リスクの評価、ユーザー・アクティビティのモニターと監査、および機密データの検出、分類およびマスキングを行うことで、データ侵害のリスクを軽減し、コンプライアンスを簡素化できます。
- オブジェクト・ストレージ
オブジェクト・ストレージでは、データベースのバックアップ、分析データ、イメージやビデオなどのリッチ・コンテンツなど、あらゆるコンテンツ・タイプの構造化データおよび非構造化データにすばやくアクセスできます。インターネットから直接またはクラウド・プラットフォーム内から、安全かつセキュアにデータを格納し、取得できます。パフォーマンスやサービスの信頼性を損なうことなく、シームレスにストレージを拡張できます。迅速、即時、頻繁にアクセスする必要があるホット・ストレージには、標準ストレージを使用します。長期間保持し、ほとんどまたはほとんどアクセスしないコールド・ストレージには、アーカイブ・ストレージを使用します。
- 監査
Oracle Cloud Infrastructure Auditサービスでは、Oracle Cloud Infrastructureのサポートされるすべてのパブリック・アプリケーション・プログラミング・インタフェース(API)エンドポイントへのコールがログ・イベントとして自動的に記録されます。現在、すべてのサービスがOracle Cloud Infrastructure Auditによるロギングをサポートしています。
- ロギングLoggingは、クラウド内のリソースから次のタイプのログへのアクセスを提供する高度にスケーラブルで完全管理型のサービスです:
- 監査ログ: Auditサービスによって発行されるイベントに関連するログ。
- サービス・ログ: APIゲートウェイ、イベント、ファンクション、ロード・バランシング、オブジェクト・ストレージ、VCNフロー・ログなどの個々のサービスによって発行されたログ。
- カスタム・ログ: カスタム・アプリケーション、他のクラウド・プロバイダまたはオンプレミス環境からの診断情報を含むログ。
- ポリシー
Oracle Cloud Infrastructure Identity and Access Managementポリシーでは、誰がどのリソースにどのようにアクセスできるかを指定します。アクセス権はグループ・レベルおよびコンパートメント・レベルで付与されます。つまり、特定のコンパートメントまたはテナンシ内の特定のアクセスのタイプをグループに付与するポリシーを記述できます。
- アイデンティティおよびアクセス管理(IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) is the access control plane for Oracle Cloud Infrastructure (OCI) and Oracle Cloud Applications.IAM APIおよびユーザー・インタフェースを使用すると、アイデンティティ・ドメインおよびアイデンティティ・ドメイン内のリソースを管理できます。各OCI IAMアイデンティティ・ドメインは、スタンドアロンのアイデンティティおよびアクセス管理ソリューションまたは異なるユーザー人口を表します。
- Dynamic routing gateway (DRG)
DRGは、VCNとリージョン外部のネットワーク(別のOracle Cloud InfrastructureリージョンのVCN、オンプレミス・ネットワーク、別のクラウド・プロバイダ内のネットワークなど)間の、同じリージョン内のVCN間のプライベート・ネットワーク・トラフィックのパスを提供する仮想ルーターです。
- インターネット・ゲートウェイ
インターネット・ゲートウェイにより、VCN内のパブリック・サブネットとパブリック・インターネットの間のトラフィックが許可されます。
- サービス・ゲートウェイ
サービス・ゲートウェイは、VCNからOracle Cloud Infrastructure Object Storageなどの他のサービスへのアクセスを提供します。The traffic from the VCN to the Oracle service travels over the Oracle network fabric and never traverses the internet.
- Web Application Firewall (WAF)
Oracle Cloud Infrastructure Web Application Firewall (WAF)は、ロード・バランサやWebアプリケーション・ドメイン名などの強制ポイントにアタッチされている、支払カード業界(PCI)に準拠したリージョンベースおよびエッジ強制サービスです。WAFは、悪意のある不要なインターネット・トラフィックからアプリケーションを保護します。WAFは、インターネット接続エンドポイントを保護することで、顧客のアプリケーションに対する一貫性のあるルール適用を実現できます。
- ルート表
仮想ルート表には、サブネットからVCN外部の宛先(通常はゲートウェイ経由)へのトラフィックをルーティングするルールが含まれます。
- ネットワーク・セキュリティ・グループ(NSG)
ネットワーク・セキュリティ・グループ(NSG)は、クラウド・リソースの仮想ファイアウォールとして機能します。Oracle Cloud Infrastructureのセキュリティ・モデルにより、すべてのトラフィックが拒否され、VCN内のネットワーク・トラフィックを制御できます。NSGは、単一のVCN内の指定されたVNICセットにのみ適用されるイングレスおよびエグレス・セキュリティ・ルールのセットで構成されます。
- セキュリティ・リスト
サブネットごとに、サブネットの内外で許可する必要があるトラフィックのソース、宛先およびタイプを指定するセキュリティ・ルールを作成できます。
このアーキテクチャには、Azureに次のコンポーネントがあります:
- Azure ExpressRoute
Microsoft Azure ExpressRouteを使用すると、VNetと別のネットワーク(オンプレミス・ネットワークや別のクラウド・プロバイダのネットワークなど)の間にプライベート接続を設定できます。ExpressRouteを介するトラフィックはパブリック・インターネットを横断しないため、通常のインターネット接続よりもExpressRouteの方が信頼性が高く高速です。
- Microsoft Azure VNet
Microsoft Azure Virtual Network (VNet)は、Azureのプライベート・ネットワークの基本的な構成要素です。VNetを使用すると、Azure仮想マシン(VM)などの様々なタイプのAzureリソースが、相互に、インターネットおよびオンプレミス・ネットワークと安全に通信できます。
- 統合ランタイム
統合ランタイムは、パブリック・アクセス可能なエンドポイントを使用して、様々なネットワークにわたるデータ統合機能を提供します。
Azure Synapse AnalyticsなどのMicrosoft Azureサービスは、データ統合に統合ランタイムを使用します。
- Azure Synapse Analytics
Azure Synapse Analyticsは、データ・ウェアハウスおよびビッグ・データ・システムの分析を提供するMicrosoftサービスです。
- Azure Active Directory
Azure Active Directoryは、ネットワーク上のオブジェクトに関する情報を格納する Microsoftサービスであり、管理者およびユーザーがこの情報(アカウント、特権、セキュリティーポリシー、DNSなど)を簡単に検索して使用できるようにします。Azure Active Directoryは、ディレクトリ情報の論理的な階層的な編成の基礎として、構造化されたデータストアを使用します。
推奨事項
- プロビジョニング
- Azureでネットワーク帯域幅が高い大規模な仮想マシン(VM)をプロビジョニングして、統合ランタイム(IR)をホストし、Oracle Autonomous Data WarehouseとAzure Synapse Analytics間のデータ転送に対してパラレル・スレッドを有効にします。
- 単一障害点を回避するために自己ホスト統合ランタイム用にMicrosoft Azureに複数のVMをプロビジョニングし、IRホストの帯域幅を組み合せると、Oracle Autonomous Data WarehouseとAzure Synapse Analytics間のデータ転送に必要なスループットが提供されます。
- 最大の可用性を実現するために、Azure IRを別のAzure可用性ゾーンにプロビジョニングおよびデプロイします。
- ワークロードに必要な帯域幅をサポートするために、Oracle Cloud Infrastructure FastConnectおよびAzure ExpressRoute仮想回線の適切なサイズを選択します。
- OCI Dynamic Routing Gateway (DRG)およびOCI FastConnectに接続されたOracle Cloud Infrastructure (OCI)仮想クラウド・ネットワーク(VCN)/サブネットを使用して、Oracle Autonomous Data Warehouseをプロビジョニングします。
- OCIでルーティングおよびセキュリティ/ネットワーク・セキュリティ・グループ(NSG)を構成して、Azure Synapse Analyticsネットワーク・トラフィックをOracle Autonomous Data Warehouseに許可します。
- For Oracle Autonomous Database on Shared Exadata Infrastructure private endpoint, specify the VCN configuration to allow traffic only from the specified VCN.これにより、すべてのパブリックIPまたはVCNからのデータベースへのアクセスがブロックされます。
- VCN
VCNを作成するときには、必要なCIDRブロックの数を決定し、VCN内のサブネットにアタッチする予定のリソースの数に基づいて各ブロックのサイズを決定します。標準プライベートIPアドレス空間内のCIDRブロックを使用します。
プライベート接続を設定する他のネットワーク(Oracle Cloud Infrastructure、オンプレミス・データ・センターまたは別のクラウド・プロバイダ)と重複しないCIDRブロックを選択します。
VCNを作成した後、そのCIDRブロックを変更、追加および削除できます。
サブネットを設計するときには、トラフィック・フローおよびセキュリティ要件を考慮してください。特定の層またはロール内のすべてのリソースを同じサブネットに接続し、セキュリティ境界として機能できます。
注意事項
このアーキテクチャをデプロイする場合は、次の点を考慮してください。
- パッケージ・アプリケーション
このアーキテクチャでは、Oracle E-Business Suiteを例として使用します。これは、PeopleSoft、JD Edwards EnterpriseOne、Siebelなどの他のパッケージ・アプリケーション、またはOracle Database上に構築されたサード・パーティ・アプリケーションに適用されます。
- Oracle Autonomous Data Warehouse
- 必要なコンピュートおよびストレージを使用して、ワークロードに最適なAutonomous Data Warehouseデータベースを適切にサイズ設定します。
- Autonomous Data Warehouseデータベースの自動スケーリングを有効にして、追加のワークロードをサポートします。
- 自動バックアップを有効にし、ビジネスをサポートする適切な保存期間を選択します。
- Oracle Autonomous Data Guardを有効にして、スタンバイ(ピア)データベースがビジネス・ニーズにデータ保護の障害リカバリを提供できるようにします。
- データのレプリケーション
- Oracle E-Business Suiteにディザスタ・リカバリ(DR)インスタンスがある場合、DRインスタンスからAutonomous Data Warehouseにデータをレプリケートして、ワークロードを本番のOracle E-Business Suiteデータベースからオフロードできます。
- Oracle GoldenGateのかわりに、Oracle Cloud Infrastructure Data Integrationを使用して、Oracle E-Business SuiteデータベースからAutonomous Data Warehouseにデータをレプリケートできます。