UniQreate: Oracle Cloud Infrastructureでのデータ管理プラットフォーム・デプロイメント
UniQreateは、ビジネスにおいて、最も効率的なワークフローと最も侵入の少ない相互作用を使用して、未編成のデータの価値を最大化するのに役立つデータ抽出自動化企業です。
多くの組織では、構造、コンテキスト、レイアウトおよびフォーマットが異なる数百万のドキュメントにデータが分散されています。手動リソースまたは他のツールを使用してこの未編成データから関連データを抽出するには、多くの時間がかかり、スケーラビリティには制限があります。UniQreateは、人工知能(AI )、インテリジェント・ワークフローおよびWebインタフェースを使用してディープ・ラーニング・モデルを改善することで、この問題を解決します。このアプローチでは、組織のデータのコンテキストと表現が向上し、手動処理やカスタム作成ツールに依存せずに簡単に使用できます。
UniQreateは、次の理由により、データ管理プラットフォームを構築し、Oracle Cloud at Customer (OCI)を選択しようとしていました。
- コンピューティングとストレージの帯域幅を拡張する際の俊敏性
- 比類のない高いコンピューティング能力を競争力で実現
- スケーラブルなファイル・ストレージおよび管理対象MySQLサービス
- オブジェクト・ストレージは、すべてのプロジェクト・ストレージのニーズに対応
- コンパートメント機能は、個別の環境を分離および管理するためのクリーンな方法を提供します
UniQreateは2020年からOracle Cloud at Customer起動プログラムの一部であり、複数のクライアント環境に対して16個のOCPUインスタンスおよび3個のGPUインスタンスを実行しています。この設定により、モデル・トレーニングを24時間ごとに実行して、1日に200回の抽出サイクルを実行できます。
Oracle Cloud at Customerが提供する機能と競争力のあるコストにより、UniQreateは全体的なコストを毎月20%削減できました。
アーキテクチャ
このアーキテクチャは、Oracle Cloud InfrastructureでのUniQreateの複数リージョン障害時リカバリ・アーキテクチャを示しています。
- Webサーバー:抽出ユーザー・インタフェースおよび管理機能を提供します。
- コード・マネージャ:予測エンジン用に起動する必要がある仮想マシン(VM)のシェイプを決定します。
- 予測エンジン:人工知能(AI)および機械学習(ML)モジュールを実行します。
- サーバーの監視:ソリューション全体の状態とパフォーマンスを監視します。
- ファイル・システム: Webサーバーやデータベース・サーバーから独立した、モデルおよびドキュメント・メタデータ用のスケーラブルで低レイテンシのストレージを提供します。
- データベース・サーバー: Webサーバーに永続記憶域を提供します。
自動化は、Ansibleスクリプトを使用して、優先シェイプで予測エンジンを動的に起動することで実現されます。このスケーラブルな予測エンジンは、クライアントのニーズに基づいて大規模ドキュメントの処理に対応するのに役立ちます。
仮想マシン(VM)がホストされている仮想クラウド・ネットワーク(VCN)は、2つのサブネット(要塞ホストのパブリック・サブネット(SSH接続用)と、コード・マネージャ、予測エンジン、ファイル・ストレージ、MySQLデータベース・サーバーなどのVMのプライベート・サブネット)に分割されます。パブリック・サブネットは、継続的インテグレーションおよびデプロイメント(CI/CD)の要件のためにJenkinsサーバーもホストします。
リソースは、高可用性のために複数のフォルト・ドメインにデプロイされます。
オブジェクト・ストレージは、各VMのイメージを含む環境全体のバックアップとして使用されます。パブリック・ロード・バランサは、VM間でトラフィック・ロードを分散します。この環境では、ネットワーク・セキュリティ・リストを使用して実装されたネットワーク・セキュリティ用と、ネットワーク・セグメントごとにネットワーク・セキュリティ・グループ(NSG)を使用して実装されたアプリケーション固有の2つのセキュリティ・レイヤーを使用します。デプロイメントには、可用性ドメインと各可用性ドメイン内のフォルト・ドメインが別々に使用され、リージョン内の高可用性とフォルト・トレランスが向上します。環境全体も、障害時リカバリのために別のリージョンでホストされます。ユーザー・アクセスは、Identity and Access Management (IAM)ポリシーを使用して管理されます。
設定全体が4日間でOracle Cloud Infrastructureにデプロイされ、最大の可用性と稼働時間を実現しました。将来のデプロイメントでは、UniQreateはOracle Cloud InfrastructureのGPUオファリングを使用してディープ・ラーニング・モデルを改善および調整し、顧客はこれを使用してクライアント当たり$ 5 -10 Mでドキュメントを処理し、よりよいコンテキストとテキスト表現を生成できます。
次の図は、この参照アーキテクチャを示しています。
アーキテクチャには、次のコンポーネントがあります。
- リージョン
Oracle Cloud Infrastructureリージョンは、可用性ドメインと呼ばれる1つ以上のデータ・センターを含む、ローカライズされた地理的領域です。リージョンは他のリージョンから独立しており、広大な距離を(複数の国または複数の大陸にまたがる)分離できます。
このアーキテクチャのすべてのリソースは、単一のリージョンにデプロイされます。
- 可用性ドメイン
可用性ドメインは、リージョン内のスタンドアロンの独立したデータ・センターです。各可用性ドメインの物理リソースは、フォルト・トレランスを提供する他の可用性ドメインのリソースから分離されます。可用性ドメインは、電源や冷却、内部の可用性ドメイン・ネットワークなどのインフラストラクチャを共有しません。したがって、あるアベイラビリティ・ドメインでの障害が、リージョン内の他のアベイラビリティ・ドメインに影響を及ぼすことはほとんどありません。
このアーキテクチャのすべてのリソースは、単一の可用性ドメインにデプロイされます。
- フォルト・ドメイン
フォルト・ドメインは、アベイラビリティ・ドメイン内のハードウェアおよびインフラストラクチャのグループです。各可用性ドメインには、独立した電源とハードウェアを持つ3つのフォルト・ドメインがあります。複数のフォルト・ドメインにリソースを分散する場合、アプリケーションでは、フォルト・ドメイン内の物理サーバー障害、システム・メンテナンスおよび電源障害を許容できます。
- コンパートメント
コンパートメントは、Oracle Cloud Infrastructureテナンシ内のリージョン間論理パーティションです。コンパートメントを使用して、Oracle Cloudでリソースを編成し、リソースへのアクセスを制御し、使用量割当て制限を設定します。特定のコンパートメント内のリソースへのアクセスを制御するには、リソースにアクセスできるユーザーおよびリソースが実行できるアクションを指定するポリシーを定義します。
- 仮想クラウド・ネットワーク(VCN)およびサブネット
VCNは、Oracle Cloud Infrastructureリージョンで設定するカスタマイズ可能なソフトウェア定義のネットワークです。従来のデータ・センター・ネットワークと同様に、VCNではネットワーク環境を完全に制御できます。VCNには、VCNの作成後に変更できる複数の重複しないCIDRブロックを含めることができます。VCNは、リージョンまたは可用性ドメインにスコープ指定できるサブネットにセグメント化できます。各サブネットは、VCN内の他のサブネットと重複しない連続したアドレスの範囲で構成されます。サブネットのサイズは、作成後に変更できます。サブネットはパブリックまたはプライベートにできます。
- セキュリティ・リスト
サブネットごとに、サブネット内外で許可する必要があるトラフィックのソース、宛先およびタイプを指定するセキュリティ・ルールを作成できます。
- リモート・ピアリング
リモート・ピアリングを使用すると、VCNのリソースは、インターネットまたはオンプレミス・ネットワークを介してトラフィックをルーティングすることなく、プライベートIPアドレスを使用して通信できます。リモート・ピアリングにより、異なるリージョン内の別のVCNと通信する必要があるインスタンスに対してインターネット・ゲートウェイおよびパブリックIPアドレスが不要になります。
- 要塞ホスト
要塞ホストは、クラウド外部からトポロジへのセキュアで制御されたエントリ・ポイントとして機能するコンピュート・インスタンスです。要塞ホストは通常、非武装地帯(DMZ)でプロビジョニングされます。これにより、クラウドの外部から直接アクセスできないプライベート・ネットワークに機密リソースを配置することで、機密リソースを保護できます。トポロジには、定期的に監視および監査できる単一の既知のエントリ・ポイントがあります。したがって、トポロジのより機密性の高いコンポーネントへのアクセスを損なうことなく、公開を回避できます。
- ロード・バランサ
Oracle Cloud Infrastructure Load Balancingサービスは、バックエンドの複数のサーバーに対して、単一のエントリ・ポイントから自動トラフィック分散を提供します。
このアーキテクチャには、パブリック・ロード・バランサが含まれます。
- オブジェクト・ストレージ
オブジェクト・ストレージを使用すると、データベースのバックアップ、分析データ、イメージやビデオなどのリッチ・コンテンツなど、あらゆるコンテンツ・タイプの構造化データと非構造化データにすばやくアクセスできます。インターネットまたはクラウド・プラットフォーム内部から、安全かつセキュアにデータを直接格納し、取得できます。パフォーマンスやサービスの信頼性を低下させることなく、ストレージをシームレスにスケーリングできます。標準ストレージは、迅速、即時、頻繁にアクセスするために必要な「ホット」ストレージに使用します。長期間保持し、ほとんどアクセスしない「コールド」ストレージにはアーカイブストレージを使用します。
- ファイル・ストレージ
Oracle Cloud Infrastructure File Storage Serviceでは、永続的でスケーラブルな、エンタープライズ規模のネットワーク・ファイル・システムを提供します。VCNのベア・メタル、仮想マシンまたはコンテナ・インスタンスからファイル・ストレージ・サービスのファイル・システムに接続できます。また、Oracle Cloud Infrastructure FastConnectおよびIPSec VPNを使用してVCNの外部からファイル・システムにアクセスすることもできます。
- Oracle MySQL Database Service
Oracle MySQL Database Serviceは、開発者がセキュアなクラウド・ネイティブ・アプリケーションを迅速に開発およびデプロイできるフルマネージド型のOracle Cloud Infrastructure (OCI)データベース・サービスです。Oracle MySQL Database ServiceはOCIおよびMySQLのエンジニアリング・チームが構築、管理、サポートする100%のOCI専用環境向けに最適化されています。
Oracle MySQL Database Serviceには、高パフォーマンスの統合アナリティクス・エンジン(HeatWave)があり、運用上のMySQLデータベースに対して高度なリアルタイム分析を直接実行できます。
構築およびデプロイ済の特長
Oracle Cloud Infrastructureで構築した内容を表示しますか。学習したレッスン、ベスト・プラクティス、リファレンス・アーキテクチャを、オラクルのクラウド・アーキテクトのグローバル・コミュニティと共有 気にしませんか?開始するのを手伝ってあげましょう。
- テンプレートをダウンロードする(PPTX)
アイコンをサンプル ワイヤフレームにドラッグ アンド ドロップして、独自のリファレンス アーキテクチャを示します。
- アーキテクチャのチュートリアルを見る
参照アーキテクチャの作成方法に関するステップ・バイ・ステップの手順を取得します。
- ダイアグラムの発行
ダイアグラム付きのEメールを送信します。オラクルのクラウド・アーキテクトが図を確認し、お客様のアーキテクチャについてお話しします。
