Oracle AI Database 26ai for Enterprise AIの使用について
- Oracleに常駐する既存のデータをアクティブ化することで、AIの価値実現までの時間を短縮
- 厳選されたポリシーに沿ったコンテキストにより、回答の品質と一貫性を向上
- Oracleのエンタープライズ・グレードのパフォーマンス、可用性およびセキュリティに自信を持って拡張できます
- データ・ストレージとベクトル管理を統合することで、アーキテクチャの複雑さを軽減
アーキテクチャ
次のアーキテクチャは、1つのOCIリージョン内のOCIへのDifyの一般的な3層デプロイメントと、高可用性のために3つの可用性ドメインにまたがる単一のVCNを示しています。
oracle-adb-dify-arch oracle.zip
次のリストは、デプロイメントと接続の概要を示しています。
- オンプレミス・ユーザーは、インターネットを介してアプリケーションに接続します。
- リクエストは、VCNのOCIロード・バランサ(LB)によって提供されるパブリック・ロード・バランサで終了されます。
- イングレス・コントローラとOCIロード・バランサを使用してプラットフォームの前面に置き、Difyコンソールおよびサービスへの外部アクセスを行います。
- パブリックLBでは、高可用性(HA)のために、異なる可用性ドメイン(AD)に2つのパブリック・サブネットが必要です。
- 複数のADにまたがるVCN内のOKEにDify Enterprise Editionをデプロイします。
- クラスタはkubernetesアプリケーションプログラミングインターフェイス(API)エンドポイントを公開し、いくつかのワーカーノードを実行します。
- 各ノードはアプリケーション・ポッドをホストします。専用のプライベート・ポッド・サブネットをNATゲートウェイとともに使用して、ポッドがパブリックに公開されることなくインターネットに接続できるようにします。
- コンテナ・イメージは、サービス・ゲートウェイを使用して、Oracle Services Network (OSN)を介してOCIコンテナ・レジストリからプルされます。
- ベクトル・データベースとしてOracle AI Database 26aiを使用し、ネイティブ・ベクトルのストレージ/取得とエンタープライズ機能(パーティショニング、RAC、シャーディング、Exadata最適化)を活用してスケールと信頼性を確保します。
アーキテクチャには次のコンポーネントがあります。
- OCIのリージョン
OCIリージョンとは、可用性ドメインをホストする1つ以上のデータ・センターを含む、ローカライズされた地理的領域のことです。リージョンは他のリージョンから独立しており、長距離の場合は複数の国または大陸にまたがる領域を分離できます。
- 可用性ドメイン
可用性ドメインは、リージョン内の独立したスタンドアロン・データ・センターです。各可用性ドメイン内の物理リソースは、他の可用性ドメイン内のリソースから分離されているため、フォルト・トレランスが提供されます。可用性ドメインどうしは、電力や冷却、内部可用性ドメイン・ネットワークなどのインフラを共有しません。そのため、ある可用性ドメインでの障害が、リージョン内の他の可用性ドメインに影響することはありません。
- OCI仮想クラウド・ネットワークおよびサブネット
仮想クラウド・ネットワーク(VCN)は、ソフトウェアで定義されたカスタマイズ可能なネットワークであり、OCIリージョン内に設定します。従来のデータ・センター・ネットワークと同様に、VCNsではネットワーク環境を制御できます。VCNには、VCNの作成後に変更できる重複しない複数のクラスレス・ドメイン間ルーティング(CIDR)ブロックを複数含むことができます。VCNをサブネットにセグメント化して、そのスコープをリージョンまたは可用性ドメインに設定できます。各サブネットは、VCN内の他のサブネットと重複しない連続した範囲のアドレスで構成されます。サブネットのサイズは、作成後に変更できます。サブネットはパブリックにもプライベートにもできます。
- ロード・バランサー
Oracle Cloud Infrastructure Load Balancerは、単一のエントリ・ポイントから複数のサーバーへの自動トラフィック分散を提供します。
- OCI Kubernetes Engine
Oracle Cloud Infrastructure Kubernetes Engine(OCI Kubernetes EngineまたはOKE)は、コンテナ化されたアプリケーションをクラウドに導入するために使用できるフルマネージドのスケーラブルな高可用性サービスです。アプリケーションに必要なコンピュート・リソースを指定し、OKEによって既存のテナンシのOCIにプロビジョニングされます。OKEは、Kubernetesを使用して、ホスト・クラスタ間のコンテナ化されたアプリケーションのデプロイメント、スケーリングおよび管理を自動化します。
- Oracle AI Database 26ai
Oracle AI Database 26ai with AI Vector Searchを使用すると、キーワードではなく意味でデータを問い合せることができます。ベクトル表現(埋込み)は、テキスト、イメージ、オーディオなどのセマンティクスを取得するため、類似したコンテンツを効率的に見つけることができます。組込みのSQL距離関数により、ベクトルを使用した類似性検索が可能です。大規模言語モデル(RAG)の基礎となるセマンティック類似性やその他の検索基準を組み合せて、より正確で関連性の高い回答を得ることができます。
- Oracle Autonomous AI Database
Oracle Autonomous AI Databaseは、柔軟なスケーリングと高速な問合せパフォーマンスを提供する、使いやすい完全自律型(自己管理型)データベースを提供します。サービスとして、データベース管理は必要ありません。ハードウェアを構成または管理したり、ソフトウェアをインストールしたりする必要はありません。データベースのプロビジョニング、バックアップ、パッチ適用とアップグレード、拡大または縮小を自動的に処理し、柔軟なサービスです。組み込みのAI機能を使用して、あらゆるデータでスケーラブルなAI搭載アプリケーションを開発できます。選択した大規模言語モデル(LLM)を使用して、クラウドまたはデータ・センターにデプロイします。
ユース・ケース
企業が大規模言語モデル(LLM)モデルとプライベート・データに基づくAI開発計画を実装するにつれて、Oracle AI Database 26aiは、ネイティブ・ベクトル管理と成熟したエンタープライズ・クラス機能の2つの利点により、Dify Oracle AI Database Agent開発フレームワークおよびDify上に構築されたAIアプリケーションのための安定した効率的で低しきい値のデータ・プラットフォーム・ソリューションを提供します。
- リソースの再利用とコストの最適化: 企業は専用ベクトル・データベースを購入する必要がなくなり、既存のOracle AI Databaseリソースを完全に再利用できるため、ハードウェアの調達とメンテナンスのコストを大幅に削減できます。
- 機能のスケーラビリティ: エンタープライズAIアプリケーションでマルチモーダル・データ(産業用イメージやオーディオ・ログなど)がますます一般的になっているため、Oracle AI Database 26aiはマルチモーダル・ベクトル取得機能をさらに拡大し、スマート・マニュファクチャリングや医療診断などのシナリオに対してより包括的なAIサポートを提供できます。
- 安定性の保証: Oracle AI Databaseのパーティション化、RAC、およびExadataの最適化における長年の経験を活用して、Oracle AI Database 26aiはペタバイトレベルのデータ量と高同時実行性シナリオを簡単に処理できるため、エンタープライズAIアプリケーションの24時間365日の安定した運用を実現できます。
Oracle AI Database 26aiは、エンタープライズ・ベクトル・データ管理のコア・キャリアであるだけでなく、データ・ストレージからAIバリュー・マイニングへの企業の変革を促進するための主要な技術基盤であり、エンタープライズ・インテリジェント・アップグレードの確かな技術サポートを提供します。
考慮事項
DifyとOCIを統合する場合は、これらのオプションを検討してください。
- アプリケーション層やデータ層にはプライベート・サブネットを使用し、可能な場合はセキュリティ・リストに対するNSGを使用します。
- OCI Vaultは、シークレット(APIキー、DB資格証明)、最小権限のIAMポリシーおよびOCIロギング、モニタリングおよびアラームに対して使用して、可観測性を確保します。
- 高可用性および自動スケーリングについて、複数の可用性ドメイン・ノード・プールおよびロード・バランサのヘルス・チェックを検討します。
必要なサービスおよびロールについて
このソリューションには、次のサービスおよびロールが必要です。
- Oracle Cloud Infrastructure
- Oracle Autonomous AI Database
- OCI Kubernetes Engine
- Enterprise Editionを通知
各サービスに必要なロールは次のとおりです。
| サービス名: ロール | 必須対象... |
|---|---|
| 通知: ユーザー | ユーザー割当て制限unlimitedを使用して、パスワードのデフォルト表領域で識別されるユーザーDifyを作成します。
|
通知: DB_DEVELOPER_ROLE |
管理者は、開発者がOracle Database用のアプリケーションを設計、構築およびデプロイするために必要な権限をすばやく割り当てることができます。 |
必要なものを取得するには、Oracle製品、ソリューションおよびサービスを参照してください。
