OCI Generative AIの概要
OCI Generative AIは、エンタープライズ規模で生成AIアプリケーションを構築、導入、運用するためのフルマネージドOracle Cloud Infrastructureサービスです。
OCI Generative AIを使用して、事前トレーニング済モデルとカスタム・モデルを操作し、本番グレードのエージェントを構築し、アクセス、ネットワーキング、AIの行動全体にわたってエンタープライズ・ガバナンス・コントロールを適用します。このサービスは、チャット、埋込み、再ランク、OpenAI互換APIなどのコア生成AIタスクをサポートすると同時に、ツール、メモリー、取得およびホストされたエージェント・アプリケーション用のエンタープライズ機能も提供します。
このドキュメントは、主に次の3つの領域で構成されています。
- エンタープライズAIモデル
- エンタープライズAIエージェント
- エンタープライズAIガバナンス
エンタープライズAIモデル
エンタープライズAIモデルは、会話生成、セマンティック検索、推奨、分類、クラスタリング、関連性ランキングなどの推論タスクに対するモデル・アクセスが必要な場合に使用します。
OCI Generative AIは、次のものをサポートします。
- チャット: 質問への回答やバーチャル・アシスタントなどの会話型エクスペリエンス
- セマンティック検索、推奨事項、分類およびクラスタリングのための埋込み
- 「ランク変更」は、問合せに関連性に基づいてドキュメントを順序付けする場合に使用します。
- 既存のツールおよびSDKと統合するためのOpenAI互換API
OCI生成AIモデルは、いくつかの方法で使用できます。事前トレーニング済ホスト・モデルは、コンソール、APIまたはCLIを介してコールできます。専用AIクラスタでカスタム・モデルをインポート、微調整およびホストすることもできます。これにより、エンタープライズ・コントロールとデプロイメントの柔軟性を備えた、実験から本番へのパスが提供されます。
エンタープライズAIエージェント
エンタープライズAIエージェントは、モデルとツール、メモリー、取得およびオーケストレーションを組み合せた本番グレードのエージェント・アプリケーションを構築する場合に使用します。
OCI Generative AIは、エージェントを構築するための2つの主なアプローチを提供します。
- OCI Responses APIを使用したエージェントの構築
- ホスト型エージェント・アプリケーションをOCI生成AIにデプロイ
これらのアプローチをハイブリッド・アーキテクチャで組み合せることもできます。
OCIレスポンスAPIは、エージェント・ワークフローのプライマリAPIです。OpenAIと互換性があり、モデルの相互作用、オーケストレーション、推論、会話状態およびツールの使用をサポートしています。サポートされているツールには、「File Search」、「Code Interpreter」、「Function Calling」および「MCP Calling」があります。エージェントは、「ファイル」、「ベクトル・ストア」、「コンテナ」、「会話」、「プロジェクト」などのサポート・リソース、および「長期メモリー」や「短期メモリー圧縮」などのメモリー機能も使用できます。
OCI Generative AIは、構造化されたエンタープライズ・データ・アクセスを必要とするエージェント・ワークフローのSQL Search (NL2SQL)もサポートしています。NL2SQLは、セマンティック・エンリッチメントおよび構造化データ・メタデータを使用して、自然言語リクエストを検証済SQLに変換します。
OCI管理によるカスタム・ランタイムのホスティングが必要なチームの場合、OCI生成AIは、ホストされたエージェント・アプリケーション用のアプリケーションとデプロイメントを提供します。このモデルでは、コンテナベースのデプロイメント、管理対象インフラストラクチャ、ネットワーキング、ストレージ統合およびアイデンティティ構成がサポートされます。
エンタープライズAIガバナンス
エンタープライズAIガバナンスは、生成AIリソースへのアクセス、デプロイおよび使用方法を保護および制御する必要がある場合に使用します。
OCI Generative AIのエンタープライズAIガバナンスは、インフラストラクチャ、アイデンティティ、ネットワーク・セキュリティ、およびランタイム・コントロールを組み合わせて、AIシステムの安全性、コンプライアンス、および組織ポリシーとの整合性を維持するのに役立ちます。
主要なガバナンス機能は次のとおりです。
- OCI生成AIリソースへのアクセス、使用および管理が可能なユーザーを制御するためのIAMポリシー
- セキュアなネットワーク境界内でモデル・アクセスを維持するためのプライベート・エンドポイント
- OCI生成AIサービスにアクセスするためのAPIキー
- OCI IAMアイデンティティ・ドメイン・アプリケーションの統合を必要とするエージェント・タスクのOAuth
- アイデンティティ・ベースのネットワーク強制のためのZero Trust Packet Routing (ZPR)
- ガードレール: ランタイム・セーフティおよびコンプライアンス制御をモデル入力およびモデル出力に適用する場合
これらの機能を組み合せると、アクセス制御、ネットワーク・セキュリティ、ホストされたアプリケーション構成およびAI動作全体にわたるエンドツーエンドのガバナンスが提供されます。
これらの領域の連携方法
次の3つの領域は、1つのプラットフォームの一部として連携します。
- エンタープライズAIモデルが推論と生成のモデル基盤を提供
- エンタープライズAIエージェントは、オーケストレーション、ツール、メモリ、取得、およびホストされた実行を追加
- エンタープライズAIガバナンスは、企業の使用に必要なセキュリティ、アクセス、およびコンプライアンスの制御を適用します
この組合せにより、ガバナンスが組み込まれたモデル・アクセスからエージェント・アプリケーション開発、本番デプロイメントに移行できます。