機械翻訳について

検索拡張生成(RAG)でのSelect AI

RAGでのSelect AIは、セマンティック類似性検索を使用して、指定したベクトル・ストアからコンテンツを取得することで、自然言語プロンプトを拡張します。 これにより、特定の最新のコンテンツを使用することでハルシネーションが軽減され、プロンプトに対してより関連性の高い自然言語レスポンスが提供されます。

Select AIは、検索拡張生成(RAG)プロセスを自動化します。 この手法では、AIベクトル検索を使用してエンタープライズ・ソースからデータを取得し、指定した大規模言語モデル(LLM)のユーザー・プロンプトを拡張します。 エンタープライズ・データ・ストアからの情報を活用することで、RAGはハルシネーションを減らし、アースされた対応を生み出します。

RAGは、ベクトル索引でAIベクトル検索を使用して、指定された質問のセマンティックに類似したデータを検索します。 ベクトル・ストアは、テキスト、イメージ、オーディオなどのさまざまなデータ・ポイントの数学的表現であるベクトル埋め込みを処理します。 これらの埋込みによってデータの意味が取得され、効率的な処理および分析が可能になります。 ベクトル埋め込みおよびAIベクトル検索の詳細は、「AIベクトル検索の概要」を参照してください。

Select AIは、Oracle Autonomous Database 23aiで使用可能なAIベクトル検索と統合され、ベクトル埋込みを使用した類似性検索に使用されます。

トピック

ベクター・ストアをビルド

Select AIは、入力ドキュメント(PDF、DOC、JSON、XML、HTMLなど)をオブジェクト・ストアからプレーン・テキストに変換することで、ベクトル・ストアの作成と移入を自動化します。 Oracle Textでは、約150種類のファイル・タイプがサポートされています。 サポートされているすべてのドキュメント形式の完全なリストは、「サポートされているドキュメント形式」を参照してください。

Select AIは、ドキュメントをチャンクに自動的に処理し、埋込みを生成し、指定されたベクトル・ストアに格納し、新しいデータが到着するとベクトル索引を更新します。

オブジェクト・ストレージからの入力をSelect AI RAGとともに使用する方法を次に示します:

  1. 入力: データは、最初はオブジェクト・ストレージに格納されます。
  2. Oracle Autonomous Databaseは、入力データまたはドキュメントを取得し、チャンク化して、チャンクを埋込みモデルに送信します。
  3. 埋め込みモデルはチャンク・データを処理し、ベクトル埋め込みを返します。
  4. ベクトル埋込みは、RAGで使用するためにベクトル・ストアに格納されます。 コンテンツが追加されると、ベクトル索引が自動的に更新されます。

RAGは、ユーザーの質問に回答するために、エンタープライズ・データベースから関連する情報を取得します。 この情報は、ユーザー・プロンプトとともに、指定された大規模言語モデルに提供されます。 Select AIは、この追加のエンタープライズ情報を使用してプロンプトを拡張し、LLMのレスポンスを向上させます。 RAGは、ベクター・ストアからの最新の企業情報により、レスポンス品質を向上させることができます。



Select AIは、次のようにRAGを実装します:
  1. 入力: ユーザーは、Select AI narrateアクションを使用して質問を(プロンプトを指定)します。

  2. Select AIは、AIプロファイルで指定された埋込みモデルを使用して、プロンプトのベクトル埋込みを生成します。

  3. ベクトル検索索引は、質問のベクトル埋込みを使用して、索引付けされた顧客のエンタープライズ・データ(ベクトル・ストアを検索)から一致するコンテンツを検索します。

  4. ベクトル検索では、Autonomous Databaseインスタンスへの入力に似た上位Kテキストが返されます。
  5. Autonomous Databaseは、ユーザー質問を含むこれらの上位K問合せ結果をLLMに送信します。
  6. LLMは、Autonomous Databaseインスタンスにそのレスポンスを返します。
  7. Autonomous Database Select AIは、ユーザーにレスポンスを提供します。

DBMS_CLOUD_AIを使用したベクター索引の作成および管理

DBMS_CLOUD_AIパッケージを使用して、ベクトル索引を作成および管理し、ベクトル・データベースJSONパラメータを構成します。

資格証明を作成し、ベクトル・データベースおよびAIプロバイダへのネットワーク・アクセスを提供すると、Autonomous DatabaseインスタンスはAIプロファイルを使用してLLMへのアクセスを構成します。 Select AI文での設定および使用の完全な例は、「例: RAGでのSelect AIの設定および使用」を参照してください。

ノート:

表データまたはベクトル検索ドキュメントをLLMに送信しない場合、管理者権限を持つユーザーは、特定のデータベースのすべてのユーザーに対してそのようなアクセスを無効にできます。 これにより、RAGのnarrateアクションが無効になります。

「AIプロバイダとLLMの選択」にリストされているプロバイダのAIプロファイルは、DBMS_CLOUD_AIパッケージを使用して構成できます。

関連項目:

データベース内トランスフォーマ・モデルの使用

Select AI RAGを使用すると、ドキュメント・チャンクおよびユーザー・プロンプトから埋込みベクトルを生成するために、Oracle Database 23aiインスタンスのデータベースにインポートされる事前トレーニング済ONNXトランスフォーマ・モデルを使用できます。

事前トレーニング済ONNXモデルのOracle Database 23aiインスタンスへのインポートについてさらに学習するには、次を参照してください

ノート:

インポートされたデータベース内トランスフォーマ・モデルでSelect AI RAGを使用するには、事前トレーニングされたONNX形式のトランスフォーマ・モデルをOracle Database 23aiインスタンスにインポートする必要があります。 サポートされているAIプロバイダの他のトランスフォーマ・モデルを使用することもできます。

この機能を調べるには、「例: データベース内トランスフォーマ・モデルでのSelect AI」を参照してください。

Select AI RAGの利点

LLMで使用されるソースを確認することで、問合せを簡素化し、現在のデータでレスポンスの正確性を高め、透明性を高めます。

Select AI RAGには、次の利点があります:
  • データの問合せを簡素化し、レスポンス精度を向上: ユーザーが自然言語を使用してエンタープライズ・データを問合せし、LLMにエンタープライズ・データからの詳細なコンテキストを提供して、より正確で関連性の高いレスポンスを生成できるようにすることで、LLMの幻覚のインスタンスを減らすことができます。

  • 最新情報: ベクトル・ストアを使用して現在の企業情報へのLLMアクセスを提供することで、静的データ・セットでトレーニングされたLLMのコストと時間のかかる微調整が不要になります。

  • シームレスな統合: Oracle AI Vector Searchと統合して、データ処理の合理化とパフォーマンスの向上を実現します。

  • 自動化されたデータ・オーケストレーション: 完全管理型のベクトル索引パイプラインでオーケストレーション・ステップを自動化し、新しいデータを効率的に処理します。

  • 状況に即したわかりやすい結果: ベクトル・ストアからLLMで使用されるソースにアクセスして取得し、結果の透明性と信頼性を確保します。 統合とアプリケーション開発を容易にするために、データを自然言語テキストまたはJSON形式で表示および抽出します。