ベクトル埋込みの生成
このトピックでは、ベクトル・ツールボックスを使用してベクトル埋込みを生成する手順について説明します。
- データ・ソースの選択(ファイルまたはデータベース表)
- チャンク・パラメータの構成
- 埋込みモデルの選択または作成
- 埋込みを格納する保存先の選択
- ファイル・システム - ソース・タイプとしてファイル・システムを選択した場合は、任意のファイル・タイプをソース・ファイルとしてアップロードできます。ソース・ファイル・セクションの追加(+)アイコンをクリックし、ワークステーションから1つ以上のファイルを選択します。選択したファイルを削除するか、ソース・ファイルを処理する順序を変更できます。

- データベース表 - ソース・タイプとしてデータベース表を選択した場合は、さらに次のものを選択する必要があります:
| フィールド | 説明 |
|---|---|
| スキーマ | 埋込みを生成するDB接続からデータベース・スキーマを選択します。 |
| 表 | 選択したスキーマのデータベース表を選択します。 |
| ID列 | 埋込みを生成する表の列IDを選択します。 |
| データ列 | 埋込みを生成する表のデータ列を選択します。 |

選択したソース・ファイルを小さいセグメントにチャンク化または分割するには、Database Navigator - ベクトル・ツールボックスのチャンク構成セクションで、次のパラメータを設定します:
| フィールド | 説明 |
|---|---|
| チャンク化基準 | ソース・データのチャンクを作成するためのセパレータまたはブレークポイントを選択します。オプションには、単語または文字があります。 |
| 最大サイズ | 各チャンクの最大長を設定します。チャンクが小さいほどより正確な検索一致が得られ、チャンクが大きいほど正確な結果となりません。 |
| 分割方法 |
ソース・テキストを分割するチャンク戦略を選択します。オプションは次のとおりです:
|
| 重複 | 連続するチャンク間で共有されるトークン数または文字数を示すオーバーラップ率を設定します。このパラメータは、連続性を維持し、チャンク境界付近の重要なデータが失われないようにするのに役立ちます。チャンク・サイズの10%から25%の重複が理想的であるとみなされます。 |

ソース・ファイルに対するチャンク化の影響をテストするには、チャンク・ラボ・ボタンをクリックして、DBナビゲータ - チャンク・ラボ・ダイアログ・ボックスを開きます。

チャンク・パラメータを設定し、ソース・ファイルのサンプル・テキストを貼り付け、チャンク構成のテストをクリックして、実際の埋込みに適用する前に出力のプレビューを取得できます。チャンク出力に問題がなければ、構成の使用をクリックして、最終的な埋込みの生成に同じものを適用します。
| モデルの場所 | 説明 |
|---|---|
| データベース内モデル | データベース内AI埋込みモデルは、データベース・システム内で統合または密接に結合されるため、データベース自体が、ベクトル埋込みに格納されたRAWデータの変換を処理します。(適切な権限を持つ)ユーザーとして、データベース内モデルの構成と更新を直接制御できます。 |
| サードパーティ・モデル | サードパーティのAI埋込みモデルは、外部ベンダー(LLMプロバイダ)によって、データベースとは別にデプロイされるサービスまたはプラットフォーム(クラウドベースのAPIなど)として提供されます。Rawデータは、ベクトル埋込みを生成するためにデータベースからサードパーティ・サービスに送信され、その後、格納のためにデータベースに戻されます。 |
- スキーマ - 埋込みモデルが存在するデータベース・スキーマを選択します。
- モデル - ベクトルの生成に使用するモデルの名前を選択します

埋込みモデルが存在しない場合は、モデル・フィールドの横にあるAIモデルの作成(+)アイコンをクリックして、新しいモデルを作成できます。DBナビゲータ - AIモデルの作成ダイアログ・ボックスが開きます。

| フィールド | 説明 |
|---|---|
| 接続 | このフィールドには、AIモデルを追加するDB接続が事前入力されます。 |
| スキーマ | このフィールドには、AIモデルを追加するDBスキーマが事前入力されます。 |
| モデル名 | 新しいAIモデルの名前を入力します。 |
| モデル・ソース | モデル・ファイルまたはオブジェクト・リソースを選択します。
|
| モデル・ファイル | ローカル・システムに保存されているモデル・ソース・ファイル(.onnxファイルなど)を参照してアップロードします。このフィールドは、モデル・ソースとしてモデル・ファイルを選択した場合にのみ表示されます。
|
| オブジェクトURL | 埋込みモデルをダウンロードできるプラットフォームのURLを入力します。このフィールドは、モデル・ソースとしてオブジェクト・リソースを選択した場合にのみ表示されます。 |
| 資格証明 | サポートされているLLMの使用可能な資格証明から1つを選択します。資格証明が使用できない場合は、資格証明の作成アイコン(「+」)をクリックしてDBナビゲータ - 資格証明の作成ダイアログ・ボックスを開き、LLMに対応する新しい資格証明(OCI生成AI、Open AI、Google、Anthropic、Mistral AIなどによって提供される資格証明など)を作成します。資格証明の作成の詳細は、「パブリックLLMの資格証明の作成」を参照してください |
OKをクリックして、AIモデルの作成を開始します。モデルが選択したスキーマに追加され、DBブラウザの接続ツリーに表示されます。

| フィールド | 説明 |
|---|---|
| プロバイダ |
サポートされているサードパーティのAI埋込みモデル・プロバイダのいずれかを選択します。オプションは次のとおりです:
|
| モデル | 使用する埋込みモデル(Gemini Embedding-001、text-embedding-3-smallなど)を指定します。
|
| URL | サードパーティの埋込みモデル・ファイルにアクセスしたり、ダウンロード/サブスクライブできるプラットフォームのURLを指定します。 |
| 資格証明スキーマ | 選択したモデル(またはモデル・プロバイダ)に対応するAI資格証明が格納されるデータベース・スキーマを選択します。 |
| 資格証明 | 選択したモデルで使用できる資格証明のリストから1つを選択します。 |

生成された埋込みを格納する保存先を設定するには、DBナビゲータ - ベクトル・ツールボックスの埋込みの保存先セクションで、まず保存先を選択します。生成されたベクトル埋込みを既存のデータベース表に格納するか、新しい表を作成できます。
| フィールド | 説明 |
|---|---|
| スキーマ | ベクトル埋込みが格納されるデータベース・スキーマを選択します。 |
| 表 | ベクトル埋込みが格納されるスキーマ内のデータベース表を選択します。 |
| データ列 | 埋込みテキスト・データを格納する表の列を選択します。 |
| 埋込み列 | 埋込みベクトルを格納する表の列を選択します。 |
| メタデータ列 | 埋込みメタデータを格納する表の列を選択します。メタデータはファイル・システムの場合にのみ格納され、ソース・データがDB表の場合には格納されません。 |

優先する保存先として新しい表を選択した場合は、次のパラメータを設定します。
| フィールド | 説明 |
|---|---|
| スキーマ | ベクトル埋込みが格納されるデータベース・スキーマを選択します。 |
| 表名 | ベクトル埋込みが格納されるスキーマ内のデータベース表を選択します。 |
| キー列 | デフォルトでは、キー列の名前はIDです。ベクトルIDが格納されるキー列名を変更できます。 |
| テキスト列(CLOB) | 埋込みテキスト・データを格納する列名を指定します。 |
| ベクトル列(VECTOR) | 埋込みベクトルを格納する列名を指定します。 |
| メタデータ列(JSON) | 埋込みメタデータを格納する列名を指定します。 |

データ・ソース、チャンク構成、埋込みモデルおよび埋込みの保存先のすべてのフィールドをベクトル・ツールボックスで構成したら、埋込みの作成をクリックしてベクトル埋込みの生成を開始します。生成が成功すると、ベクトル埋込みは構成した保存先の表に格納されます。
親トピック: ベクトル・ツールボックス