チャンク化と埋込みの実行

これらの例では、VECTOR_CHUNKS SQL関数とともにチェーン可能ユーティリティPL/SQLファンクションを使用して、大きなテキスト抜粋およびドキュメントをチャンクに分割し、各チャンクをベクトル埋込みとして表す方法を確認できます。

大きなテキスト・データを埋め込むには、まず、埋込みモデルで処理できる形式でデータを準備する必要があります。最初にデータをプレーン・テキストに変換し、結果のテキストをテキストの小さなチャンクに分割してから、各チャンクをベクトルに変換します。これは、埋込みモデルによって設定された入力制限に準拠するために行われます。チャンクは、単語(特定の単語や単語の断片を捕らえます)、文(特定のコンテキストを捕らえます)または段落(より広いテーマを捕らえます)です。