チャンク化パラメータの設定
Oracle AI Vector Searchには、SPLIT [BY]
、OVERLAP
、NORMALIZE
など、テキスト・データをチャンク化するための多数のパラメータが用意されています。これらの例では、これらのパラメータを構成して独自のチャンク化指定および戦略を定義し、意味のあるチャンクを作成する方法を確認できます。
- チャンク化の手法と例
サポートされているすべてのチャンク化パラメータについては、次の例を確認してください。これらの例によって、各チャンク化手法の長所と短所がわかるため、データをチャンク化するときに戦略を定義するのに役立ちます。 - カスタム語彙の作成および使用
独自の語彙のトークンを作成して、データをチャンク化するときに使用します。 - カスタム言語データの作成と使用
独自の言語固有の条件(一般的な略語など)を作成して、データをチャンク化するときに使用します。
親トピック: ベクトル生成の例