カスタム・ボキャブラリの作成および使用
独自の語彙のトークンを作成して、データをチャンク化するときに使用します。
ここでは、
DBMS_VECTOR_CHAINパッケージのチャンカ・ヘルパー関数CREATE_VOCABULARYを使用して、カスタム語彙をロードします。この語彙ファイルには、ベクトル埋込みモデルのトークナイザで認識されるトークンのリストが含まれています。
トークン語彙をロードしたら、
BY VOCABULARYチャンク化モード(VECTOR_CHUNKSまたはUTL_TO_CHUNKSを使用)を使用して、トークン数をカウントすることでデータを分割できるようになります。
親トピック: チャンク化パラメータの構成