CREATE_LANG_DATA
独自の言語データ・ファイルをデータベースにロードするには、DBMS_VECTOR_CHAIN.CREATE_LANG_DATA
チャンカ・ヘルパー・プロシージャを使用します。
用途
選択した言語(language
チャンク化パラメータを使用して指定します)のカスタム言語データを作成します。
言語データ・ファイルには、言語固有の略語トークンが含まれています。入力言語の文末(EOS)の句読点、略語およびコンテキスト・ルールの知識を使用して、チャンクの文の境界を正確に決定するのに役立つように、このデータをチャンカに提供できます。
使用上の注意
-
サポートされているすべての言語は、デフォルトの言語固有の略語辞書とともに配布されます。ユーザー指定の言語データ名(
PREFERENCE_NAME
)を使用して、schema.table.column
にロードされた略語トークンに基づいて言語データを作成できます。 -
言語データのロード後、
VECTOR_CHUNKS
またはUTL_TO_CHUNKS
でlanguage
チャンク化パラメータを指定することで、言語固有のチャンク化を使用できます。 -
次のデータ・ディクショナリ・ビューに問い合せると、既存の言語データにアクセスできます。
-
ALL_VECTOR_LANG
には、使用可能なすべての言語データが表示されます。 -
USER_VECTOR_LANG
には、現在のユーザーのスキーマの言語データが表示されます。 -
ALL_VECTOR_ABBREV_TOKENS
には、使用可能なすべての言語データの略語トークンが表示されます。 -
USER_VECTOR_ABBREV_TOKENS
には、現在のユーザーが所有する言語データの略語トークンが表示されます。
-
構文
DBMS_VECTOR_CHAIN.CREATE_LANG_DATA (
PARAMS IN JSON default NULL
);
PARAMS
{
table_name,
column_name,
language,
preference_name
}
表12-19 パラメータの詳細
パラメータ | 説明 | 必須 | デフォルト値 |
---|---|---|---|
|
言語データをロードする表の名前(およびオプションの表の所有者) |
はい |
値なし |
|
言語データをロードする言語データ表の列名 |
はい |
値なし |
|
サポートされている言語名(「サポートされている言語とデータ・ファイルの場所」を参照) |
はい |
値なし |
|
この言語データのユーザー指定プリファレンス名 |
はい |
値なし |
例
declare
params CLOB := '{"table_name" : "eos_data_1",
"column_name" : "token",
"language" : "indonesian",
"preference_name" : "my_lang_1"}';
begin
DBMS_VECTOR_CHAIN.CREATE_LANG_DATA(
JSON (params));
end;
/
エンドツーエンドの例:
このプロシージャを使用してエンドツーエンドのシナリオ例を実行するには、「カスタム言語データの作成および使用」を参照してください。
関連トピック
親トピック: DBMS_VECTOR_CHAIN