CREATE_LANG_DATA

独自の言語データ・ファイルをデータベースにロードするには、DBMS_VECTOR_CHAIN.CREATE_LANG_DATAチャンカ・ヘルパー・プロシージャを使用します。

用途

選択した言語(languageチャンク化パラメータを使用して指定します)のカスタム言語データを作成します。

言語データ・ファイルには、言語固有の略語トークンが含まれています。入力言語の文末(EOS)の句読点、略語およびコンテキスト・ルールの知識を使用して、チャンクの文の境界を正確に決定するのに役立つように、このデータをチャンカに提供できます。

使用上の注意

  • サポートされているすべての言語は、デフォルトの言語固有の略語辞書とともに配布されます。ユーザー指定の言語データ名(PREFERENCE_NAME)を使用して、schema.table.columnにロードされた略語トークンに基づいて言語データを作成できます。

  • 言語データのロード後、VECTOR_CHUNKSまたはUTL_TO_CHUNKSlanguageチャンク化パラメータを指定することで、言語固有のチャンク化を使用できます。

  • 次のデータ・ディクショナリ・ビューに問い合せると、既存の言語データにアクセスできます。
    • ALL_VECTOR_LANGには、使用可能なすべての言語データが表示されます。

    • USER_VECTOR_LANGには、現在のユーザーのスキーマの言語データが表示されます。

    • ALL_VECTOR_ABBREV_TOKENSには、使用可能なすべての言語データの略語トークンが表示されます。

    • USER_VECTOR_ABBREV_TOKENSには、現在のユーザーが所有する言語データの略語トークンが表示されます。

構文

DBMS_VECTOR_CHAIN.CREATE_LANG_DATA (
    PARAMS       IN JSON default NULL
);

PARAMS

JSON形式で入力パラメータを指定します。
{
    table_name, 
    column_name, 
    language,
    preference_name
}

表12-19 パラメータの詳細

パラメータ 説明 必須 デフォルト値

table_name

言語データをロードする表の名前(およびオプションの表の所有者)

はい

値なし

column_name

言語データをロードする言語データ表の列名

はい

値なし

language

サポートされている言語名(「サポートされている言語とデータ・ファイルの場所」を参照)

はい

値なし

preference_name

この言語データのユーザー指定プリファレンス名

はい

値なし

declare
    params CLOB := '{"table_name"      : "eos_data_1",
                     "column_name"     : "token",
                     "language"        : "indonesian",
                     "preference_name" : "my_lang_1"}';
begin
    DBMS_VECTOR_CHAIN.CREATE_LANG_DATA(
        JSON (params));
end;
/

エンドツーエンドの例:

このプロシージャを使用してエンドツーエンドのシナリオ例を実行するには、「カスタム言語データの作成および使用」を参照してください。