14.10 提供されるナレッジ・ベース

Oracle Textでは、英語とフランス語のナレッジ・ベースを提供します。提供されるナレッジ・ベースには、テーマ分析の実行に使用する情報が含まれています。テーマ分析には、テーマの索引付け、ABOUT問合せおよびCTX_DOCパッケージによるテーマの抽出が含まれます。

ナレッジ・ベースは、概念とカテゴリの階層ツリーです。次の6つの主要ブランチがあります。

  • Science and technology(サイエンスおよびテクノロジ)

  • Business and economics(ビジネスおよび経済)

  • Government and military(政府および軍隊)

  • Social environment(社会環境)

  • Geography(地理)

  • Abstract ideas and concepts(抽象観念および概念)

提供されるナレッジ・ベースは階層形式であり、上位語、下位語および関連語が含まれているという点で、シソーラスに似ています。したがって、テーマ分析の精度を向上させるには、新規語句を既存語句にリンクして業界固有のシソーラスで既存のナレッジ・ベースを補強します。

また、言語固有のシソーラスをナレッジ・ベースにコンパイルすると、テーマ機能を別の言語に拡張できます。

ナレッジ・ベースは、任意のシングルバイト文字セットで格納できます。提供されるナレッジ・ベースは、文字セットWE8ISO8859P1を使用しています。拡張ナレッジ・ベースは、US7ASCIIなどの別の文字セットで格納できます。

この項では、次の項目について説明します。

14.10.1 言語固有のナレッジ・ベースの追加

シングルバイトの空白で区切られた言語の独自のナレッジ・ベースをロードすると、スペイン語など、英語やフランス語以外の言語にテーマ機能を拡張できます。

シングルバイトの空白で区切られた言語の独自のナレッジ・ベースをロードすると、スペイン語など、英語やフランス語以外の言語にテーマ機能を拡張できます。

テーマ機能には、テーマの索引付け、ABOUT問合せ、テーマのハイライト表示およびCTX_DOC.を使用したテーマ、要旨およびテーマ・サマリーの生成などの機能が含まれます

テーマ機能は、ユーザー定義ナレッジ・ベースを追加して拡張します。たとえば、スペイン語シソーラスからスペイン語のナレッジ・ベースを作成できます。

言語固有のナレッジ・ベースをロードするには:

  1. カスタム・シソーラスをctxloadを使用してロードします。
  2. 言語部分がターゲット言語になるように、NLS_LANGを設定します。charset部分は、シングルバイト文字セットに設定する必要があります。
  3. ctxkbtcを使用してロードしたシソーラスをコンパイルし、-userのパスワードを要求に応じて入力します。この文は、言語固有のナレッジ・ベースをロード済のシソーラスからコンパイルします。
    ctxkbtc -user ctxsys -name my_lang_thes

索引付けおよびABOUT問合せ時のテーマ分析にこのナレッジ・ベースを使用するには、NLS_LANG言語をBASIC_LEXERプリファレンスのTHEME_LANGUAGE属性値として指定します。

14.10.2 ナレッジ・ベースの追加に関する制限事項

次に、ナレッジ・ベースの追加に関する制限事項を示します。

  • Oracleが提供するナレッジ・ベースは、英語とフランス語のみです。それ以外の言語に対しては、独自のシソーラスを用意する必要があります。

  • ナレッジ・ベースは、シングルバイト文字セットを持つ言語に対してのみ追加できます。マルチバイト文字セットのみで表現される言語に対して、ナレッジ・ベースを作成することはできません。データベースが、UTF-8などのマルチバイト・ユニバーサル文字セットの場合は、そのシソーラスのコンパイル時に、NLS_LANGパラメータを互換性のあるシングルバイト文字セットに設定する必要があります。

  • ナレッジ・ベースの追加によって、空白で区切られた言語が最適に機能します。

  • NLS_LANG言語に対して許可されるナレッジ・ベースは1つのみです。

  • 階層問合せフィードバック情報(たとえば、上位語、下位語、関連語)の取得操作は、英語とフランス語以外の言語では機能しません。その他の言語は、ナレッジ・ベースがユーザーのシソーラスからのみ導出されます。したがって、使用しているシソーラスから直接階層情報を取得することをお薦めします。

    関連項目:

    テーマの索引付け、ABOUT問合せ、CTX_DOCパッケージの使用方法および提供される英語のナレッジ・ベースの詳細は、『Oracle Textリファレンス』を参照してください。