14.10 提供されるナレッジ・ベース
Oracle Textでは、英語とフランス語のナレッジ・ベースを提供します。提供されるナレッジ・ベースには、テーマ分析の実行に使用する情報が含まれています。テーマ分析には、テーマの索引付け、ABOUT
問合せおよびCTX_DOC
パッケージによるテーマの抽出が含まれます。
ナレッジ・ベースは、概念とカテゴリの階層ツリーです。次の6つの主要ブランチがあります。
-
Science and technology(サイエンスおよびテクノロジ)
-
Business and economics(ビジネスおよび経済)
-
Government and military(政府および軍隊)
-
Social environment(社会環境)
-
Geography(地理)
-
Abstract ideas and concepts(抽象観念および概念)
提供されるナレッジ・ベースは階層形式であり、上位語、下位語および関連語が含まれているという点で、シソーラスに似ています。したがって、テーマ分析の精度を向上させるには、新規語句を既存語句にリンクして業界固有のシソーラスで既存のナレッジ・ベースを補強します。
関連項目:
また、言語固有のシソーラスをナレッジ・ベースにコンパイルすると、テーマ機能を別の言語に拡張できます。
関連項目:
ナレッジ・ベースは、任意のシングルバイト文字セットで格納できます。提供されるナレッジ・ベースは、文字セットWE8ISO8859P1を使用しています。拡張ナレッジ・ベースは、US7ASCIIなどの別の文字セットで格納できます。
この項では、次の項目について説明します。
14.10.1 言語固有のナレッジ・ベースの追加
シングルバイトの空白で区切られた言語の独自のナレッジ・ベースをロードすると、スペイン語など、英語やフランス語以外の言語にテーマ機能を拡張できます。
シングルバイトの空白で区切られた言語の独自のナレッジ・ベースをロードすると、スペイン語など、英語やフランス語以外の言語にテーマ機能を拡張できます。
テーマ機能には、テーマの索引付け、ABOUT
問合せ、テーマのハイライト表示およびCTX_DOC.
を使用したテーマ、要旨およびテーマ・サマリーの生成などの機能が含まれます
テーマ機能は、ユーザー定義ナレッジ・ベースを追加して拡張します。たとえば、スペイン語シソーラスからスペイン語のナレッジ・ベースを作成できます。
言語固有のナレッジ・ベースをロードするには:
索引付けおよびABOUT
問合せ時のテーマ分析にこのナレッジ・ベースを使用するには、NLS_LANG
言語をBASIC_LEXER
プリファレンスのTHEME_LANGUAGE
属性値として指定します。
14.10.2 ナレッジ・ベースの追加に関する制限事項
次に、ナレッジ・ベースの追加に関する制限事項を示します。
-
Oracleが提供するナレッジ・ベースは、英語とフランス語のみです。それ以外の言語に対しては、独自のシソーラスを用意する必要があります。
-
ナレッジ・ベースは、シングルバイト文字セットを持つ言語に対してのみ追加できます。マルチバイト文字セットのみで表現される言語に対して、ナレッジ・ベースを作成することはできません。データベースが、UTF-8などのマルチバイト・ユニバーサル文字セットの場合は、そのシソーラスのコンパイル時に、
NLS_LANG
パラメータを互換性のあるシングルバイト文字セットに設定する必要があります。 -
ナレッジ・ベースの追加によって、空白で区切られた言語が最適に機能します。
-
各
NLS_LANG
言語に対して許可されるナレッジ・ベースは1つのみです。 -
階層問合せフィードバック情報(たとえば、上位語、下位語、関連語)の取得操作は、英語とフランス語以外の言語では機能しません。その他の言語は、ナレッジ・ベースがユーザーのシソーラスからのみ導出されます。したがって、使用しているシソーラスから直接階層情報を取得することをお薦めします。