Oracle Textでは、英語とフランス語のナレッジ・ベースを提供します。提供されるナレッジ・ベースには、テーマ分析の実行に使用する情報が含まれています。テーマ分析には、テーマの索引付け、ABOUT
問合せおよびCTX_DOC
パッケージによるテーマの抽出が含まれます。
ナレッジ・ベースは、概念とカテゴリの階層ツリーです。次の6つの主要ブランチがあります。
Science and technology
Business and economics
Government and military
Social environment
Geography
Abstract ideas and concepts
提供されるナレッジ・ベースは階層形式であり、上位語、下位語および関連語情報が含まれているという点で、シソーラスに似ています。したがって、新規語句を既存語句にリンクして業界固有のシソーラスで既存のナレッジ・ベースを補強することで、テーマ分析の精度を向上させることができます。
また、言語固有のシソーラスをナレッジ・ベースにコンパイルすると、テーマ機能を別の言語に拡張できます。
ナレッジ・ベースは、任意のシングルバイト・キャラクタ・セットで格納できます。提供されるナレッジ・ベースは、WE8ISO8859P1です。拡張ナレッジ・ベースは、US7ASCIIなどの別のキャラクタ・セットで格納できます。
この項では、次の項目について説明します。