3.7 各国語別の機能

次の各国語別の機能を使用可能にできます。

3.7.1 テーマの索引付け

デフォルトでは、テーマは英語とフランス語で索引付けされ、ドキュメント・テーマ情報を索引付けできます。ドキュメント・テーマは、ドキュメント内で詳しく展開されている概念のことです。

ABOUT演算子でドキュメント・テーマを検索し、CTX_DOC PL/SQLパッケージを使用してプログラムでドキュメント・テーマを取得します。

テーマの索引付けは、BASIC_LEXERプリファレンス型のindex_themes属性を使用して、使用可能および使用禁止にします。

また、他の言語のナレッジ・ベースがロードされ、コンパイルされている場合は、その言語でテーマ情報を索引付けできます。

関連項目:

3.7.2 発音区別記号を持つ文字の基本文字変換

一部の言語には、ティルデ、ウムラウトおよびアクセントなどの発音区別記号を持つ文字が含まれています。索引付け操作で、発音区別記号を含むワードが基本文字書式に変換された場合は、一致のスコアを取得するために、問合せに発音区別記号を含める必要はありません。

たとえば、スペイン語の基本文字索引では、energíaの問合せでは、energíaおよびenergiaが一致します。ただし、基本文字の索引付けを無効にしている場合、energíaの問合せはenergíaのみに一致します。

言語の基本文字の索引付けは、BASIC_LEXERプリファレンス型のbase_letter属性を使用して、使用可能および使用禁止にします。

関連項目:

BASIC_LEXERについてさらに学習するには、『Oracle Textリファレンス』を参照してください。

3.7.3 代替スペル

ドイツ語、デンマーク語およびスウェーデン語などの言語には、複数のスペルが容認されているワードがあります。たとえば、ドイツ語では、äという文字は、aeという文字で代替できます。ae文字は、代替書式と呼ばれます。

これらの言語の場合、デフォルトでは代替書式のワードが索引付けされます。問合せ語句もそれぞれの代替書式に変換されます。その結果、これらのワードをいずれのスペルでも問い合せることができます。

言語の代替スペルは、BASIC_LEXERプリファレンス型のalternate_spelling属性を使用して、使用可能および使用禁止にします。

関連項目:

BASIC_LEXERについてさらに学習するには、『Oracle Textリファレンス』を参照してください。

3.7.4 複合語

AUTO_LEXERおよびBASIC_LEXERでサポートされているすべての言語に対してコンポジット索引を作成できます。

その結果、ある語句を問い合せると、その語句を複合語の要素として含むワードが戻ります。たとえば、ドイツ語で、語句Bahnhof(列車の駅)を問い合せると、Bahnhofを含むドキュメント、あるいはHauptbahnhofNordbahnhofまたはOstbahnhofなど、Bahnhofが複合語の要素として含まれているワードを含むドキュメントが戻ります。

コンポジット索引は、AUTO_LEXERおよびBASIC_LEXERプリファレンスのcomposite属性を使用して使用可能および使用禁止にできます。compositeのデフォルト値はYES (複合語の索引付けを使用可能)です。

複合語の索引付けが使用禁止になっている場合、ディクショナリで通常1エントリであるワードは、複合語幹に分割されません。ディクショナリのエントリでないワードは、複合語幹に分割されます。

3.7.5 韓国語、日本語および中国語の索引付け

これは、韓国語、日本語および中国語の索引付けに使用できる特定のレクサーのリストです。

表3-3 アジア言語のレクサー

言語 レクサー

韓国語

AUTO_LEXERKOREAN_MORPH_LEXER

日本語

AUTO_LEXERJAPANESE_LEXERJAPANESE_VGRAM_LEXER

中国語

AUTO_LEXERCHINESE_LEXER、CHINESE_VGRAM_LEXER

これらのレクサーには、索引付けを制御するための固有の属性セットがあります。

関連トピック