ヘッダーをスキップ
Oracle® Fusion Middleware Oracle Help開発者ガイド
11g リリース2(11.1.2.3.0)
B71911-01
  目次
目次

戻る
戻る
 
次へ
次へ
 

11 テキスト検索インデクサの使用方法

この章では、テキスト検索インデクサについて説明します。また、テキスト検索インデクサを使用して索引ファイルを生成する方法について説明します。

この項の構成は、次のとおりです。

11.1 テキスト検索インデクサについて

Oracle Help for Javaには、Javaベースのテキスト検索インデクサが付属しています。インデクサは、Oracle Helpでのテキスト検索に使用される.idxファイルを生成します。テキスト検索インデクサには、日本語コンテンツ用と非日本語コンテンツ用の2つのバージョンがあります。

11.2 Javaの要件

テキスト検索インデクサには、Java5 Standard Edition以上が必要です。JIT (Just In Time Compiler)をオンのままにしておくと、パフォーマンスが大幅に向上します。また、Java仮想マシンのヒープ・サイズを最大にしてください。

11.3 インデクサの実行

インデクサを実行する手順は、次のとおりです。

  1. OHJインデクサJARファイルhelpindexer-version.jarをCLASSPATHに含めます。

  2. コマンド・プロンプトからインデクサを実行します。インデクサでは、次のコマンドライン引数をサポートしています。

    [-l=locale] [-e=charset] dirnameindexfilename
    

    各引数の意味は次のとおりです。

    引数 説明

    -l=locale

    オプション(推奨)のlocaleパラメータは、二文字形式のISO 639言語コードおよびISO 3166国コードを使用して指定します。形式はlanguage_COUNTRYまたはlanguage_COUNTRY_VARIANTです。localeの指定がない場合は、システムのデフォルト・ロケールが使用されます。

    -e=charset

    オプション(推奨)のcharsetパラメータは、索引を作成しているHTMLファイルに対する、Javaでサポートされるキャラクタ・セット・エンコーディングの名前です。エンコーディングが指定されない場合は、システムの現在のデフォルト・ロケールのデフォルトのキャラクタ・セット・エンコーディングが使用されます。指定する場合、値はJava対応のキャラクタ・セット・エンコーディング名であることが必要です。Java SEの場合については、http://download.oracle.com/javase/1.5.0/docs/guide/intl/encoding.doc.htmlを参照してください。

    dirname

    索引を作成するHTMLファイルが含まれるベース・ディレクトリ。インデクサでは、このディレクトリおよびそのサブディレクトリ(存在する場合)の下にあるすべてのファイルの索引が作成されます。

    indexfilename

    生成する索引ファイルの名前。


    たとえば、java -mx64m oracle.help.tools.index.Indexer -l=en_US -e=8859_1 D:\MyHTMLFiles myIndex.idxのように指定します。

    前述のコマンドでは、ロケールの言語を英語、国をアメリカ、エンコーディングを8859_1に設定し、D:\MyHTMLFilesディレクトリの索引を作成して、myIndex.idxファイルを作成します。

11.4 JapaneseIndexerの実行

インデクサを実行する手順は、次のとおりです。

  1. OHJインデクサJARファイルhelpindexer-version.jarをCLASSPATHに含めます。

  2. コマンド・プロンプトからインデクサを実行します。インデクサでは、次のコマンドライン引数をサポートしています。

    [-e=charset] dirnameindexfilename
    

    各引数の意味は次のとおりです。

    引数 説明

    -e=charset

    オプション(推奨)のcharsetパラメータは、索引を作成しているHTMLファイルに対する、Javaでサポートされるキャラクタ・セット・エンコーディングの名前です。エンコーディングが指定されない場合は、システムの現在のデフォルト・ロケールのデフォルトのキャラクタ・セット・エンコーディングが使用されます。指定する場合、値はJava対応のキャラクタ・セット・エンコーディング名であることが必要です。Java SEの場合については、http://download.oracle.com/javase/1.5.0/docs/guide/intl/encoding.doc.htmlを参照してください。

    dirname

    索引を作成するHTMLファイルが含まれるベース・ディレクトリ。インデクサでは、このディレクトリおよびそのサブディレクトリ(存在する場合)の下にあるすべてのファイルの索引が作成されます。

    indexfilename

    生成する索引ファイルの名前。


    たとえば、java -mx64m oracle.help.tools.index.JapaneseIndexer -e=MS932 D:\MyHTMLFiles myIndex.idxのように指定します。

    前述のコマンドでは、JapaneseIndexerを実行し、エンコーディングをMS932に設定し、D:\MyHTMLFilesディレクトリの索引を作成して、myIndex.idxファイルを作成します。