この章では、EDQとIBM Global Name Recognition (GNR)を統合する方法について説明します。
IBM GNRに接続するようにEDQを構成し、名前の言語分析や、言語学的見地による名前検索を容易に実行できます。
この章の内容は次のとおりです。
EDQとIBM GNRとの接続を有効にするには、次のものが必要です。
64ビットJavaが稼働する64ビットAIXオペレーティング・システムまたはLinuxオペレーティング・システムにインストールされたEDQ 12c (12.2.1.1.0および12.2.1.2.0)。
GNR 4.2.2 (4.2 +4.2.2修正パック)に基づく修正プログラムを含むIBM GNR 4.2.1 (4.2 + 4.2.1修正パック)以上。詳細は、http://www.ibm.com
にあるIBMのWebサイトを参照してください。
EDQは、GNRで提供されるどのWebサービスも使用しないため、GNRのインストール中にそれらを構成する必要はありません。
注意: GNRは、オラクル社とIBM社の双方と必要なライセンス契約を締結している場合にのみ、EDQインスタンスにインストールできます。 |
インストール環境の要件に従ってLD_LIBRARY_PATH
を設定する必要があります。
EDQ GNR分析プロセッサでは、GNRインストールのlib64
ディレクトリの共有ライブラリ(.so
)を使用します。このディレクトリは、EDQサーバーに渡される環境変数に指定する必要があります。
Linux 64ビット環境では、環境変数は次のようにLD_LIBRARY_PATH
です。
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:gnr-installation-dir/lib64
gnr-installation-dirは、GNRのインストール・パスです(/opt/GNR/GNM
など)。
AIX環境では、環境変数名はLD_LIBRARY_PATH
ではなくLIBPATH
です。
注意: 環境変数は、アプリケーション・サーバー・プロセスで使用可能である必要があります。 |
GNR検索プロセッサでは、GNRライブラリにリンクされている必要のあるネイティブ・ライブラリを使用します。
ライブラリの作成用に次のファイルが提供されています。
2つのMakefile
テンプレート(プラットフォームごとに用意された、検索ライブラリの作成方法を記述したファイル)
namehunter.o
オブジェクト・モジュール・ファイル
AIXシステムでライブラリを作成する場合、IBM C++が使用できる必要があります。Linuxシステムでライブラリを作成する場合、GCC C++コンパイラが使用可能で、かつ、IBM GNRドキュメントに指定されているとおり、GNRライブラリの作成時に使用したものと同じバージョンである必要があります。
64ビットAIXオペレーティング・システムのMakefile
テンプレートは、次のとおりです。
# Build library from object file # ------------------------------ GNR=/opt/GNR/GNM CFLAGS=-qmkshrobj LIBS=-lNameHunter -lNameTransliterator -lsicui18n -lsicuuc -lsicudata SDK=aix61_64-xlc9-release LIBDIRS=-L$(GNR)/sdk/$(SDK)/lib -L$(GNR)/sdk/icu4c/$(SDK)/lib all: libnimrod.so libnimrod.so: namehunter.o xlc++_r -q64 $(CFLAGS) -o $@ $? $(LIBDIRS) -lNameHunter -lNameTransliterator -lsicui18n -lsicuuc -lsicudata
64ビットLinuxオペレーティング・システムのMakefile
テンプレートは、次のとおりです。
# Build 64-bit library from object file # -------------------------------------- GNR=/opt/GNR/GNM CFLAGS=-shared -fPIC all: libnimrod.so libnimrod.so: namehunter.o g++ -m64 $(CFLAGS) -o $@ $? -L$(GNR)/sdk/rhel4_64-gcc34-release/lib -L$(GNR)/sdk/icu4c/rhel4_64-gcc34-release/lib -lNameHunter -lNameTransliterator -lsicui18n -lsicuuc -lsicudata
使用中のプラットフォームでMakefile
スクリプトを実行する前に、Makefile
テンプレートのGNR
の値が、GNRインストール・ディレクトリの場所に従って正しく設定されていることを確認してください。同様に、AIXオペレーティング・システムでは、SDK
の値がシステム・アーキテクチャに従って正しく設定されていることを確認してください。
編集済のMakefile
の実行後、新しく作成したlibnimrod.so
共有ライブラリ・ファイルは、任意の場所にインストールしたり、GNRインストールが含まれる他のシステムにコピーできます。
EDQ GNRコネクタには、GNRと統合するために次の3つのタイプの構成ファイルが必要です。
EDQインストールのgnr.properties
プロパティ・ファイル
GNRインストールのnameworks.config
構成ファイル
EDQインストールの検索構成ファイル
gnr.properties
ファイルとそれを格納するgnr
サブディレクトリを手動で作成し、EDQ構成ディレクトリのgnr
サブディレクトリに配置する必要があります。これには次のプロパティが含まれる必要があります。
gnr.install
GNRのインストール・パス。これは、次のGNRサブディレクトリを格納するディレクトリへのパスです。
bin
bin64
data
(GNRデータ・ファイルを格納)
lib
lib64
analytics.config
GNRインストールのnameworks.config
構成ファイルの絶対位置。
search.jnilib
Makefile
テンプレートを使用して作成されたlibnimrod.so
共有ライブラリの絶対位置。
nameworks.config
GNRのインストール中に、nameworks.config
ファイルが作成され、GNR data
ディレクトリに格納されます。
nameworks.config
ファイルで特に重要な部分は、次の参照ファイル・セクションです。
[Reference Files] NameSifter=/opt/GNR/GNM/data/SifterRules.ibm
NameSifter
の値は、GNRインストールのSifterRules.ibm
ファイルを参照している必要があります。
検索構成ファイルは、EDQ構成ディレクトリのgnr/search
サブディレクトリにあります。これらはコネクタに読み取られ、検索機能のパラメータを設定するために使用されます。
search.config
というサンプルの検索構成ファイルが、EDQインストールのsupport/data/search
サブディレクトリにあります。検索構成ファイルを作成するには、このサンプル・ファイルをEDQ構成ディレクトリのgnr/search
サブディレクトリにコピーして、そのコピーを必要に応じて編集します。
検索構成ファイルの形式は、GNR 3.2からGNR 4.2への移行で若干変更されており、EDQ GNRコネクタでは、可能なかぎり両方のバージョンがサポートされます。また、組織検索でもデータが処理されます。
GNR 3.2とGNR 4.2の検索構成ファイル間の基本的な違いは、次のとおりです。
GNR 4.2では、[hunter]
セクションにパラメータ・ファイル(タグやバリアントなど)を指定します。GNR 3.2では、[search]
セクションを使用します。EDQ GNRコネクタは、最初に[hunter]
セクションを検索し、次に[search]
セクションを検索します。
GNR 4.2のタグおよびバリアント・ファイルは、ibmTaqFile
やcustTaqFile
などのキーによって指定されます。GNR 3.2では、単純にtaqFile
が使用されます。EDQ GNRコネクタは、taqFile
、ibmTaqFile
およびcustTaqFile
を検索し、それぞれ検出されたものをロードします。バリアントおよび用語ファイルにも同じルールが使用されます。
汎用正規化ファイルは、特定のgenericRegFile
設定によって設定されますが、GNR 3.2では、これは常にデフォルトでanglo
正規化ファイルに設定されます。
[parms]
セクションに追加された設定と、削除された設定があります。