Text Enrichmentの前提条件

Text Enrichmentコンポーネントでは、処理する入力ソース・テキストに加えて、Salience Engineとプロパティ・ファイルが必要です。問合せトピック機能を使用する場合は問合せトピック・プロパティ・ファイルも必要となり、正規化されたテーマを使用する場合はnormalization.datファイルが必要となります。

Salience Engine

Text Enrichmentコンポーネントでは、Integrator ETLと同じマシンにSalience Engine Version 5.1がインストールされている必要があります。ビルド5.1.1.7203以降をインストールすることをお薦めします。Salience Engineのインストールの詳細は、次のページを参照してください。

Salience Engineをインストールする場合は、Salience Engineのdataディレクトリのパスを控えておいてください。Text Enrichmentコンポーネントを構成するときにこのパスを指定する必要があります。

ソース入力

ソース入力は、Salience Engineによって処理されるテキストです。ファイル、データベース列、IASレコード・ストア・データなどのサポートされているすべての入力ソースを使用できます。

入力テキストは、適切な句読点(通常はピリオド、必要に応じて疑問符または感嘆符)で文を終了する必要があり、スペースで区切る必要があります。文章が正しく終了してない場合または正しく区切られてない場合は、テーマが適切に抽出されません。

入力テキストがすべて大文字に書式設定されている場合は、setFlattenAllUpperCaseプロパティを使用します。詳細は、「すべて大文字の書式のテキストの処理」を参照してください。