Text Enrichmentコンポーネントをグラフに追加する前に、テキスト・エンリッチメント・プロパティ・ファイルが作成済であることを確認してください。また、Salienceのdataディレクトリの場所も確認してください。
コンポーネントのこのインスタンスで使用するテキスト・エンリッチメント・プロパティ・ファイルの絶対パス(「テキスト・エンリッチメント・プロパティ・ファイル」を参照)。異なるコンポーネント構成をサポートする異なる構成プロパティ・ファイルを実装できます。
リッチ化するテキストが含まれている入力ソース内のフィールドの名前。コンポーネントのインスタンスごとに1つのフィールドのみをリッチ化できます。レコード内の複数のフィールドをリッチ化する場合は、グラフ内にあるText Enrichmentコンポーネントの複数のインスタンスを使用する必要があります。
Salienceデータ・ディレクトリの絶対パス。
エラー出力で使用するレコード・キーが格納されるフィールドの名前。レコードの処理に失敗すると、失敗がログに記録され、このキーで指定されたフィールドの値を使用してレコードが識別されます。このプロパティの値を指定しないと、レコード指定子(主キー)フィールドが使用されます。このプロパティは複数のフィールドの値を連結してキーを生成する場合に特に便利です。これにより、一意の値が格納される容易に識別できる別のフィールドを指定できます。このプロパティの値を指定することをお薦めします。他のオプションがない場合は、レコード指定子(主キー)を使用してください。
処理対象として入力フィールドに含めることができる英数字の最小パーセンテージ。このプロパティの値を指定しないと、デフォルト値の80が使用されます(つまり、テキストは、フィールド内の80パーセント以上の文字が英数字である場合にのみエンリッチメント対象としてSalience Engineに送信されます)。
コンポーネントが使用する処理スレッドの数。このプロパティの値を指定しないと、デフォルト値の1が使用されます(つまり、Text Enrichmentコンポーネントでは、1つのスレッドのみが処理に使用されます)。
データ・フィールド内の複数の値を区切るために使用する文字。デフォルトはUnicode DELETE文字(\U007F)です。