システムレベル参照データ・ライブラリ

次のシステムレベル参照データのセットがEDQで提供されています。

注意:

EDQに付属している参照データのリストおよびマップは、名前の前にアスタリスクが付けられており、ユーザーが作成する参照データと区別されます。

これらのリストおよびマップの多くは、デフォルトでプロセッサにより使用されます。これらは変更できますが(プロジェクトで使用して変更し、システム・ライブラリにコピーする)、EDQのアップグレード時に上書きされないように、独自の要求に合せて異なる名前で新しいリストおよびマップを作成することをお薦めします。

また、オラクル社は、個別のデータ・タイプ用および個別の問題解決用の参照データ・パック、たとえば既知の電話番号の接頭辞のリスト、名前と住所のリスト、およびURLなどの構造化データをチェックする正規表現も提供しています。これらのパックは、EDQの拡張パックとして提供されています。

参照データ名 目的

*基本のトークン化マップ

「解析」プロセッサ内のデータのトークン化に使用される参照データ・セットで、限定されたキャラクタ・セットのみをカバーします。下位互換性を目的として維持されています。

*文字パターン・マップ

「パターン」プロセッサ内のパターンの生成に使用される参照データ・セットで、限定されたキャラクタ・セットのみをカバーします。下位互換性を目的として維持されています。

*日付書式

日付を認識するための標準書式のリストです。

*デリミタ

一般的に使用される区切り文字のリストです。

*電子メール正規表現

電子メール・アドレスの構文のチェックに使用されるデフォルトの正規表現です。

*データ処理なし

「データなし」文字の標準EDQセットです。

*ノイズ文字

一般的なノイズ文字のリストです。

*バンドの番号付け

数値プロファイラのバンドの番号付けセットの例です。

*数値の書式

数値を認識するための標準書式のリストです。

*アクセント記号付きの文字の標準化

アクセント記号付きの文字をアクセント記号なしの同等の文字に標準化するために使用される文字マップです。

*イギリスの郵便番号の正規表現

イギリスの郵便番号の構文のチェックに使用されるデフォルトの正規表現です。

*Unicodeベースのトークン化マップ

「解析」プロセッサ内のデータのトークン化に使用されるデフォルト参照データ・セットで、Unicode範囲全体をカバーします。

*Unicode文字パターン・マップ

パターン・プロセッサ内のパターンの生成に使用されるデフォルト参照データ・セットで、Unicode範囲全体をカバーします。