データが目的に適合するための重要な側面は、そのデータが検出される構造です。構造自体がデータのニーズに対して不適切な場合があります。次に例を示します。
あるいは、データの構造は正常であっても、その使用が十分に制御されていない場合や、エラーになりやすいことがあります。次に例を示します。
これらのイシューはすべてデータ品質の低下原因となり、多くの場合、ビジネス・コストに悪影響を与えます。したがって、これらの問題についてデータを分析し、必要に応じて解決することがビジネスにとって重要です。
EDQの「Parse」プロセッサは、データ品質プロセスの開発者が使用するように設計されており、名称データ、住所データ、製品摘要など、特定タイプのデータの理解および変換について、パッケージ化されたパーサーを作成します。ただし、このパーサーは、データのタイプに固有のデフォルトのルールがない汎用パーサーです。データ固有のルールは、データ自体を分析し、パースの構成を設定することで作成できます。
パースは、データ品質の領域とコンピュータ全般の両方でよく使用される用語です。これは、単なるデータの細分化から、コンピュータが人間の言語を理解できるように高度な人工知能を使用する完全な自然言語処理(Natural Language Parsing: NLP)までのすべてを意味します。他の多くの用語も、パースに関係があり頻繁に使用されます。また、これらは異なる状況では意味が若干異なる可能性があります。したがって、EDQでのパースおよびその関連用語の意味を定義することは重要です。
次の用語と定義に注意してください。
次の図は、EDQの「Parse」プロセッサの動作を示しています。
構成方法は、EDQの「Parse」プロセッサのヘルプ・ページを参照してください。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.