データセットを作成する際、Oracle Analyticsでは、列レベルのプロファイリングが実行され、データを修復またはエンリッチするためのセマンティック推奨セットが生成されます。ワークブックの作成時、データ・パネルからナレッジ・エンリッチメントを追加することで、これをビジュアライゼーションに含めることもできます。
これらの推奨は、システムによるプロファイル・ステップ時の特定のセマンティック・タイプの自動検出に基づきます。たとえば、ローカル・サブジェクト領域をベースとするデータセットは、シンプルな上位Nサンプルを使用してプロファイリングされます。
セマンティック・タイプには、市区町村名で識別される地理的な位置、クレジット・カード、電子メール・アドレスおよび社会保障番号などにあるような認識可能なパターン、日付、および繰返しパターンなどのカテゴリがあります。独自のカスタム・セマンティック・タイプを作成することもできます。
プロファイリングは様々なセマンティック・タイプに適用されます。
セマンティック・タイプのカテゴリは、次を識別するようにプロファイルされています。
データセットを修復、拡張またはエンリッチするための推奨事項は、データのタイプによって異なります。
セマンティック・タイプの推奨の例:
セマンティック・タイプは、データで検出されたパターンに基づいて識別されます。
これらのセマンティック・タイプには、推奨事項が用意されています。
セマンティック・タイプの認識は、サービスに付属して提供されるロード済の参照ナレッジによって決まります。
これらのセマンティック・タイプには、参照ベースの推奨事項が用意されています。
推奨エンリッチメントはセマンティック・タイプに基づいています。
エンリッチメントは、次の地理的な位置階層に基づいて決定されます。
プロファイリング・プロセスでは、固有のしきい値を使用して特定のセマンティック・タイプに関する決定を行います。
一般に、システムで分類を決定するには、列のデータ値の85%が1つのセマンティック・タイプの基準を満たしている必要があります。結果として、70%の名および30%の"その他"を含む列はしきい値要件を満たさないため、推奨は行われません。