データセットを作成する際、Oracle Analyticsでは、列レベルのプロファイリングが実行され、データを修復またはエンリッチするためのセマンティック推奨セットが生成されます。ワークブックの作成時、データ・パネルからナレッジ・エンリッチメントを追加することで、これをビジュアライゼーションに含めることもできます。
注:
ナレッジ・エンリッチメントは、通常デフォルトで有効化されていますが、ワークブック・エディタは、所有しているか編集権限のあるデータセットに関してはこれを有効化または無効化できます。Oracle Analyticsでは、データ・フローから生成されたデータセットに対するエンリッチメント推奨は自動的には提供されません。この場合、データセットの所有者または管理者は、最初にデータセットのナレッジ・エンリッチメント・オプションを有効にする必要があります。データセットのナレッジ・エンリッチメントの有効化を参照してください。これらの推奨は、システムによるプロファイル・ステップ時の特定のセマンティック・タイプの自動検出に基づきます。たとえば、ローカル・サブジェクト領域をベースとするデータセットは、シンプルな上位Nサンプルを使用してプロファイリングされます。
セマンティック・タイプには、市区町村名で識別される地理的な位置、クレジット・カード、電子メール・アドレスおよび社会保障番号などにあるような認識可能なパターン、日付、および繰返しパターンなどのカテゴリがあります。独自のカスタム・セマンティック・タイプを作成することもできます。
プロファイリングは様々なセマンティック・タイプに適用されます。
セマンティック・タイプのカテゴリは、次を識別するようにプロファイルされています。
データセットを修復、拡張またはエンリッチするための推奨事項は、データのタイプによって異なります。
セマンティック・タイプの推奨の例:
セマンティック・タイプは、データで検出されたパターンに基づいて識別されます。
これらのセマンティック・タイプには、推奨事項が用意されています。
セマンティック・タイプの認識は、サービスに付属して提供されるロード済の参照ナレッジによって決まります。
これらのセマンティック・タイプには、参照ベースの推奨事項が用意されています。
推奨エンリッチメントはセマンティック・タイプに基づいています。
エンリッチメントは、次の地理的な位置階層に基づいて決定されます。
プロファイリング・プロセスでは、固有のしきい値を使用して特定のセマンティック・タイプに関する決定を行います。
一般に、システムで分類を決定するには、列のデータ値の85%が1つのセマンティック・タイプの基準を満たしている必要があります。結果として、70%の名および30%の"その他"を含む列はしきい値要件を満たさないため、推奨は行われません。
カスタム・ナレッジの推奨を使用して、Oracle Analyticsシステム・ナレッジを拡張します。カスタム・ナレッジを使用すると、Oracle Analyticsセマンティック・プロファイラでさらに多くのビジネス固有のセマンティック・タイプを識別し、さらに多くの関連する管理対象エンリッチメントの推奨を作成できます。たとえば、処方薬をUSP医薬品カテゴリの鎮痛薬または麻酔薬に分類するカスタム・ナレッジ参照を追加する場合があります。
管理者にカスタム・ナレッジ・ファイルをOracle Analyticsにアップロードするように依頼します。データセットをエンリッチすると、Oracle Analyticsでは、このセマンティック・データに基づいてエンリッチメントの推奨が提示されます。ワークブックの作成時、データ・パネルからナレッジ・エンリッチメントを追加することで、これをビジュアライゼーションに含めることもできます。
独自のカスタム・ナレッジ・ファイルの作成
セマンティック・ファイルを作成する場合、次のガイドラインに従います:
管理者にカスタム・ナレッジ・ファイルをOracle Analyticsにアップロードするように依頼します。
この例では、ビジネス時間枠を売上データに追加し、元のデータセットに会計データが含まれていない場合に会計年度別の売上分析を有効にする方法を示します。