Oracle Analyticsでのデータのエンリッチおよび変換について

Oracle Analyticsでは、分析用に使用可能にする前のデータのエンリッチおよび変換が容易になります。

チュートリアル・アイコン チュートリアル

変換エディタに移動します

ホーム・ページで、所有するデータセットにカーソルを合せ、「アクション」をクリックして「開く」を選択します。データセットに複数の表が含まれる場合、結合ダイアグラムが表示されます。結合ダイアグラムで、データ・ソースを右クリックし、「開く」をクリックして変換エディタを表示します。

変換エディタを使用すると、データ品質の評価、メタデータの編集、データのクレンジングおよび変換を実行できます。


transform-editor.pngの説明が続きます
図transform-editor.pngの説明

データを変換するには、「オプション」(データ列の右上にある省略記号省略記号)をクリックし、変換オプション(「ビン」「名前変更」「テキストに変換」など)を選択します。


prepare-data-using-column-options.pngの説明が続きます
図prepare-data-using-column-options.pngの説明

推奨される変換の適用

ワークブックを作成してデータセットを追加すると、データの典型的なサンプルに対して実行される列レベルのプロファイリングが行われます。データのプロファイリング後、データセット内の認識可能な列に対して提供された変換およびエンリッチメント推奨を実装できます。右側の「推奨事項」パネルにある推奨事項をクリックし、実装します。
column-action-panel.pngの説明が続きます
図column-action-panel.pngの説明

次のものを使用してデータセットを強化または変換できます。

  • 列の連結。たとえば、個人の姓と名を格納した値を追加します。
  • 日付部分の抽出。たとえば、月、日、年を書式として使用する列から曜日を抽出します。
  • 機密フィールドを含む列を削除します。
  • 年単位、月単位または日単位の有効期間の抽出を使用した、日付列の期間エンリッチメント。たとえば、生成された数値列を使用して、0-3か月、3-6か月、6か月以上などのビンにデータを割り当てることができます。
  • 市区町村または郵便番号の緯度や経度など、全地球測位システムのエンリッチメント。
  • 機密フィールドの難読化またはマスキング(全体および一部)。
  • 部分抽出。たとえば、住所の番地名から家屋番号を抽出します。
  • セマンティック抽出。たとえば、電子メール・アドレスのドメインなど、認識されたセマンティック・タイプから情報を抜き出します。

独自の変換の適用

列アクション・パネルで表示される推奨された変換に加えて、様々な方法で独自の変換を作成できます:

  • 各列の上部にある「オプション」メニューを使用して、「名前変更」、「大文字」および「トリミング」などの一般的な変換を適用します。「データの変換」を参照してください。

  • 「データ・パネル」で「準備ステップの追加」をクリックして、カスタム変換に基づいて列を追加します。演算子、算術、集計および変換などの広範囲な関数を使用して列を作成できます。データセットへの列の追加を参照してください。
  • 「データ・パネル」の左下隅にある「要素」オプション・ペインを使用して、列タイプを変更(「処理形式」オプションを「属性」または「メジャー」に設定)するか、デフォルトの「集計」タイプを変更します。

    ヒント: 列タイプの設定に関する推奨の場合は、ツールバーで、「自動処理形式の推奨を確認」(「自動処理形式の推奨を確認」アイコン)をクリックします。たとえば、セマンティック・プロファイラで、1078220などの数値IDが最初はメジャーとして識別される場合、その列を属性に変更できます。

データセットの変換がワークブックおよびデータ・フローに与える影響

データセットに適用するデータ変換およびエンリッチメントの変更は、同じデータセットを使用するすべてのワークブックおよびデータ・フローに影響を及ぼします。データセットを共有するワークブックを開いたときに、ワークブックで更新済データが使用されていることを示すメッセージが表示されます。データセットのデータをリフレッシュすると、準備スクリプトの変更がリフレッシュ済のデータに自動的に適用されます。

プロファイル結果のリフレッシュ

システム・ナレッジまたはカスタム・ナレッジが更新された場合に、自分にデータセットに対する作成者権限がある場合は、ツールバー(「プロファイル結果のリフレッシュ」アイコン)の「プロファイル結果のリフレッシュ」をクリックして、現在オープンしているデータセットの結果を再プロファイリングおよびリフレッシュできます。通常、このリフレッシュはOracle Analyticsで管理されるため、ほとんどの場合、このオプションを使用する必要はありません。システム・ナレッジが更新された場合、またはカスタム・ナレッジが更新され、これを現在開いているデータセットに組み込む場合は、「プロファイル結果のリフレッシュ」を使用してデータを再プロファイルします。新しいナレッジが使用可能になると、「プロファイル結果のリフレッシュ」アイコンに使用可能な更新数を示すアラートが表示されます。