Oracle Analyticsでのデータのエンリッチおよび変換について
Oracle Analyticsでは、分析用に使用可能にする前のデータのエンリッチおよび変換が容易になります。
ノート:
ナレッジ・エンリッチメントは、通常デフォルトで有効化されていますが、ワークブック・エディタは、所有しているか編集権限のあるデータセットに関してはこれを有効化または無効化できます。 Oracle Analyticsは、データ・フローから生成されたデータセットに対してエンリッチメント推奨を自動的に提供しません。 この場合、データセットの所有者または管理者は、最初にデータセットのナレッジ・エンリッチメント・オプションを有効にする必要があります。 「データセットのナレッジ・エンリッチメントの有効化」を参照してください。変換エディタに移動します
ホーム・ページで、所有するデータセットにカーソルを合せ、「アクション」をクリックして「開く」を選択します。 データセットに複数の表が含まれる場合、結合ダイアグラムが表示されます。 結合ダイアグラムで、データ・ソースを右クリックし、「開く」をクリックして変換エディタを表示します。
変換エディタを使用すると、データ品質の評価、メタデータの編集、データのクレンジングおよび変換を実行できます。
データを変換するには、「オプション」(データ列の右上にある省略記号 )をクリックし、変換オプション(「ビン」、「名前変更」、「テキストに変換」など)を選択します。
推奨される変換の適用
ワークブックを作成してデータセットを追加すると、データの典型的なサンプルに対して実行される列レベルのプロファイリングが行われます。 データのプロファイリング後、データセット内の認識可能な列に対して提供された変換およびエンリッチメント推奨を実装できます。 右側の「推奨事項」パネルにある推奨事項をクリックし、実装します。
図column-action-panel.pngの説明
次のものを使用してデータセットを強化または変換できます。
- 2つの別々の列を1つの列に結合する列の連結。 たとえば、データセットに名の列と姓の列がある場合、推奨を使用して名と姓を含む単一列を作成できます。
- 管理者がOracle Analyticsに追加したカスタム・ナレッジ・エンリッチメント。 たとえば、会計日をカスタム・ナレッジに追加して、ビジネス固有の時間枠をデータに統合すると、アナリティクスがより直感的かつ洞察力に富むようになります。
- 日付部分の抽出。たとえば、月、日、年を書式として使用する列から曜日を抽出します。
- 機密フィールドを含む列を削除します。
- 年単位、月単位または日単位の有効期間の抽出を使用した、日付列の期間エンリッチメント。 たとえば、生成された数値列を使用して、0-3か月、3-6か月、6か月以上などのビンにデータを割り当てることができます。
- 市区町村または郵便番号の緯度および経度などのグローバル・ポジショニング・システム(GPS)のエンリッチメント。
- 機密フィールドの難読化またはマスキング(全体および一部)。
- 部分抽出。たとえば、住所の番地名から家屋番号を抽出します。
- セマンティック抽出。たとえば、電子メール・アドレスのドメインなど、認識されたセマンティック・タイプから情報を抜き出します。
独自の変換の適用
列アクション・パネルで表示される推奨された変換に加えて、様々な方法で独自の変換を作成できます:
- 各列の上部にある「オプション」メニューを使用して、「名前変更」、「大文字」および「トリミング」などの一般的な変換を適用します。 データの変換を参照してください。
- 「データ・パネル」で「準備ステップの追加」をクリックして、カスタム変換に基づいて列を追加します。 演算子、算術、集計および変換などの広範囲な関数を使用して列を作成できます。 データセットへの列の追加を参照してください。
- 「データ・パネル」の左下隅にある「要素」オプション・ペインを使用して、列タイプを変更(「処理形式」オプションを「属性」または「メジャー」に設定)するか、デフォルトの「集計」タイプを変更します。
ティップ: 列タイプの設定に関する推奨事項については、ツールバーで自動処理(推奨)のレビュー
をクリックします。 たとえば、セマンティック・プロファイラで、1078220などの数値IDが最初はメジャーとして識別される場合、その列を属性に変更できます。
データセットの変換がワークブックおよびデータ・フローに与える影響
データセットに適用するデータ変換およびエンリッチメントの変更は、同じデータセットを使用するすべてのワークブックおよびデータ・フローに影響を及ぼします。 データセットを共有するワークブックを開いたときに、ワークブックで更新済データが使用されていることを示すメッセージが表示されます。 データセットのデータをリフレッシュすると、準備スクリプトの変更がリフレッシュ済のデータに自動的に適用されます。
プロファイル結果のリフレッシュ
システム・ナレッジまたはカスタム・ナレッジが更新され、データセットに対する作成者権限がある場合は、ツールバーの「プロファイル結果のリフレッシュ」をクリックして、現在開いているデータセットの結果を再プロファイルおよびリフレッシュできます。 通常、Oracle Analyticsはこのリフレッシュを管理するため、通常、このオプションを使用する必要はありません。 システム・ナレッジが更新された場合、またはカスタム・ナレッジが更新され、これを現在開いているデータセットに組み込む場合は、「プロファイル結果のリフレッシュ」を使用してデータを再プロファイルします。 新しいナレッジが使用可能になると、「プロファイル結果のリフレッシュ」アイコンに使用可能な更新数を示すアラートが表示されます。