Oracle Analyticsでのデータのエンリッチおよび変換について
Oracle Analyticsでは、分析用に使用可能にする前のデータのエンリッチおよび変換が容易になります。
変換エディタに移動します
プロジェクト - プロジェクトを開く場合は、データ・ページをクリックし、「データ・ダイアグラム」で、準備するデータ・セットを選択します。データ・セットに複数の表が含まれている場合は、各表のタブを含む「結合ダイアグラム」が表示されます。表を選択して、変換エディタで開きます。
データ・セット - データ・セットを開くと、変換エディタが表示されます。データ・セットに複数の表が含まれている場合は、各表のタブを含む「結合ダイアグラム」が表示されます。表を選択して、変換エディタで開きます。
推奨される変換の適用
プロジェクトを作成してデータ・セットを追加すると、データの典型的なサンプルに対して実行される列レベルのプロファイリングが行われます。データのプロファイリング後、データ・セット内の認識可能な列に対して提供された変換およびエンリッチメント推奨を実装できます。提供される推奨事項は次のようなもので、変換やエンリッチメントを1回のクリックでデータに適用できます。
- 市区町村または郵便番号の緯度や経度など、全地球測位システムのエンリッチメント。
- 参照ベースのエンリッチメント。たとえば、個人名の名前を性別判定の属性に使用して、性別を追加できます。
- 列の連結。たとえば、個人の姓と名を格納した値を追加します。
- 部分抽出。たとえば、住所の番地名から家屋番号を抜き出します。
- セマンティック抽出。たとえば、電子メール・アドレスのドメインなど、認識されたセマンティック・タイプから情報を抜き出します。
- 日付部分の抽出。たとえば、月、日、年書式を使用する日付から曜日を抜き出し、ビジュアライゼーションで日付がより役立つようにします。
- 検出された機密フィールドの全体的または部分的な不明瞭化またはマスキング。
- 検出された機密フィールドを含む列についての削除推奨。
- 管理者がOracle Analyticsに追加したカスタム・ナレッジ・エンリッチメント。
独自の変換の適用
列アクション・パネルで表示される推奨された変換に加えて、様々な方法で独自の変換を作成できます:
- 各列の上部にある「オプション」メニューを使用して、「名前変更」、「大文字」および「トリミング」などの一般的な変換を適用します。列のメニュー・オプションを使用したデータの変換を参照してください。
- 「データ・パネル」で「準備ステップの追加」をクリックして、カスタム変換に基づいて列を追加します。演算子、算術、集計および変換などの広範囲な関数を使用して列を作成できます。データ準備での列の追加参照してください。
- 「データ・パネル」の左下隅にある「要素」オプション・ペインを使用して、「処理形式」(「属性」または「メジャー」)を選択するか、デフォルトの「集計」タイプを変更します。
データ・セットの変換がプロジェクトおよびデータ・フローに与える影響
データ・セットに適用するデータ変換およびエンリッチメントの変更は、同じデータ・セットを使用するすべてのプロジェクトおよびデータ・フローに影響を及ぼします。データ・セットを共有するプロジェクトを開いたときに、プロジェクトで更新済データが使用されていることを示すメッセージが表示されます。データ・セットのデータをリフレッシュすると、準備スクリプトの変更がリフレッシュ済のデータに自動的に適用されます。
変換エディタの設定
開始する前に、データ・パネル、推奨事項パネルおよび品質タイルを表示して、変換エディタを構成することをお薦めします。右下に表示される「データ・パネルの切替え」、「列アクション・パネルの切替え」および「品質タイルの切替え」の切替えオプションを使用します。
