Oracle Analyticsでのデータのエンリッチおよび変換について
Oracle Analyticsでは、分析用に使用可能にする前のデータのエンリッチおよび変換が容易になります。
変換エディタに移動します
ワークブック - ワークブックを開く場合は、「データ」ページをクリックし、「データ・ダイアグラム」で、準備するデータセットを選択します。データ・セットに複数の表がある場合は、表ごとにタブが1つある「結合ダイアグラム」が表示されます。表を選択して、変換エディタで開きます。
データセット - データセットを開くと、変換エディタが表示されます。データ・セットに複数の表がある場合は、表ごとにタブが1つある「結合ダイアグラム」が表示されます。表を選択して変換エディタで開きます。
図transform-editor.pngの説明
推奨される変換の適用
ワークブックを作成してデータセットを追加すると、データの典型的なサンプルに対して実行される列レベルのプロファイリングが行われます。データのプロファイリング後、データセット内の認識可能な列に対して提供された変換およびエンリッチメント推奨を実装できます。提供される推奨事項は次のようなもので、変換やエンリッチメントを1回のクリックでデータに適用できます。
- 列の連結。たとえば、個人の姓と名を格納した値を追加します。
- 管理者がOracle Analyticsに追加したカスタム・ナレッジ・エンリッチメント。
- 日付部分の抽出。たとえば、月、日、年書式を使用する日付から曜日を抜き出し、ビジュアライゼーションで日付がより役立つようにします。
- 機密フィールドを含む列を削除します。
- 年単位、月単位または日単位の有効期間の抽出を使用した、日付列の期間エンリッチメント。たとえば、生成された数値列を使用して、0-3か月、3-6か月、6か月以上などのビンにデータを割り当てることができます。
- 市区町村または郵便番号の緯度や経度など、全地球測位システムのエンリッチメント。
- 機密フィールドの難読化またはマスキング(全体および一部)。
- 部分抽出。たとえば、住所の番地名から家屋番号を抜き出します。
- セマンティック抽出。たとえば、電子メール・アドレスのドメインなど、認識されたセマンティック・タイプから情報を抜き出します。
独自の変換の適用
列アクション・パネルで表示される推奨された変換に加えて、様々な方法で独自の変換を作成できます:
- 各列の上部にある「オプション」メニューを使用して、「名前変更」、「大文字」および「トリミング」などの一般的な変換を適用します。データの変換を参照してください。
- 「データ・パネル」で「準備ステップの追加」をクリックして、カスタム変換に基づいて列を追加します。演算子、算術、集計および変換などの広範囲な関数を使用して列を作成できます。データセットへの列の追加を参照してください。
- 「データ・パネル」の左下隅にある「要素」オプション・ペインを使用して、「処理形式」(「属性」または「メジャー」)を選択するか、デフォルトの「集計」タイプを変更します。
データセットの変換がワークブックおよびデータ・フローに与える影響
データセットに適用するデータ変換およびエンリッチメントの変更は、同じデータセットを使用するすべてのワークブックおよびデータ・フローに影響を及ぼします。データセットを共有するワークブックを開いたときに、ワークブックで更新済データが使用されていることを示すメッセージが表示されます。データセットのデータをリフレッシュすると、準備スクリプトの変更がリフレッシュ済のデータに自動的に適用されます。
変換エディタの設定
開始する前に、データ・パネル、推奨事項パネルおよび品質タイルを表示して、変換エディタを構成することをお薦めします。右下に表示される「データ・パネルの切替え」、「列アクション・パネルの切替え」および「品質タイルの切替え」の切替えオプションを使用します。