機械翻訳について

データ準備について

分析の準備をしているデータを変換およびエンリッチできます。

チュートリアル・アイコン チュートリアル

プロジェクトを作成してこれにデータ・セットを追加すると、データの代表的なサンプルで実行される列レベルのプロファイリングがデータに適用されます。 データのプロファイリング後、データ・セット内の認識可能な列に対して提供される変換およびエンリッチメントの推奨事項を実装できます。 次のタイプの推奨が提供され、データに対してシングル・クリックの変換およびエンリッチメントを実行できます:

  • 都市または郵便番号の緯度や経度などのグローバル・ポジション・システム・エンリッチメント。
  • 参照ベースのエンリッチメント。たとえば、性別をディシジョンするための属性として個人の名を使用して性別を追加します。
  • たとえば、列の連結では、ユーザーの姓と名を含む列を追加します。
  • 部品抽出。たとえば、住所の番地から番地を分割します。
  • たとえば、セマンティック抽出は、ドメインなどの認識されるセマンティク型と電子メール・アドレスから情報を分けます。
  • たとえば、日付部分の抽出は、曜日を、月、日、年の書式を使用してデータをビジュアライゼーションでより有効にする日付から分離する場合に使用します。
  • 検出された機密フィールドの完全および部分的な不明瞭化またはマスキング。
  • 検出された機密フィールドを含む列を削除することをお薦めします。

列の「オプション」メニューから広範なデータ変換を使用して構成できます。 「列メニュー・オプションを使用したデータの変換」を参照してください。

データを変換すると、「準備スクリプト」ペインにステップが自動的に追加されます。 青色のドットは、「適用スクリプト」が実行されなかったことを示しています。 スクリプトを適用した後、データ・セットに追加の変更を加えることも、プロジェクトを作成することも、「ビジュアル化」をクリックして分析を開始することもできます。

変換およびエンリッチメントの変更がデータに適用されるたびに、変更内容をレビューできます。 データ変更を元のソース・データと比較して、変更が正しいことを確認することもできます。

データ・セットに適用するデータ変換およびエンリッチメント変更は、同じデータ・セットを使用するすべてのプロジェクトおよびデータ・フローに影響します。 データ・セットを共有するプロジェクトを開くと、プロジェクトが更新済データを使用することを示すメッセージが表示されます。 データ準備の変更が含まれていない元のソースから、データ・セットを作成できます。 データ・セットのデータをリフレッシュすると、リフレッシュされたデータに準備スクリプトの変更が自動的に適用されます。