プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Service Studioユーザー・ガイド

E65365-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

データ・セットの結合

プライマリ・ソースとセカンダリ・ソース、結合キー、結合タイプを指定し、変換スクリプトを実行することによって、1つ以上のデータ・セットを結合できます。

結合を実行する前に、両方のデータ・セットをプロジェクトに追加する必要があります。 自己結合を実行する場合、1つのデータ・セットのみが必要です。

データ・セットを結合するには:

  1. カタログでプロジェクトを選択します。
  2. 「変換」を選択します。
  3. プライマリ・データ・セットにするデータ・セット・タブを選択します。

    たとえば、このプロジェクトには従業員データ・セットと販売データ・セットがあります。 従業員を選択すると、これがプライマリ・データ・セットになります:
    プロジェクトの下部に、従業員が円で囲まれた2つのデータ・セット・タブを示します。

  4. 変換メニューから、「整形」 > 「参加」を選択します。
  5. 結合するセカンダリ・データ・セットが選択されていることを確認します。
    たとえば、次のプロジェクトでは、従業員データ・セットが販売データ・セットに結合されます:
    結合の右側にドロップダウン・リストが表示されています。

  6. 同じデータ型の属性から一意の結合キーを作成します。
    1. 結合の「プライマリ」側から属性名をクリックしてハイライト表示します。
      属性が「キーの選択」リストの「左」側に追加されます。 また、Studioでは、右側の使用可能な属性が同じデータ型の属性に制限されます。
    2. キーの作成方法を決定するキー演算子(次と等しい、次より小さい、次より大きいなど)を選択します。
      たとえば、プライマリ側のemployee_fullnameは、セカンダリ側の「等しい」 sales_employeefullnameのようになります。
    3. 結合のsecondary側の属性名をクリックして強調表示
      属性が「キーの選択」リストの「右」側に追加されます。 たとえば、このキーはemployee_fullnamesales_employeefullnameに等しいです:
      フル・ネームに基づく単一キーとの結合。

    4. 結合されたレコード・セット全体で一意性を保証するには、1つの属性で不十分な場合、+アイコンをクリックして前述のステップを繰り返します。 - cは、2番目の属性セットを使用して複合キーを作成します。
  7. 左外部、内部または完全外部の結合タイプを選択します。
  8. オプションで、「プレビュー」をクリックして結合の結果を確認します。
  9. 「次へ」をクリックします。
  10. では、対応する属性名をチェックして、結合データ・セットに含める属性を指定します。 属性をフィルタ処理し、データ型でソートし、すべてを選択または選択解除できます。
    使用可能な属性リストには、プライマリ・データ・セットとセカンダリ・データ・セットの両方のすべての属性が含まれています。 リストの最上部には、「ソース・データ・セット」属性もあります。 この属性が有効である場合、Studioは、新しいレコードに寄与した名前のデータ・ソースを指定する値を使用して、新しい複数割当属性を作成します。
  11. 必要に応じて、属性名をクリックして名前を編集します。
  12. スクリプトへの結合を保存するには、「スクリプトに追加」をクリックします。

プロジェクト・データ・セットに変更を加えた場合は、変更をコミットできます。 「プロジェクト・データ・セットに対する変換スクリプトの実行」を参照してください。

結合の進行状況は、「通知」パネルで監視できます。