データ・フローの作成

データ統合のプロジェクトまたはフォルダにデータ・フローを作成します。データ・フローは、データベースやフラット・ファイルなどのソース・データ・アセットからデータ・レイクやデータ・ウェアハウスなどのターゲット・データ・アセットへのデータのフローを表すビジュアル・プログラムです。

データ統合には、開始時に1つのデフォルト・プロジェクトが含まれています。独自のプロジェクトまたはフォルダを作成するには、プロジェクトおよびフォルダを参照してください。

    1. データ・フローを作成するプロジェクトまたはフォルダを開きます。

      プロジェクトまたはフォルダの詳細ページを開くステップは、「プロジェクトの詳細の表示」または「フォルダの詳細の表示」を参照してください。

    2. プロジェクトまたはフォルダの詳細ページで、「データ・フロー」をクリックします。
    3. 「データ・フロー」セクションで、「データ・フローの作成」をクリックします。

      デザイナがタブで開きます。キャンバスで、「演算子」パネルおよび「プロパティ」パネルが開きます。

    4. 「詳細」タブの「プロパティ」パネルで、データ・フローの名前と説明(オプション)を入力します。

      識別子は、名前に基づいてシステムによって生成される値です。値を変更できますが、データ・フローを作成して保存した後は識別子を更新できません。

    5. (オプション)「プロジェクトまたはフォルダ」フィールドで、「選択」をクリックし、データ・フローを保存する別のプロジェクトまたはフォルダを選択します。
    6. データ・フロー演算子「演算子」パネルからキャンバスにドラッグして、データ・フローを設計します。

      有効にするには、データ・フローに少なくとも1つのソース演算子と1つのターゲット演算子が含まれている必要があります。データ統合では1つのデータ・フロー内で複数のターゲット演算子がサポートされますが、1つのターゲット演算子に含めることができるインバウンド・ポートは1つのみです。

      ヒント

      ソート演算子を使用する場合は、他の演算子の適用後にソート演算子を適用します。ターゲット演算子の直前にソート演算子を適用することで、ターゲットのデータが確実に目的のソート順で挿入されます。

    7. ソース、ターゲットまたは式の演算子を複製するには、演算子アイコンを右クリックして「複製」を選択します。次に、複製された演算子を選択し、「プロパティ」パネルで識別子を変更します。

      元の演算子が他の演算子に接続されている場合、接続は複製された演算子にコピーされません。

    8. キャンバス上の演算子を接続します。
      • 演算子の右側にコネクタ(小さい円)が表示されたら、そのコネクタを、接続先の次の演算子にドラッグします。コネクタをドロップして、演算子どうしが線で結ばれると、その接続は有効になります。

        ノート

        接続線は、あるノードから別のノードへデータがどのように流れるかを示します。表示されているコネクタをあるオブジェクトから別のオブジェクトにドラッグできても、1つのフィルタ、式、集計、個別、ソートおよびターゲット演算子に複数のインバウンド接続線を使用することはできません。

      • 接続された2つの演算子の間に演算子を挿入するには、接続線を右クリックして「挿入」メニューを使用します。

      • 接続を削除するには、行を右クリックして「削除」を選択します。

    9. 「プロパティ」パネルの「詳細」タブで、各演算子の基本プロパティと必須プロパティを構成します。
      • パラメータの割当て、および実行時に使用可能なシステム・パラメータの表示の詳細は、データ・フロー・パラメータの使用を参照してください。

      • 該当する場合は、「拡張オプション」タブを使用して他のプロパティを指定します。各演算子の拡張プロパティの詳細は、データ・フロー演算子の使用を参照してください。

    10. データ・フローを初めて保存するには、次のいずれかのボタンをクリックします。
      • 作成: データ・フローを作成して保存します。引き続きデザイナでデータ・フローを作成および編集できます。
      • 作成してクローズ: データ・フローを作成して保存し、デザイナを閉じ、プロジェクトまたはフォルダの詳細ページの「データ・フロー」リストに戻ります。
    11. 次のボタンのいずれかをクリックして、デザイナでの作業中に定期的に保存します。
      • 保存: 前回の保存以降の変更をコミットします。保存後に編集を続行できます。
      • 保存してクローズ: プロジェクトまたはフォルダの詳細ページの「データ・フロー」リストに戻り、変更をコミットします。
      • 別名保存: 現在のデータ・フローを上書きせずに、変更内容(最後の保存以降)をコミットしてコピーに保存します。コピーの名前を指定し、コピーのために別のプロジェクトまたはフォルダを選択することも、コピーを現在のデータ・フローと同じプロジェクトまたはフォルダに保存することもできます。
    12. データ・フローを検証して、実行時に問題を引き起こす可能性のある警告またはエラーを確認します。デザイナ・ツールバーで、「検証」をクリックします。

      「データ統合」に、「グローバル検証」パネルが表示されます。警告またはエラーが見つかった場合は、問題のリストで識別子名をクリックすると、その警告またはエラーのある演算子がキャンバスにフォーカスされます。

    13. データ・フローでの作業が終了したら、「作成して閉じる」または「保存して閉じる」をクリックします。
    データ・フローを実行するには、統合タスクを作成します。「統合タスクの作成」を参照してください。
  • oci data-integration data-flow createコマンドと必要なパラメータを使用して、データ・フローを作成します:

    oci data-integration data-flow create [OPTIONS]

    CLIコマンドのフラグおよび変数オプションの完全なリストは、コマンドライン・リファレンスを参照してください。

  • CreateDataFlow操作を実行して、データ・フローを作成します。