機械翻訳について

データ・フローからの出力データの保存

データ・フローに関する様々な情報を保存できます。 データ・フローを実行または実行する前に、データ・フローからの出力データを保存するためのストレージ・ロケーション、データ・フローで再利用するパラメータ、データ・セットを識別するための名前と説明、各列のデータ型、各列のデフォルト集計などの詳細を保存できます。

  1. 特定の値で保存するデータ・フローを作成するか開きます。
  2. をクリックし、「ステップ(+)を追加」をクリックして「データの保存」を選択します。 または、データ・フローをすでに保存している場合は、「データの保存」ステップをクリックします。
    • データ・フロー・ステップの名前を変更する場合は、ステップ名をクリックします。
  3. 「データセットを保存」ペインで、データ・セットを識別するために「名前」「説明」を入力します。
  4. リストへのデータの保存をクリックし、ロケーションを選択します。
    • データ・セット・ストレージ: データ・セットをローカルに保存するかどうかを指定します。
    • データベース接続: データベースに接続し、データ・フローからそのデータベースの表に出力データを保存します。 データ・フローはデータベースに安全に格納され、管理されたバックアップおよびリカバリ機能を利用できます。 データ・ソースをデータ・フローのデータで上書きして変換できます。 データ・ソースとデータ・フローの各表は同じデータベース内に存在し、同じ名前である必要があります。 データ・フローをデータベースに正常に保存するには、検証エラーがない必要があります。
  5. データベース接続を選択した場合は、次のオプションを指定します。
    1. 「接続の選択」をクリックすると、「データベース接続にデータを保存」ダイアログが表示されます。
    2. データ・フローを保存するための接続を選択します。

      データベース接続を選択する前に、データベース接続を作成する必要があります。 たとえば、Oracleデータベース、Apache Hiveデータベース、Hortonworks HiveデータベースまたはMap R Hiveデータベースに保存できます。 「データベース接続の作成」を参照してください。

    3. 「表」フィールドに名前を入力します。 表名は、選択したデータベースのネーミング規則に準拠している必要があります。 たとえば、Oracleデータベースの表の名前を数字で始めることはできません。
    4. 「実行時」リストをクリックして、既存データの置換または既存データへの新規データの追加を選択します。
  6. データ・フローにパラメータを適用して値を指定するには、「実行プロンプトでデータ・セットを指定するタイミング」オプションを選択します。
  7. 表で、出力データ・セットの各列について、データベース名、属性またはメジャー、および集計ルールを変更または選択します。
    列名 説明
    処理形式 各出力列が属性またはメジャーとしてどのように処理されるかを選択します。
    デフォルト集計

    各出力列の集計ルール(合計、平均、最小、最大、件数、重複を除いた件数など)を選択します。

    特定の列が出力データ・セットのメジャーとして処理されている場合は、集計ルールを選択できます。

    データベース名

    出力列のデータベース名を変更します。

    データ・フローからデータベースに出力データを保存する場合は、列名を変更できます。

  8. 「保存」または「別名保存」をクリックします。 「データ・フローの保存」 Asダイアログで、「名前」および「説明」を入力して、データ・フローを識別します。
    • 「データ」ページに移動し、「データ・フロー」を選択して、結果のデータ・フローをリストに表示します。

    • データ・フローを保存せずに、別のページに移動しようとすると、データ・フローの変更内容を保存するように求める「変更内容を保存」ダイアログが表示されます。

  9. 「データ・フローの実行」をクリックしてデータ・フローを実行します。 エラーがない場合、完了メッセージが表示され、出力データは指定した表名を使用してデータ・セット・ストレージまたは選択したデータベースに保存されます。
    • データ・セット・ストレージを選択した場合は、「データ」ページに移動し、「データ・セット」を選択して、出力データ・セットをリストに表示します。

      • 「アクション・メニュー」をクリックするか、右クリックして「検査」を選択してデータ・セット・ダイアログを開きます。

      • データ・セット・ダイアログで「データ要素」をクリックし、「データの保存」ステップの各列に選択した別名および集計の取扱いルールを確認します。

    • 出力データを保存するデータベースを選択する場合は、そのデータベースの表に移動して出力データを検査します。

    • 同じ名前の表をデータベースで選択すると、データベースに保存するときに表のデータが上書きされます。