SFTPソースからFusion Data Intelligenceへのデータのロード(プレビュー)
サービス管理者は、Fusion Data Intelligence抽出サービスを使用してセキュアなFTPソース(SFTP)からデータを取得し、それを使用してデータ拡張を作成できます。
この接続を作成する前に、「機能の有効化」ページでSFTPが有効になっていることを確認します。 プレビュー機能を使用可能にする方法を参照してください。
- セキュアFTPデータベースのポート番号を確認し、オープンしたポートを取得するためのサービス・リクエストを作成します。
ノート:
SFTPサーバーのIPアドレスを指定する必要があります。これはパブリックIPである必要があり、ホスト名と完全修飾ドメイン名(FQDN)またはクラスAプライベートIPにはできません。 - Fusion Data Intelligenceで、次の手順を使用してSFTPデータ接続を作成します:
- Fusion Data Intelligence コンソールで、「アプリケーション管理」の下の「データ構成」をクリックします。
- 「データ構成」ページで、「接続の管理」をクリックします。
- 「接続の管理」ページで、「作成」をクリックし、「接続」をクリックします。
- 「接続の作成」で、「使用タイプ」で「データ抽出」を選択し、接続タイプとしてSFTPを選択します。

- SFTP接続のダイアログで、「接続タイプ」で「標準」を選択し、「通知電子メール」で通知を受信する電子メール・アドレスを入力し、「リモート・ホスト」、「ユーザー名」、「秘密キー」、「リモート・ホスト抽出ファイル・ディレクトリ」、「ファイル・タイプ」、「CSVデリミタ」、「CSV日付書式」および「CSVタイムスタンプ書式」で適用可能な値を指定します。 「メタデータのロック」で、メタデータが変更されない場合に、最初のリフレッシュ後にメタデータ抽出をオフにするかどうかを指定します。 このオプションは、メタデータ・ユーティリティを使用してデータファイルからメタデータを導出するフラグがソースでオンになっている場合に便利です。 「リモート・ホスト」で、FIPS準拠のキー交換アルゴリズムをサポートするSFTPサーバーを指定してください。 次のことを確認します:
- SFTPソースの表名とファイル名は同じである必要があります。
- 指定する秘密キーは有効なOpenSSH形式であり、キーの最小ビット数は2048である必要があります。
- データ・ファイルの日付書式は、SFTPソースの日付書式と一致する必要があります。たとえば、ソースでMM/dd/yyyy (01/23/1998)を使用した場合、「CSV日付書式」に同じ書式を指定する必要があります。 「CSVファイルベースのエクストラクタの日付とタイムスタンプの書式設定について」を参照してください。
- データ・ファイルのタイムスタンプ書式は、SFTPソースのタイムスタンプ書式と一致する必要があります。たとえば、ソースでMM/dd/yyyy hh:mm:ss (01/23/1998 12:00:20)を使用した場合、「CSVタイムスタンプ書式」で同じ書式を指定する必要があります。

- 接続の保存時にメタデータがリフレッシュされるように、「メタデータのリフレッシュ」トグルが有効になっていることを確認します。必要に応じて、「接続の管理」ページの「アクション」メニューからメタデータを後でリフレッシュできます。
ノート:
メタデータ抽出を実行しないかぎり、SFTPの拡張は作成できません。 - 「保存」をクリックします。
- SFTPソースで:
- 次のガイドラインを使用して、バケットにフォルダ構造を作成します:

- バケット内のベース・フォルダは、接続で指定された詳細と一致する必要があります。
- ベース・フォルダ内に、各ファイルを独自のフォルダに配置してください。
- Data_Store_Nameのプレフィクス(フォルダ名と同じ)とターゲット・フォルダのファイルが完全に一致していることを確認します。
「コンソールの使用」の「フォルダまたはサブフォルダを作成するには」の項を参照してください。
- ベース・フォルダ内に、データ・ストア・リストのメタデータ・ファイルを作成します。 このファイルには、サポートされているデータ・ストアがリストされます。 各データ・ストアは、データ拡張に使用される実際のファイル(ASSETSなど)を含むフォルダです。 ファイル名とフォルダ名が一致し、データストア、フォルダまたはファイル名に特殊文字(スペースを含む)がないことを確認してください。

- 次のガイドラインを使用して、データ・ストア・フォルダにある各データ・ファイルのメタデータ・ファイルを作成します:
META_DATASTORES.csvには、次の列が必要です:
- DATA_STORE_NAME - データ・ストア名を識別するための必須列。
- DATA_STORE_LABEL - データ・ストアの説明を識別する必須ではない列。
ノート:
既存のソース接続に新しいデータストアを追加する場合は、META_DATASTORES.csvに古い既存データストアを含むデータストアの完全なリストが含まれていることを確認してください。各フォルダには次のものが必要です:
- Fusion Data Intelligenceにロードされる実際のデータを含むデータファイル。 このファイルには、DATA STORE NAMEというプレフィクスが必要です。
- 列リストのメタデータ・ファイルには、データに関するすべての列情報が含まれます。 このファイルには、META_DATASTORES_<DATA_STORE_NAME>_COLのプレフィクスが必要です。
- このメタデータの列については、次のことを確認してください:
- 列名がABCの場合、メタデータはABCまたはABCになります - 二重引用符は無視されます。
- 列名がABCの場合、メタデータは""ABC"である必要があります - 最初の二重引用符は無視されます。
例
イメージでは、フォルダ名はACTIVITY_TYPESです。 したがって、データ・ストア名はACTIVITY_TYPESです。 これは、META_DATASTORES.csvファイルから確認できます。 この例では、ファイルはACTIVITY_TYPES.xlsxまたはACTIVITY_TYPES.csvという名前です。 メタデータ・ファイルはMETA_DATASTORES_ACTIVITY_TYPES_COL.csvである必要があります。
META_DATASTORES_ACTIVITY_TYPES_COL.csvには次の列があります:- DATA_STORE_NAME - これは必須の列です。
- COLUMN_NAME - これは必須の列です。
- COLUMN_LABEL - これは必須ではない列です。
- DATA_TYPE - これは必須の列です。
- 幅 - この列は、文字列の長さを識別します。
- 精度 - この列値は数値データ型である必要があります。
- スケール - この列値は数値データ型である必要があります。
- KEY_SEQUENCE - これは、主キー定義を識別する必須列です。 コンポジット主キーを使用している場合は、列順序番号を値として使用します。
- 次のガイドラインを使用して、バケットにフォルダ構造を作成します:
- 「接続の管理」ページで、SFTP接続に対して「処理」を選択し、「テスト接続」を選択します。
- 接続を削除するには、「接続の管理」ページで、該当する接続の「処理」をクリックし、「削除」を選択します。
ノート:
データ接続を削除する前に、そのデータ接続に関連する機能領域、データ拡張およびカスタム・データ構成を削除してください。 削除されたデータ接続からウェアハウスへのデータの更新またはロードはできません。 - 接続が正常に確立されたら、「データ構成」ページの「データ拡張」タイルに移動し、「データ・ソース」で接続を選択し、SFTPデータを使用してデータ拡張を作成します。 該当するセキュアFTPソース表を選択します。 データの拡張を参照してください。