Daten aus einer SFTP-Quelle in Fusion Data Intelligence laden (Vorschau)

Als Serviceadministrator können Sie mit dem Fusion Data Intelligence-Extraktionsservice Daten aus einer sicheren FTP-Quelle (SFTP) abrufen und damit Datenerweiterungen erstellen.

Stellen Sie sicher, dass SFTP auf der Seite "Features aktivieren" aktiviert ist, bevor Sie diese Verbindung erstellen. Siehe Vorschaufeatures verfügbar machen.

  1. Prüfen Sie die Portnummer für Ihre sichere FTP-Datenbank, und erstellen Sie eine Serviceanfrage, um den Port zu öffnen.
    Hinweis

    Sie müssen die IP-Adresse des SFTP-Servers angeben, der eine öffentliche IP sein muss und nicht Hostname und vollqualifizierter Domainname (FQDN) oder eine private IP der Klasse A sein kann.
  2. Erstellen Sie in Fusion Data Intelligence die SFTP-Datenverbindung mit den folgenden Anweisungen:
    1. Klicken Sie in der Fusion Data Intelligence-Konsole unter Anwendungsadministration auf Datenkonfiguration.
    2. Klicken Sie auf der Seite "Datenkonfiguration" auf Verbindungen verwalten.
    3. Klicken Sie auf der Seite "Verbindungen verwalten" auf Erstellen und dann auf Verbindung.
    4. Wählen Sie unter "Verbindung erstellen" unter Nutzungstyp die Option Datenextraktion aus, und wählen Sie SFTP als Verbindungstyp aus.

      SFTP-Verbindungsoption

    5. In the dialog for the SFTP connection, select Standard in Connectivity Type, enter an email address to receive notifications in Notification Email, and provide applicable values in Remote Host, User Name, Private Key, Remote Host Extract Files Directory, File Type, CSV Delimiter, CSV Date Format, and CSV Timestamp Format. Geben Sie unter Metadaten sperren an, ob Sie die Metadatenextrakte nach der ersten Aktualisierung deaktivieren möchten, wenn sich die Metadaten nicht ändern. Diese Option ist nützlich, wenn das Kennzeichen zum Ableiten von Metadaten aus Datendateien mit dem Metadatenutility in der Quelle aktiviert ist. Stellen Sie unter Remotehost sicher, dass Sie einen SFTP-Server angeben, der FIPS-konforme Schlüsselaustauschalgorithmen unterstützt.
      Stellen Sie Folgendes sicher:
      • Der Tabellenname und der Dateiname in der SFTP-Quelle müssen identisch sein.
      • Der angegebene Private Key hat das gültige OpenSSH-Format, und die Mindestanzahl an Bits im Schlüssel muss 2048 sein.
      • Das Datumsformat für die Datendateien muss mit dem Datumsformat in Ihrer SFTP-Quelle übereinstimmen. Beispiel: Wenn Sie MM/dd/yyyy (23.01.1998) in Ihrer Quelle verwendet haben, müssen Sie dasselbe Format in CSV-Datumsformat angeben. Siehe Informationen zur Datums- und Zeitstempelformatierung für dateibasierte CSV-Extraktoren.
      • Das Zeitstempelformat für die Datendateien muss mit dem Zeitstempelformat in Ihrer SFTP-Quelle übereinstimmen. Beispiel: Wenn Sie MM/dd/yyyy hh:mm:ss (01/23/1998 12:00:20) in Ihrer Quelle verwendet haben, müssen Sie dasselbe Format in CSV-Zeitstempelformat angeben.

      Dialogfeld "Verbindung für SFTP erstellen"

    6. Prüfen Sie, ob der Umschalter Metadaten aktualisieren aktiviert ist, um sicherzustellen, dass die Metadaten beim Speichern der Verbindung aktualisiert werden.
      Sie können die Metadaten später im Menü "Aktionen" auf der Seite "Verbindungen verwalten" aktualisieren, falls erforderlich.
      Hinweis

      Sie können keine Erweiterungen für SFTP erstellen, es sei denn, Sie führen einen Metadatenextrakt aus.
    7. Klicken Sie auf Speichern.
  3. In Ihrer SFTP-Quelle:
    1. Erstellen Sie die Ordnerstruktur im Bucket anhand der folgenden Richtlinien:
      Basisordner
      • Der Basisordner im Bucket muss mit den in der Verbindung angegebenen Details übereinstimmen.
      • Stellen Sie sicher, dass Sie im Basisordner jede Datei in einem eigenen Ordner ablegen.
      • Stellen Sie sicher, dass das Präfix Data_Store_Name (entspricht dem Ordnernamen) und die Dateien im Zielordner genau übereinstimmen.

      Weitere Informationen finden Sie im Abschnitt "So erstellen Sie einen Ordner oder Unterordner" unter Konsole verwenden.

    2. Erstellen Sie im Basisordner die Metadatendatei für die Datenspeicherliste. In dieser Datei werden die unterstützten Datenspeicher aufgeführt. Jeder Datenspeicher ist ein Ordner mit der eigentlichen Datei, die bei der Datenerweiterung verwendet wird, z.B. ASSETS. Stellen Sie sicher, dass der Dateiname und der Ordnername übereinstimmen und keine Sonderzeichen (einschließlich Leerzeichen) im Datenspeicher, im Ordner oder in den Dateinamen vorhanden sind.
      Basisordnerstruktur
    3. Erstellen Sie die Metadatendatei für jede Datendatei unter dem Data Store-Ordner anhand der folgenden Richtlinien:

      Die META_DATASTORES.csv muss die folgenden Spalten enthalten:

      • DATA_STORE_NAME: Eine obligatorische Spalte zur Identifizierung des Datenspeichernamens.
      • DATA_STORE_LABEL - Eine nicht obligatorische Spalte, mit der die Beschreibung des Datenspeichers identifiziert wird.
      Hinweis

      Wenn Sie einer vorhandenen Quellverbindung neue Datenspeicher hinzufügen, stellen Sie sicher, dass META_DATASTORES.csv die vollständige Liste der Datenspeicher enthält, einschließlich der älteren vorhandenen Datenspeicher.

      Jeder Ordner muss über Folgendes verfügen:

      • Eine Datendatei mit den tatsächlichen Daten, die in Fusion Data Intelligence geladen werden. Diese Datei muss ein Präfix mit dem Namen DATA STORE NAME haben.
      • Eine Metadatendatei für die Spaltenliste enthält alle Spalteninformationen zu den Daten. Diese Datei muss ein Präfix mit META_DATASTORES_<DATA_STORE_NAME>_COL haben.
        • Stellen Sie für die Spalten in diesen Metadaten Folgendes sicher:
        • Wenn der Spaltenname "ABC" lautet, können Metadaten "ABC" oder "ABC" sein. Die doppelten Anführungszeichen werden ignoriert.
        • Wenn der Spaltenname "ABC" lautet, müssen die Metadaten "ABC" sein. Die ersten doppelten Anführungszeichen werden ignoriert.

      Beispiel

      In der Abbildung lautet der Ordnername ACTIVITY_TYPES. Daher lautet der Datenspeichername ACTIVITY_TYPES. Sie können dies in der Datei META_DATASTORES.csv bestätigen. In diesem Beispiel lautet der Name der Datei ACTIVITY_TYPES.xlsx oder ACTIVITY_TYPES.csv. Die Metadatendatei muss META_DATASTORES_ACTIVITY_TYPES_COL.csv sein.Beispielordner und Metadatendatei

      Die META_DATASTORES_ACTIVITY_TYPES_COL.csv enthält die folgenden Spalten:
      • DATA_STORE_NAME: Dies ist eine obligatorische Spalte.
      • COLUMN_NAME: Dies ist eine obligatorische Spalte.
      • COLUMN_LABEL - Dies ist eine nicht obligatorische Spalte.
      • DATA_TYPE: Dies ist eine obligatorische Spalte.
      • WIDTH – Diese Spalte gibt die Länge der Zeichenfolge an.
      • PRECISION - Dieser Spaltenwert muss ein numerischer Datentyp sein.
      • SCALE - Dieser Spaltenwert muss ein numerischer Datentyp sein.
      • KEY_SEQUENCE: Dies ist eine obligatorische Spalte zur Kennzeichnung der Primärschlüsseldefinition. Wenn Sie den zusammengesetzten Primärschlüssel verwenden, verwenden Sie Spaltenfolgenummern als Werte.
  4. Wählen Sie auf der Seite "Verbindungen verwalten" Aktionen für die SFTP-Verbindung aus, und wählen Sie Verbindung testen aus.
  5. Um eine Verbindung zu löschen, klicken Sie auf der Seite "Verbindungen verwalten" auf Aktionen für die entsprechende Verbindung, und wählen Sie Löschen aus.
    Hinweis

    Stellen Sie sicher, dass Sie die Funktionsbereiche, Datenerweiterungen und benutzerdefinierten Datenkonfigurationen für die Datenverbindung löschen, bevor Sie sie löschen. Sie können keine Daten aus gelöschten Datenverbindungen in das Warehouse aktualisieren oder laden.
  6. Nachdem die Verbindungen erfolgreich hergestellt wurden, navigieren Sie auf der Seite "Datenkonfiguration" zur Kachel "Datenerweiterung", wählen Sie die Verbindung in der Datenquelle aus, und erstellen Sie eine Datenerweiterung mit den SFTP-Daten. Wählen Sie die entsprechenden sicheren FTP-Quelltabellen aus. Siehe Daten erweitern.