Mit Data Loader-Aufgaben arbeiten
Mit einer Data-Loader-Aufgabe können Sie Daten aus einer Quelle entnehmen und in ein Ziel laden. Data-Loader-Aufgaben sind für die Datenvorbereitung, Datenmigration oder das Laden verschiedener Daten in Data Lakes oder Data Warehouses von wesentlicher Bedeutung.
In Data Integration können Sie mit einer Data-Loader-Aufgabe das 1-zu-1- oder n-zu-n-Laden von Daten von einem Systemtyp in einen anderen ausführen, wobei vor dem Laden mehrere bis keine Datentransformationen möglich sind. Wenn Sie eine Data-Loader-Aufgabe erstellen, führt Sie Data Integration durch den Prozess der Auswahl der Quell- und Zielentity oder -entitys, der Anwendung von Transformationen und der Validierung der Aufgabe. Für das Ziel haben Sie die Möglichkeit, die Entity(s) vor dem Laden zu erstellen oder vorhandene Entitys zum Laden der Daten auszuwählen. Für Quelle und Ziel können Sie die Ressourcen mit Parametern angeben und Parameter wiederverwenden, wie unter Parameter für Quelle und Ziel beschrieben.
Auf den folgenden Seiten wird beschrieben, wie Sie Data Loader-Aufgaben erstellen, bearbeiten und löschen können:
- Data-Loader-Aufgabe erstellen
- Quelle für eine Data-Loader-Aufgabe auswählen
- Ziel für eine Data-Loader-Aufgabe auswählen
- Transformationen anwenden
- Attribute zuordnen (nur für Data-Loader-Aufgaben, die vorhandene Zieldatenentitys verwenden)
- Aufgabe prüfen und validieren
- Data-Loader-Aufgabe bearbeiten
- Data-Loader-Aufgabe löschen
Auf den folgenden Seiten wird beschrieben, wie Parameter in einer Data-Loader-Aufgabe verwendet werden:
Auf den folgenden Seiten werden andere Verwaltungsaufgaben beschrieben, die ausgeführt werden können:
Teile einer Data-Loader-Aufgabe
Die Konfiguration einer Aufgabe zum Laden von Daten aus einer Quelle in ein Ziel umfasst mehrere Schritte.
- Basisinformationen und Ladetyp: Wählen Sie den Typ der Quelldatenentity und Zieldatenentity sowie den Ladetyp.
Informationen zu den Datenassets für Datenbanken, File Storage und SaaS-Anwendungen, die Sie als Quell- und Zieldatenentitys verwenden können, finden Sie unter Unterstützte Quell- und Zieltypen.
Als Ladetyp können die zu ladenden Quelldaten aus Mehrere Datenentitys in einem Schema oder aus einer einzelnen Datenentity stammen. Beispiel: Daten in zwei oder mehr Entitys aus einer Oracle Database-Quelle können in ein Objektspeicherziel geladen werden.
-
Quelle: Wählen Sie das Datenasset, die Verbindung und das Schema mit den Quelldaten zum Laden aus. Wählen Sie dann je nach angegebenem Ladetyp mindestens eine Datenentity aus, die der Quelle zum Laden hinzugefügt werden soll. Siehe Quelle auswählen.
Informationen zum Parametrieren einer Ressource in der Quelle finden Sie unter Parameter für Quelle und Ziel.
-
Ziel: Wählen Sie das Datenasset, die Verbindung, das Schema und die Datenentity aus, die als Ziel verwendet werden sollen. Standardmäßig werden Quell- und Zielentitys nach Namen zugeordnet. Wenn noch keine Entity zum Laden vorhanden ist, können Sie eine neue Datenentity erstellen. Siehe Ziel auswählen.
Informationen zum Parametrieren einer Zielressource finden Sie unter Parameter für Quelle und Ziel verwenden.
- Transformation: Mit den interaktiven Registerkarten können Sie Transformationen auf die Quellattribute anwenden. Eine Data-Loader-Aufgabe unterstützt Transformationen auf Metadaten- und Datenebene. Siehe Transformationen anwenden.
- Attributzuordnung: Beim Laden von Daten in eine vorhandene Zieldatenentity oder mehrere Entitys werden die Quellattribute standardmäßig nach Attributname den Zielattributen zugeordnet. Sie können mehr Zuordnungsregeln auf alle Attribute in allen zugeordneten Entitys anwenden. Siehe Attribute zuordnen.
- Prüfen und validieren: Prüfen und ändern Sie die Konfigurationsschritte, und stellen Sie vor der Veröffentlichung sicher, dass die Data Loader-Aufgabe gültig ist. Siehe Aufgabe prüfen und validieren.
Unterstützte Quell- und Zieltypen
Die meisten Typen von Datenquellen werden in Data-Loader-Aufgaben unterstützt.
Siehe Unterstützte Datenquellen und deren Versionen.
Wenn Sie hierarchische Dateneinheiten verwenden, finden Sie weitere Informationen zu den unterstützten Typen unter Hierarchische Datentypen.
Parameter für Quelle und Ziel
Durch die Verwendung von Parametern für die Quelle oder das Ziel haben Sie die Flexibilität, dieselbe Data-Loader-Aufgabe für verschiedene Datenquellen oder Datenziele zur Entwurfs- oder Laufzeit zu verwenden.
Sie können einen Parameter für jede der folgenden Ressourcen verwenden, sowohl beim Laden eines einzelnen Datenentitys als auch beim Laden mehrerer Datenentitys:
- Quelldatenasset, -verbindung und Schema oder Bucket
- Zieldatenasset, -verbindung und Schema oder Bucket
Wenn der Datenassettyp "Objektspeicher" lautet, können Sie den Bucket (das Schema) parametrisieren, jedoch nicht das Compartment, das den Bucket enthält.
Mit der Datenentityressource können Sie die Quellentity oder die Zielentity nur unter den folgenden Bedingungen parametrisieren:
- Bei Verwendung des Ladetyps einer einzelnen Datenentity
- Beim Erstellen einer neuen Datenentity im Ziel durch Eingabe eines Entitynamens
- Bei Verwendung einer vorhandenen Datenentity im Ziel
Wenn Sie eine Ressource in Quelle und Ziel parametrisieren, fügt Data Integration automatisch die folgenden Parameternamen hinzu und verwendet sie:
Ressource | Name des Quellparameters | Zielparametername |
---|---|---|
Datenasset | SOURCE_DATA_ASSET |
TARGET_DATA_ASSET |
Verbindung | SOURCE_CONNECTION |
TARGET_CONNECTION |
Schema oder Bucket | SOURCE_SCHEMA |
TARGET_SCHEMA |
Datenentity | SOURCE_DATA_ENTITY |
TARGET_DATA_ENTITY |
Informationen zum Parametrisieren einer Ressource im Ziel finden Sie auch unter Parameter für Quell- oder Zielressourcen wiederverwenden.
Parameter hinzufügen, bearbeiten und entfernen
Sie verwalten Parameter im Schritt "Quelle" und im Schritt "Ziel", wenn Sie die Data-Loader-Aufgabe erstellen.
Nachdem Sie ein Quelldatenasset, eine Verbindung, ein Schema oder eine Datenentity ausgewählt haben, können Sie einer Ressource einen Parameter zuweisen, indem Sie Parametrisieren neben der Ressource auswählen.
Wenn Sie für Zielressourcen ein Ziel-Datenasset, eine Verbindung, ein Schema oder eine Datenentity auswählen, können Sie einer Ressource einen Parameter zuweisen, indem Sie Parametrisieren neben der Ressource auswählen.
Informationen zum Parametrisieren einer Ressource in der Quelle oder im Ziel finden Sie auch unter Parameter für Quell- oder Zielressourcen wiederverwenden.
Nachdem Parameter hinzugefügt wurden, können Sie einen Parameternamen bearbeiten und eine Beschreibung hinzufügen. Siehe Ressourcenparameter bearbeiten.
Informationen zum Entfernen eines Parameters, der einer Ressource zugewiesen ist, finden Sie unter Ressourcenparameter entfernen.
Parameter für Quell- oder Zielressourcen wiederverwenden
Beispiel: Sie haben das Quelldatenasset, die Verbindung, das Schema oder die Datenentity in einer Data-Loader-Aufgabe parametrisiert. Um die Zielressourcen zu parametrisieren, anstatt Parametrisieren auszuwählen, können Sie den Parameter Quell-<Ressourcentyp> wiederverwenden auswählen, um dieselben Parameter zu verwenden wie diejenigen, die den Ressourcen desselben Typs in der Quelle hinzugefügt wurden.
Wenn Sie die Zielressourcen parametrisiert haben und die Zielparameter für die Ressourcen desselben Typs in der Quelle verwenden möchten, können Sie Parameter <resource type> des Ziels wiederverwenden auswählen, um das Quelldatenasset, die Verbindung, das Schema oder die Datenentity zu parametrisieren.
Wenn Sie eine Quell- oder Zielressource parametrisieren, indem Sie den Ressourcenparameter desselben Typs im Ziel oder in der Quelle wiederverwenden, erstellt Data Integration keinen neuen Parameter. Stattdessen wird nur ein Parameter für einen Ressourcentyp verwendet, der sich in der Quelle und im Ziel befindet.
Beispiel: Wenn ein Object Storage-Quelldatenasset parametrisiert ist, lautet der Name des Object Storage-Zieldatenassetparameters SOURCE_DATA_ASSET
, wenn Sie den Quellparameter für das Zieldatenasset wiederverwenden, wie in der folgenden Tabelle gezeigt:
Zielressource | Zielparametername bei Wiederverwendung des Quellparameters desselben Typs |
---|---|
Datenasset | SOURCE_DATA_ASSET |
Verbindung | SOURCE_CONNECTION |
Schema oder Bucket | SOURCE_SCHEMA |
Datenentity | SOURCE_DATA_ENTITY |
Wenn eine Object Storage-Zielressource wie die Verbindung parametrisiert ist, lautet der Verbindungsparameter der Object Storage-Quelle TARGET_CONNECTION
, wenn Sie den Zielparameter für die Quellverbindung wiederverwenden.
Ressource auf Quelle | Quellparametername bei Wiederverwendung des Zielparameters desselben Typs |
---|---|
Datenasset | TARGET_DATA_ASSET |
Verbindung | TARGET_CONNECTION |
Schema oder Bucket | TARGET_SCHEMA |
Datenentity | TARGET_DATA_ENTITY |