Verbindung zu Datenquellen erstellen

In diesem Tutorial erstellen Sie Datenassets für die Datenquellen, indem Sie Object Storage als Quelle und Autonomous Data Warehouse als Ziel verwenden.

Bevor Sie beginnen

Sie benötigen Folgendes:

  • Zugriff auf einen Data Integration-Workspace. Siehe Verbindung zu Data Integration herstellen.
  • Beispieldaten importieren in einen Objektspeicher-Bucket.
  • Die OCID des erstellten Workspace. Siehe Workspace-OCID abrufen.
  • Policys im erforderlichen Compartment, und zwar:

    • So verwenden Sie den Object Storage-Service:
      allow group <group_name> to use object-family in compartment <compartment-name>
      allow any-user to read buckets in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace_ocid>', request.operation = 'GetBucket'}
      allow any-user to manage objects in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace_ocid>'}
    • So verwenden Sie Oracle Autonomous Data Warehouse als Ziel:
      allow any-user to manage buckets in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace_ocid>', request.permission = 'PAR_MANAGE'}
      

    Eine Referenz finden Sie unter Policy mit der Konsole erstellen und Policy-Beispiele zum Aktivieren des Zugriffs auf OCI Object Storage.

  • Zugriff auf eine Autonomous Data Warehouse-Datenbank, einschließlich Zugangsdaten und Wallet-Datei. Siehe Informationen zur Datenbankverbindung herunterladen.
  • Benutzername und Kennwort zum Herstellen einer Verbindung bei der Erstellung eines neuen Datenassets. Sie erstellen den Benutzernamen und das Kennwort später in diesem Tutorial.

1. Quelldatenasset erstellen

In diesem Tutorial dient Oracle Cloud Infrastructure Object Storage als Quelldatenasset.

So erstellen Sie Datenassets für Oracle Cloud Infrastructure Object Storage:

  1. Wählen Sie auf der Homepage des Workspace in der Kachel Design die Option Datenasset erstellen aus.
    Informationen zum Suchen des Data Integration-Workspace finden Sie unter Workspace erstellen und aufrufen.
  2. Wählen Sie im Bereich Datenassettyp auswählen unter Connector-Typ die Option Alle aus. Wählen Sie dann das Symbol OCI Object Storage aus.

    Wenn OCI Object Storage nicht angezeigt wird, geben Sie obj in das Suchfeld ein.

  3. Geben Sie auf der Seite Datenasset erstellen Werte in die Felder im Abschnitt Allgemeine Informationen ein:
    1. Geben Sie unter Name den Namen Data_Lake ohne Leerzeichen ein. Sie dürfen nur alphanumerische Zeichen, Bindestriche, Punkte und Unterstriche verwenden.
    2. Geben Sie unter Beschreibung eine Beschreibung für das Datenasset ein.
    3. Im Menü Typ wird bereits der ausgewählte OCI Object Storage angezeigt.
    4. Die Felder Mandanten-OCID und Namespace werden automatisch für Sie ausgefüllt.
      Hinweis

      Bei dieser Prozedur wird davon ausgegangen, dass sich der Workspace und die Object Storage-Ressourcen innerhalb desselben Mandanten befinden.

      Der Namespace-Wert basiert auf dem Mandanten-OCID-Wert. Wenn das Feld Namespace nicht automatisch ausgefüllt wird, können Sie den Mandantennamen eingeben.

    5. Wählen Sie unter OCI-Region die Region für die Object Storage-Ressource aus, oder beginnen Sie mit der Eingabe eines Namens, um die Liste zu filtern. Wählen Sie dann eine Region aus der gefilterten Liste aus.
      Wichtig

      Die Object Storage-Datenquelle, die Sie als Quell- oder Zieldatenasset in Data Integration einrichten, wird mit der Regions-ID, dem Namespace und dem Bucket-Namen identifiziert. Wenn die Quell- und Zieldatenassets unterschiedliche Regions-IDs, Namespaces und Bucket-Namen aufweisen, treten keine Probleme auf. Wenn Quelle und Ziel denselben Bucket-Namen, aber unterschiedliche Regions-IDs und Namespaces aufweisen, oder wenn sie denselben Namespace, aber unterschiedliche Regions-IDs und Bucket-Namen haben, treten auch keine Probleme auf. Wenn die Quell- und Zieldatenassets jedoch nur unterschiedlich sind und der Namespace und der Bucket-Name identisch sind, können Data Integration-Aufgaben nicht erfolgreich ausgeführt werden.
    6. Ignorieren Sie das Informationsfeld Policy zur Verwendung von Datenassets aktivieren, wenn Sie die erforderlichen Policys bereits hinzugefügt haben. Wählen Sie andernfalls Weitere Informationen anzeigen aus, um die Details des Policy-Names und der Policy-Anweisungen anzuzeigen, welche zur Verwendung des Object Storage-Datenassets erforderlich sind. Fügen Sie die Policys hinzu, oder kopieren Sie sie, indem Sie den Gruppennamen und das Compartment in den Anweisungen angeben.
  4. Geben Sie im Abschnitt Standardverbindungsinformationen einen Namen und eine Beschreibung (optional) ein.
  5. (Optional) Wählen Sie Verbindung testen aus.
    Zum Erstellen des Datenassets ist kein erfolgreicher Test erforderlich.
  6. Wählen Sie Erstellen.

2. Zieldatenbank vorbereiten

Um alle Tutorials in dieser Reihe abzuschließen, konfigurieren Sie die autonome Zieldatenbank, um ein Schema und eine Tabelle hinzuzufügen.

So bereiten Sie die autonome Zieldatenbank mit dem BETA-Schema vor:

  1. Wählen Sie im Navigationsmenü der Konsole die Option Oracle Database aus, und wählen Sie Datenbank automatisch aus.
  2. Wählen Sie das Compartment mit der autonomen Datenbank aus, die Sie verwenden möchten.
  3. Wählen Sie in der Liste der autonomen Datenbanken die Datenbank aus.
  4. Wählen Sie unter Database Actions SQL aus.
    Wenn Sie dazu aufgefordert werden, melden Sie sich mit den Administratorzugangsdaten für die autonome Datenbank an.
  5. Um den BETA-Benutzer zu erstellen, geben Sie das folgende Skript in das SQL-Arbeitsblatt ein, und führen Sie es aus:
    create user BETA identified by "<example-password>";
    grant DWROLE to BETA;
    alter user BETA quota 200M on data;
    Hinweis

    Geben Sie ein Kennwort anstelle von <example-password> ein.
  6. Führen Sie die folgenden SQL-Anweisungen zum Erstellen der Tabelle CUSTOMERS_TARGET aus.
    CREATE TABLE "BETA"."CUSTOMERS_TARGET"
       ("CUST_ID" NUMBER,
        "LAST_NAME" VARCHAR2(200 BYTE),
        "FIRST_NAME" VARCHAR2(200 BYTE),
        "FULL_NAME" VARCHAR2(200 BYTE),
        "STREET_ADDRESS" VARCHAR2(400 BYTE),
        "POSTAL_CODE" VARCHAR2(10 BYTE),
        "CITY_ID" NUMBER,
        "CITY" VARCHAR2(100 BYTE),
        "STATE_PROVINCE_ID" NUMBER,
        "STATE_PROVINCE" VARCHAR2(100 BYTE),
        "COUNTRY_ID" NUMBER,
        "COUNTRY" VARCHAR2(400 BYTE),
        "CONTINENT_ID" NUMBER,
        "CONTINENT" VARCHAR2(400 BYTE),
        "AGE" NUMBER,
        "COMMUTE_DISTANCE" NUMBER,
        "CREDIT_BALANCE" NUMBER,
        "EDUCATION" VARCHAR2(40 BYTE),
        "EMAIL" VARCHAR2(416 BYTE),
        "FULL_TIME" VARCHAR2(40 BYTE),
        "GENDER" VARCHAR2(6 BYTE),
        "HOUSEHOLD_SIZE" NUMBER,
        "INCOME" NUMBER,
        "INCOME_LEVEL" VARCHAR2(20 BYTE),
        "INSUFF_FUNDS_INCIDENTS" NUMBER,
        "JOB_TYPE" VARCHAR2(200 BYTE),
        "LATE_MORT_RENT_PMTS" NUMBER,
        "MARITAL_STATUS" VARCHAR2(8 BYTE),
        "MORTGAGE_AMT" NUMBER,
        "NUM_CARS" NUMBER,
        "NUM_MORTGAGES" NUMBER,
        "PET" VARCHAR2(40 BYTE),
        "PROMOTION_RESPONSE" NUMBER,
        "RENT_OWN" VARCHAR2(40 BYTE),
        "SEG" NUMBER,
        "WORK_EXPERIENCE" NUMBER,
        "YRS_CURRENT_EMPLOYER" NUMBER,
        "YRS_CUSTOMER" NUMBER,
        "YRS_RESIDENCE" NUMBER,
        "COUNTRY_CODE" VARCHAR2(2 BYTE),
        "ORDER_NUMBER" NUMBER,
        "REVENUE" NUMBER
       ) SEGMENT CREATION IMMEDIATE
      PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255
     NOCOMPRESS LOGGING
      STORAGE(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645
      PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1
      BUFFER_POOL DEFAULT FLASH_CACHE DEFAULT CELL_FLASH_CACHE DEFAULT)
      TABLESPACE "USERS" ;
     
    --------------------------------------------------------
    --  Constraints for Table CUSTOMERS_TARGET
    --------------------------------------------------------
      ALTER TABLE "BETA"."CUSTOMERS_TARGET" MODIFY ("CUST_ID" NOT NULL ENABLE);
      ALTER TABLE "BETA"."CUSTOMERS_TARGET" MODIFY ("SEG" NOT NULL ENABLE);
  7. Wechseln Sie im Navigator-Bereich auf der linken Seite zum BETA-Schema, um zu prüfen, ob die Tabelle erfolgreich erstellt wurde.
    Möglicherweise müssen Sie sich abmelden und dann erneut anmelden.
  8. Melden Sie sich von der SQL-Seite ab.

3. Zieldatenasset erstellen

Navigieren Sie zurück zu "Datenintegration", um das Zieldatenasset zu erstellen.

So erstellen Sie ein Datenasset für das Ziel:

  1. Wählen Sie auf der Homepage des Workspace in der Kachel Design die Option Datenasset erstellen aus.
    Informationen zum Suchen des Data Integration-Workspace finden Sie unter Workspace erstellen und aufrufen.
  2. Wählen Sie im Bereich Datenassettyp auswählen unter Connector-Typ die Option RDBMS aus. Wählen Sie dann das Symbol Oracle ADW aus.
  3. Füllen Sie auf der Seite Datenasset erstellen die Felder im Abschnitt Allgemeine Informationen aus:
    • Name: Data_Warehouse (Sie dürfen nur alphanumerische Zeichen, Bindeglieder, Punkte und Unterpunkte verwenden).
    • ID: Eine generierte ID, die auf dem Wert basiert, den Sie für "Name" eingeben. Sie können den generierten Wert ändern. Nach dem Speichern des Datenassets ist es jedoch nicht mehr zulässig, die ID zu aktualisieren.
    • Beschreibung: Optional
    • Typ: Im Menü Typ wird bereits das ausgewählte Oracle Autonomous Data Warehouse angezeigt.
    • Wallet hochladen und Wallet-Datei: Wählen Sie die Wallet-Datei für den Zugriff auf die Datenbank per Drag-and-Drop aus, oder navigieren Sie zu "Durchsuchen", um sie auszuwählen.
  4. Wählen Sie im Abschnitt Standardverbindungsinformationen folgende Optionen aus:
    • Name: Standardverbindung (Optional können Sie die Verbindung umbenennen)
    • Beschreibung: Optional (Beispiel: Mit BETA-Benutzer verbinden)
    • Benutzername: BETA
    • Kennwort verwenden: Das Kennwort, das Sie für BETA erstellt haben.

      Es wird empfohlen, ein Vault Secret zu erstellen und dann Vault-Secret-OCID verwenden als BETA-Benutzerkennwort auszuwählen. Siehe Vault, Keys und Secrets.

    • TNS-Alias: Der zu verwendende Datenbankservice
  5. Geben Sie im Abschnitt Standard-Speicherort für Staging Area Folgendes ein:
    • Object Storage-Datenasset: Das Object Storage-Datenasset mit dem Bucket, den Sie als Standard-Staging verwenden möchten
    • Verbindung: Die Verbindung
    • Compartment: Das Compartment
    • Bucket: Der Bucket-Name
  6. (Optional) Wählen Sie Verbindung testen aus.
    Zum Erstellen des Datenassets ist kein erfolgreicher Test erforderlich.
  7. Wählen Sie Erstellen.