Hinweis:

Verbindung von Alteryx mit Oracle Big Data Service Hive mit ODBC und Kerberos herstellen

Einführung

Oracle Big Data Service ist ein cloud-basierter Service von Oracle, mit dem Benutzer Hadoop-Cluster, Spark-Cluster und andere Big Data-Services erstellen und verwalten können. Standardmäßig verwendet ein Oracle Big Data Service-Cluster einfache Authentifizierungsverfahren wie Benutzername und Kennwort zur Authentifizierung von Benutzern und Services. Dies reicht jedoch möglicherweise nicht für Unternehmen aus, die ein höheres Sicherheitsniveau benötigen.

Die Kerberos-Authentifizierung ist ein weit verbreitetes Verfahren zur Sicherung verteilter Computing-Systeme. Sie bietet eine sichere Möglichkeit zur Authentifizierung von Benutzern und Services, sodass sie sicher über ein Netzwerk kommunizieren können. In einer Kerberos-fähigen Umgebung werden Benutzer und Services mit kryptografischen Schlüsseln ausgegeben, mit denen ihre Identität geprüft und der Zugriff auf Ressourcen autorisiert wird.

Die Kerberos-Authentifizierung bietet zusätzliche Sicherheit für ein Oracle Big Data Service-Cluster, indem eine starke Authentifizierung und Verschlüsselung zwischen Knoten ermöglicht wird.

Ziele

Erfahren Sie, wie Sie eine nahtlose Verbindung zwischen Alteryx und Oracle Big Data Service Hive in einem kerberisierten Cluster herstellen. Durch die Implementierung der Kerberos-Authentifizierung können wir eine sichere Umgebung für die Datenverarbeitung und -analyse sicherstellen.

Voraussetzungen

Ein Oracle Big Data Service-Cluster, das auf Oracle Cloud Infrastructure (OCI) ausgeführt wird, wobei die erforderlichen Services konfiguriert sind und Ports geöffnet werden.

Hinweis: In einem hochverfügbaren (HA-)Oracle Big Data Service-Cluster ist Kerberos installiert. Wenn Sie ein Nicht-HA-Cluster verwenden möchten, benötigen Sie die folgende Liste der Voraussetzungen.

Hinweis: In diesem Tutorial wird ein Oracle Big Data Service-HA-Cluster verwendet. Außerdem sollten Sie sich mit folgenden Konzepten und Terminologien vertraut machen:

Aufgabe 1: Oracle Big Data Service-Cluster kern

  1. Melden Sie sich über einen SSH-Befehl beim Masterknoten des Oracle Big Data Service-Clusters an, oder verwenden Sie putty mit der Datei ppk mit den Benutzerzugangsdaten opc. Nachdem Sie sich angemeldet haben, heben Sie die Berechtigungen an den Benutzer root. In diesem Tutorial haben wir Putty für die Anmeldung bei den Knoten verwendet.

  2. Stoppen Sie alle ausgeführten Hadoop- und Spark-Services mit Ambari.

    Ambari Stop-Services

  3. Erstellen Sie das Kerberos-Principal für den bdsuser-Administrator, indem Sie die folgenden Schritte ausführen.

    • Geben Sie die Eingabeaufforderung Kadmin mit dem Befehl Kadmin.local ein.

    • Führen Sie an der Eingabeaufforderung kadmin.local den Befehl addprinc aus, um einen neuen Kerberos-Principal mit dem Namen bdsuser zu erstellen. Wenn Sie dazu aufgefordert werden, wählen Sie ein Kennwort für Ihre Voreinstellung aus, und bestätigen Sie es.

      addprinc-Befehl ausführen

    • Geben Sie exit ein, um zur ursprünglichen Eingabeaufforderung zurückzukehren. Standardmäßig ist die hier verwendete Realm aus krb5.conf ausgewählt. Sie können die Realm jedoch anpassen, indem Sie die Konfiguration aktualisieren.

  4. Erstellen Sie eine Gruppe bdsusergroup, indem Sie den Befehl dcli -C "groupadd bdsusergroup ausführen.

  5. Geben Sie in der Eingabeaufforderung den Befehl dcli -C "useradd -g bdsusergroup -G hdfs,hadoop,hive bdsuser" ein, um den Administratorbenutzer bdsuser zu erstellen und ihn den aufgelisteten Gruppen auf jedem Knoten im Cluster hinzuzufügen.

  6. Verwenden Sie den linux-Befehl id, um die Erstellung von bdsuser zu bestätigen und die Gruppenmitgliedschaft aufzulisten.

  7. Starten Sie alle Oracle Big Data Service-Services mit Ambari.

    Ambari-Startservices

  8. Testen Sie bdsuser, indem Sie das Kerberos-Ticket mit dem Befehl kinit bdsuser generieren und Dateien mit dem Befehl hadoop fs -ls / auflisten.

    Eingabeaufforderung

Aufgabe 2: Alteryx mit Oracle Big Data Service Hive verbinden

Wir haben die Kerberisierung des Oracle Big Data Service-Clusters untersucht. Jetzt lernen wir, Alteryx mit dem Kerberized Oracle Big Data Service Hive mit dem ODBC-Treiber zu verbinden.

Um das volle Potenzial Ihrer Oracle Big Data Service Hive-Daten auszuschöpfen, ist es wichtig, eine Verbindung zu Ihren bevorzugten Tools herzustellen. In diesem Abschnitt werden Sie durch den Prozess der Verbindung von Alteryx mit Oracle Big Data Service Hive geführt. Dazu konfigurieren wir eine ODBC-Verbindung, die Kerberos-Authentifizierung verwendet.

  1. Konfigurieren Sie MIT Kerberos wie folgt:

    • Kopieren Sie die Datei krb5.conf und krb5.keytab aus dem Masterknoten des Clusters in C:\Program Files\MIT\Kerberos.

    • Ändern Sie die Dateierweiterung für die Windows-Kompatibilität von .conf in .ini.

    • Erstellen Sie einen neuen Ordner C:/temp (Ordner und Pfad können beliebig sein).

    • Richten Sie die folgende Umgebungsvariable ein.

      Umgebungsvariable

    • Führen Sie den Befehl Kinit bdsuser aus der Eingabeaufforderung aus, um das Kerberos-Setup zu prüfen und das Ticket zu generieren.

  2. Installieren Sie den ODBC-Treiber auf Ihrem Windows-Rechner. Befolgen Sie die Anweisungen zur Installation des Treibers.

  3. Konfigurieren Sie den ODBC-Treiber wie folgt:

    • Erstellen Sie DNS- und IP-Einträge in der Hostdatei C:\Windows\System32\drivers\etc für den Master- und Utilityknoten.

      Beispielhostdatei

    • Testen Sie die Hosts-Dateieinträge mit dem Befehl ping.

      Alt-Text

  4. Öffnen Sie das ODBC-Datenquellenadministratortool auf Ihrem Rechner, und führen Sie die folgenden Schritte aus.

    • Wählen Sie die Registerkarte "System DSN". Klicken Sie auf Hinzufügen und auswählen für den Cloudera-ODBC-Treiber für Apache Hive, und klicken Sie dann auf Fertigstellen.

      System-DSN-Registerkarte

    • Folgen Sie dem folgenden Screenshot für die Hive-Verbindungskonfiguration.

      Hive-Verbindungskonfiguration

    • Klicken Sie auf Testen, um die Konnektivität zu prüfen. Wenn alles korrekt eingerichtet ist, sollte eine Meldung angezeigt werden, dass der Test erfolgreich war. Klicken Sie auf OK, um die Einstellung zu speichern.

      Hive-Verbindung testen

  5. Öffnen Sie Alteryx, und führen Sie die folgenden Schritte aus.

    • Gehen Sie zu Datei, wählen Sie Verbindung verwalten aus, und klicken Sie auf Datenquelle hinzufügen. Wählen Sie unter den verfügbaren Technologieoptionen Hive aus.

      Verbindung verwalten

    • Nachdem Sie die Technologieoption ausgewählt haben, werden Sie zum nächsten Bildschirm aufgefordert, auf dem Sie den DSN-Namen angeben müssen. Wählen Sie den ODBC-DSN aus, den Sie im vorherigen Schritt erstellt haben, und klicken Sie auf Speichern.

      Verbindung speichern

    • Die Verbindung wurde eingerichtet. Erstellen Sie jetzt einen Beispielworkflow, um die Daten aus Hive zu lesen. Um einen Beispielworkflow zu erstellen, klicken Sie auf Neuer Workflow, und verschieben Sie die Eingabedatenaufgabe per Drag-and-Drop.

      Neuer Workflow

    • Wählen Sie in der Verbindungsliste Hive ODBC aus.

      Verbindungsliste

    • Wählen Sie die Hive-Tabelle aus, um Daten abzurufen.

      Hive-Tabellen

    • Führen Sie den Workflow aus. Sie können sehen, dass Alteryx erfolgreich Daten aus Oracle Big Data Service Hive abrufen kann.

      Workflow starten

Nächste Schritte

Die Kerberos-Authentifizierung ist eine wesentliche Komponente eines sicheren Hadoop-Clusters. Durch das Kerberisieren Ihres Oracle Big Data Service-Clusters können Sie Ihre sensiblen Daten und Anwendungen besser vor unberechtigten Zugriffen schützen. Während der Prozess der Kerberisierung Ihres Clusters eine Herausforderung sein kann, kann eine sorgfältige Planung und ausführliche Aufmerksamkeit dazu beitragen, eine erfolgreiche Implementierung sicherzustellen. Außerdem kann es schwierig sein, Alteryx mit Oracle Big Data Service Hive über die ODBC- und Kerberos-Authentifizierung zu verbinden. Sobald die Authentifizierung eingerichtet ist, verfügen Sie über Alteryx zum Analysieren und Visualisieren Ihrer Oracle Big Data Service-Daten. Wenn Sie die in diesem Tutorial beschriebenen Schritte befolgen, sollten Sie die Verbindung einfach einrichten können.

Bei Problemen können Sie Fehler beheben. Durch ein wenig Persistenz können Sie Alteryx mit Oracle Big Data Service Hive verbinden und das volle Potenzial Ihrer Daten erschließen.

Danksagungen

Weitere Lernressourcen

Sehen Sie sich andere Übungen zu docs.oracle.com/learn an, oder greifen Sie auf weitere kostenlose Lerninhalte im Oracle Learning YouTube-Kanal zu. Besuchen Sie außerdem die Website education.oracle.com/learning-explorer, um Oracle Learning Explorer zu werden.

Produktdokumentation finden Sie im Oracle Help Center.