Identifizieren Sie Verbindungen in Daten, und führen Sie Diagrammanalysen mit Oracle Autonomous Database aus
Diagrammdatenbanken und Diagrammanalysen sind integraler Bestandteil des konvergenten Datenbankangebots von Oracle. Dank der in Oracle Database integrierten Diagrammfunktionen ist keine separate, einzweckübergreifende Datenbank erforderlich, und Ihre Daten werden repliziert. Analysten und Entwickler können umfassende Analysen durchführen, um Verbindungen in Daten zu finden, die Einblicke wie Kundentrends oder Betrugserkennung liefern oder die Rückverfolgbarkeit in der intelligenten Fertigung verbessern. Das Unternehmen kann diese Analysen durchführen und erhält gleichzeitig Sicherheit auf Unternehmensebene, die Datenaufnahme und den Support für mehrere Arten von Daten-Workloads.
Oracle Autonomous Database (ADB) bietet ein integriertes Selfservice-Tool mit einem Mausklick mit dem Namen Graph Studio, das die Modellierung, Verwaltung, Analyse und Visualisierung von Diagrammen über einen Datenlebenszyklus hinweg automatisiert und vereinfacht. Graph Studio bietet Zugriff auf eine umfassende Gruppe von Diagrammanalysen, darunter mehr als 60 vordefinierte Diagrammalgorithmen und eine SQL-ähnliche deklarative Sprache namens Property Graph Query Language (PGQL). Graph Studio unterstützt Notizbücher, mit denen Daten-Enthusiasten und Entwickler eine Schritt-für-Schritt-Analyse durchführen können, während eine In-Memory Graph Analytics Engine (PGX) für höchste Performance verwendet wird.
Diagramme sind eine sehr intuitive Methode zur Modellierung von Daten und konzentrieren sich bei der Verbindung der meisten Daten auf die Verbindungen zwischen Datenentitys. Mit Diagrammen können Sie leichter zwischen verbundenen Datenentitys navigieren, Links explorieren und neue Schlussfolgerungen ziehen. Die Hauptkomponenten von Diagrammen sind Scheitelpunkte (oder Knoten) und Kanten, die zwei Scheitelpunkte verbinden. Typische Beispiele für Diagramme sind soziale Netzwerke, Geldflüsse, Stücklisten oder Datenherkunft.
Die folgende Abbildung zeigt, wie die Diagrammanalyse gut geeignet ist, um Betrug in Finanztransaktionen zu identifizieren.
Beschreibung der Abbildung graph-analysis-example.png
Um die Betrugserkennung zu vereinfachen, können Sie ein Diagramm aus Transaktionen zwischen Entitäten und Entitäten erstellen, die einige Informationen gemeinsam verwenden, einschließlich E-Mail-Adressen, Passwörtern, Adressen usw. Nachdem ein Diagramm erstellt wurde, werden bei der Ausführung einer einfachen Abfrage alle Kunden mit Konten mit ähnlichen Informationen gefunden. Außerdem wird angegeben, welche Konten Geld aneinander senden.
Weitere Informationen und typische Beispiele für Diagramme finden Sie unter eBook "17 Anwendungsfälle für Diagrammdatenbanken und Diagrammanalysen". Sie finden es im Abschnitt "Mehr entdecken" am Ende dieser Referenzarchitektur.
- Diagrammalgorithmen ausführen
Diagrammalgorithmen analysieren Pfade und Abstände zwischen Scheiteln, die Bedeutung von Scheiteln oder das Clustering von Scheiteln. Sie sind nützlich für:
- Erkennen von Communitys (z. B. Louvain, Label Propagation)
- Erkennen verbundener Komponenten (z. B. stark verbundene Komponenten, schwach verbundene Komponenten)
- Bewertungsstrukturen (z. B. Cycle Detection, Triangle Counting, Reachability)
- Vorhersagen von Links (z. B. Whom-to-Follow), Einstufung und Gehen von Knoten in einem Diagramm (z. B. PageRank, Gradzentralität, Näherungszentralität, SALSA)
- Pfade suchen (z.B. Bellman-Ford, Dijkstra, Fattest Path, Hop Distance)
- Abfragen für Diagrammmusterabgleich ausführen
Diagrammmusterabgleichabfragen können Muster wie Zyklen oder indirekte Abhängigkeiten zwischen Scheiteln und Kanten erkennen, die einer bestimmten Gruppe von Constraints entsprechen.
Architektur
Diese Architektur verwendet Oracle Autonomous Data Warehouse als zentralisiertes Data Warehouse mit Daten, die aus mehreren Unternehmens-Repositorys und Abteilungsdatenquellen geladen und kuratiert wurden.
Anschließend werden Daten mit Graph Studio als Diagramme modelliert. Mit der integrierten Notizbuchschnittstelle von Graph Studio mit Interpretern für Java, PGQL und Python können Sie schnell Diagrammalgorithmen ausführen, Diagramme abfragen und Ergebnisse visualisieren. Mit dieser Referenzarchitektur können Sie mit Diagrammen beginnen und eine Übungsumgebung für die Diagrammanalyse erstellen, ohne dass zusätzliche Tools oder Softwarekomponenten erforderlich sind. Sie können mit Diagrammen arbeiten, die Millionen von Scheiteln und Kanten enthalten, einschließlich deren Eigenschaften.
Das folgende Diagramm ist eine funktionale Darstellung der Referenzarchitektur.
propertygraph-analysis-arch-oracle.zip
- Datenreparatur
Erfasst und verfeinert die Daten für die Verwendung in den einzelnen Datenebenen in der Architektur. Die Form soll die Unterschiede in den Verarbeitungskosten für das Speichern und Verfeinern von Daten auf jeder Ebene und das Verschieben von Daten zwischen ihnen veranschaulichen.
- Datenpersistenzplattform (beschädigte Informationsschicht)
Ermöglicht den Zugriff und die Navigation der Daten zur Anzeige der aktuellen Geschäftsansicht. Auf dieser Ebene können Sie Diagrammansichten oder persistente Diagrammstrukturen aus relationalen Daten erstellen.
- Zugang und Interpretation
abstrahiert die logische Geschäftsansicht der Daten für die Consumer. Diese Abstraktion erleichtert agile Ansätze zur Datenanalyse und bietet eine einzige Analyseschicht für Ihre kuratierten Daten.
Die Architektur umfasst die folgenden Komponenten:
- Datenintegration
Oracle Autonomous Database verfügt über die eingebetteten Tools, die Sie benötigen, um Ihre Daten für viele Abteilungsszenarios und spezielle Anwendungsfälle zu erfassen, zu laden und zu transformieren. Autonomous Data Warehouse ermöglicht das schnelle Laden von Daten aus dem lokalen oder Objektspeicher. Außerdem sind autonome Datentransformationen enthalten, mit denen Sie sich mit Daten aus vielen verschiedenen Quelltypen verbinden und auf die EL-T-Typfunktionalität zugreifen können.
Oracle Cloud Infrastructure Data Integration Cloud ist für komplexere Anwendungsfälle gedacht. Es handelt sich um einen vollständig verwalteten, serverlosen, nativen Cloud-Service. Mit dem Service können Sie Aufgaben zum Extrahieren, Laden und Transformieren (ETL) von Daten aus verschiedenen Quellen entwerfen und ausführen.
- Object Storage
Oracle Cloud Infrastructure Object Storage ist eine internetbasierte, leistungsstarke Speicherplattform, die zuverlässige und kostengünstige Dauerhaftigkeit von Daten bietet. Oracle Cloud Infrastructure Object Storage kann eine unbegrenzte Menge unstrukturierter Daten eines beliebigen Inhaltstyps speichern. Dazu zählen auch analytische Daten. In einem Object Storage-Bucket können Sie beispielsweise abteilungsspezifische Daten abrufen und diese in einem Object Storage-Bucket speichern. Anschließend können Sie mit den Dataload-Tools der Autonomous Database Daten aus einem Bucket in Autonomous Database laden.
- Autonomous Database (ADW, ATP)
Oracle Autonomous Database ist ein selbststeuernder, selbstsichernder und selbstreparierender Datenbankservice, der für Data Warehousing-Workloads optimiert ist. Sie müssen keine Hardware konfigurieren oder verwalten und keine Software installieren. Oracle Cloud Infrastructure verarbeitet das Erstellen der Datenbank sowie das Backup, Patching, Upgrade und Tuning der Datenbank. Mit Autonomous Data Warehouse können Sie Daten flexibel in mehrere Formate laden, einschließlich strukturierter JSON-, XML-, Diagramm- und Spatial-Formate. Zusammen mit diesem Service sind die autonomen Tools zusammengefasst, mit denen Sie Daten in Tabellen laden und leichte ETL-Vorgänge effizient ausführen können.
- Graph Studio
Graph Studio ist ein Feature von Oracle Autonomous Database auf Shared Infrastructure. Sie ist in Autonomous Transactional Processing (ATP) und Autonomous Data Warehouse (ADW) integriert. Es bietet Tools für Entwickler, Analysten, Data Engineers und Data Scientists, die mit Diagrammen arbeiten. Graph Studio enthält eine Low-Code-Benutzeroberfläche, die Diagrammmodellierungsdiagramme aus vorhandenen relationalen Tabellen in Ihrem Data Warehouse automatisiert, Diagrammanalysen durchführen, Diagrammanwendungen entwickeln und Ergebnisse visualisieren und teilen. Mit der Kombination aus Autonomous Database und Graph Studio erhalten Sie eine vollständige Graphdatenbankplattform, die in Minutenschnelle mit Provisioning, integriertem Tooling und Sicherheit per Mausklick bereitgestellt werden kann. Sie müssen kein Datenbankexperte oder Graph-Spezialist sein, um zu beginnen und produktiv zu sein.
Das folgende Diagramm zeigt eine Zuordnung der obigen Architektur zu den in Oracle Cloud Infrastructure bereitgestellten Services anhand von Best Practices zur Sicherheit.
Beschreibung der Abbildung oci-adb-graph-studio-arch.png
OCI-adb-graph-studio-arch-oracle.zip
Diese Referenzarchitektur enthält die folgenden Hauptkomponenten:
- Virtuelles Cloud-Netzwerk (VCN) und Subnetz
Ein VCN ist ein anpassbares, Softwaredefiniertes Netzwerk, das Sie in einer Oracle Cloud Infrastructure-Region einrichten. Wie bei traditionellen Data Center-Netzwerken haben VCNs die vollständige Kontrolle über Ihre Netzwerkumgebung. Ein VCN kann mehrere sich nicht überschneidende CIDR-Blöcke aufweisen, die Sie nach dem Erstellen des VCN ändern können. Sie können ein VCN in Subnetze segmentieren, die für eine Region oder eine Availability-Domain gelten können. Jedes Subnetz besteht aus einem nachfolgenden Adressbereich, der sich nicht mit den anderen Subnetzen im VCN überschneidet. Sie können die Größe eines Subnetzes nach der Erstellung ändern. Ein Subnetz kann öffentlich oder privat sein.
- Availability-Domain
Availability-Domains sind eigenständige, unabhängige Data Center innerhalb einer Region. Die physischen Ressourcen in jeder Availability-Domain sind von den Ressourcen in den anderen Availability-Domains isoliert, was Fehlertoleranz bietet. Availability-Domains haben keine gemeinsame Infrastruktur wie Stromversorgung oder Kühlung oder das interne Availability-Domainnetzwerk. Es ist also unwahrscheinlich, dass der Fehler in einer Availability-Domain die anderen Availability-Domains in der Region beeinflusst.
- Bastionhost
Der Bastionhost ist eine Compute-Instanz, die als sicherer, kontrollierter Einstiegspunkt für die Topologie von außerhalb der Cloud dient. Der Bastionhost wird in der Regel in einer demilitarisierten Zone (DMZ) bereitgestellt. Damit können Sie sensible Ressourcen schützen, indem Sie sie in privaten Netzwerken platzieren, auf die nicht direkt von außerhalb der Cloud zugegriffen werden kann. Die Topologie verfügt über einen einzelnen, bekannten Einstiegspunkt, mit dem Sie regelmäßig überwachen und auditieren können. So können Sie vermeiden, die sensibleren Komponenten der Topologie freizugeben, ohne den Zugriff darauf zu beeinträchtigen.
- Network Address Translation-(NAT-)Gateway
Ein NAT-Gateway ermöglicht privaten Ressourcen in einem VCN den Zugriff auf Hosts im Internet, ohne dass diese Ressourcen für eingehende Internetverbindungen freigegeben werden.
- Internetgateway
Das Internetgateway ermöglicht Traffic zwischen den öffentlichen Subnetzen in einem VCN und dem öffentlichen Internet.
- Servicegateway
Das Servicegateway ermöglicht den Zugriff von einem VCN auf andere Services, wie Oracle Cloud Infrastructure Object Storage. Der Traffic vom VCN zum Oracle-Service durchläuft die Oracle-Netzwerk-Fabric und nie das Internet.
- Autonomous Database mit Autoscaling
In dieser Architektur kann Oracle Autonomous entweder Autonomous Data Warehouse (ADW) oder Autonomous Transactional Processing (ATP) sein, die mit Autoscaling und privatem Endpunkt konfiguriert ist. Sie dient zum Speichern anwendungsspezifischer Daten sowie zum Modellieren, Erstellen, Verwalten, Abfragen und Visualisieren von Diagrammen. Eine Access Control-Liste (ACL) begrenzt den Netzwerkzugriff auf Autonomous Database. Es verfügt über einen vorab erstellten Anwendungsbenutzer mit den erforderlichen Rechten zum Entwickeln und Verwalten von Diagrammen und zur Verwendung von Graph Studio als eingebettetes Tool der Autonomous Database. Beispieldaten werden vorab in das Datenbankbenutzerschema geladen, um einen einfachen Start mit Graph Studio zu ermöglichen.
Empfehlungen
- Daten-Refinery
Autonomous Database Tools ist in Oracle Autonomous Data Warehouse eingebettet und bietet die Funktionen zum Laden, Transformieren, Katalogisieren, Gewinnen von Erkenntnissen und zum Entwickeln von Geschäftsmodellen auf einfache und einfache Weise.
- Graph StudioBevor Sie sich bei Graph Studio anmelden, wird Folgendes empfohlen:
- Datenbankbenutzer mit den erforderlichen Berechtigungen erstellen.
- Mit dem Schätzer für Diagrammgröße können Sie die Größe des Diagramms schätzen. Die maximal zulässige In-Memory-Darstellung für ein Diagramm, das in den Graph Studio-Speicher geladen wird, beträgt 109 GB.
Hinweis:
Wenn Ihr Diagramm voraussichtlich mehr als 109 GB belegt, sollten Sie Oracle Graph Server and Clients-Tools von Oracle MarketPlace in einer Compute-VM mit dem erforderlichen Speicher bereitstellen. Die Ausprägungen VM.Standard.E3.Flex und VM.Standard.E4.Flex können bis zu 1024 GB Arbeitsspeicher aufweisen.
Hinweise
Berücksichtigen Sie beim Laden und Konfigurieren von Daten aus mehreren Datenbanken und Dateiquellen in ein zentrales Data Warehouse, das für die Diagrammanalyse aktiviert ist, die folgenden Implementierungsoptionen:
Richtlinien | Daten-Refinery | Datenpersistenzplattform | Zugriff und Interpretation |
---|---|---|---|
Empfohlen | Oracle Autonomous Database-Tools | Oracle Autonomous Database (ADW oder ATP) | Oracle Graph Studio |
Andere Optionen |
|
|
|
- Datengravitation:
Halten Sie Ihre Diagrammanalysevorgänge Ihren Daten nahe, um die hohen Kosten für die Datenverschiebung zu senken.
Bereitstellen
Der Terraform-Code für diese Referenzarchitektur ist als Beispielstack in Oracle Cloud Infrastructure Resource Manager verfügbar. Sie können den Code auch von GitHub herunterladen und an Ihre spezifischen Anforderungen anpassen.
- Mit dem Beispielstack in Oracle Cloud Infrastructure Resource Manager bereitstellen:
- Klicken Sie auf
Wenn Sie noch nicht angemeldet sind, geben Sie den Mandanten und die Benutzerzugangsdaten ein.
- Wählen Sie die Region aus, in der Sie den Stack bereitstellen möchten.
- Befolgen Sie die Prompts und Anweisungen zum Erstellen des Stacks auf dem Bildschirm.
- Nachdem Sie den Stack erstellt haben, klicken Sie auf Terraform-Aktionen, und wählen Sie Planen aus.
- Warten Sie, bis der Job abgeschlossen ist, und prüfen Sie den Plan.
Um Änderungen vorzunehmen, kehren Sie zur Seite "Stackdetails" zurück, klicken Sie auf Stack bearbeiten, und nehmen Sie die erforderlichen Änderungen vor. Führen Sie dann die Aktion Planen erneut aus.
- Wenn keine weiteren Änderungen erforderlich sind, kehren Sie zur Seite "Stackdetails" zurück, klicken Sie auf Terraform-Aktionen, und wählen Sie Anwenden aus.
- Klicken Sie auf
- Mit dem Terraform-Code in GitHub bereitstellen:
- Gehen Sie zu GitHub.
- Klonen oder laden Sie das Repository auf Ihren lokalen Rechner herunter.
- Befolgen Sie die Anweisungen im Dokument
README
.
Mehr erfahren
Weitere Informationen zu den Features dieser Architektur finden Sie in den folgenden Ressourcen.
- Produktseite: Oracle Graph Database and Graph Analytics
- E-Book: 17 Anwendungsfälle für Diagrammdatenbank und Diagrammanalyse
- Überblick über technische Funktionen: Oracle Graph Technologies
- Dokumentation: Oracle Property Graph
- LiveLabs Workshop: Erste Schritte mit Graph Analytics auf Oracle Autonomous Database
- YouTube-Kanal: Oracle Spatial und Oracle Graph
- Projektseite: Property Graph Query Language (PGQL)
- Oracle Labs-Projektseite: Parallel Graph AnalytiX (PGX)