Wenn Sie ein Dataset erstellen, führt Oracle Analytics Profiling auf Spaltenebene für das Dataset durch, um ein Set aus semantischen Empfehlungen zum Reparieren oder Anreichern der Daten zu generieren. Beim Erstellen von Arbeitsmappen können Sie auch Knowledge-Anreicherungen aus dem Datenbereich zu Ihren Visualisierungen hinzufügen.
Diese Empfehlungen basieren auf der automatischen Erkennung eines bestimmten Semantic Types während des Profilschritts. Beispiel: Datasets, die auf lokalen Themenbereichen basieren, werden dem Profiling mit einer einfachen Top N-Stichprobe unterzogen.
Es gibt verschiedene Kategorien von Semantic Types, wie geografische Standorte (angegeben durch Ortsnamen), erkennbare Muster wie Kreditkartennummern, E-Mail-Adressen und Sozialversicherungsnummern, Datumsangaben und wiederkehrende Muster. Sie können auch eigene, benutzerdefinierte Semantic Types erstellen.
Profiling wird auf verschiedene Semantic Types angewendet.
Semantic-Type-Kategorien werden dem Profiling unterzogen, um Folgendes zu identifizieren:
Empfehlungen zum Reparieren, Erweitern oder Anreichern des Datasets werden durch den Typ der Daten bestimmt.
Beispiele für Semantic-Type-Empfehlungen:
Semantic Types werden basierend auf Mustern in den Daten identifiziert.
Für diese Semantic Types werden Empfehlungen abgegeben:
Die Erkennung von Semantic Types wird durch geladene Referenzdaten bestimmt, die mit dem Service bereitgestellt werden.
Für diese Semantic Types werden referenzbasierte Empfehlungen abgegeben:
Empfohlene Anreicherungen basierend auf den Semantic Types.
Anreicherungen werden basierend auf der geografischen Standorthierarchie bestimmt:
Der Profilingprozess nutzt bestimmte Schwellenwerte, um Entscheidungen zu bestimmten Semantic Types zu treffen.
Im Allgemeinen müssen 85 % der Datenwerte in der Spalte die Kriterien für einen einzelnen Semantic Type erfüllen, damit die Klassifizierung vorgenommen wird. Eine Spalte mit 70 % Vornamen und 30 % sonstigen Daten erfüllt daher nicht die Schwellenwertanforderungen, sodass in diesem Fall keine Empfehlungen gegeben werden.
Mit benutzerdefinieren Knowledge-Empfehlungen können Sie die Oracle Analytics-System-Knowledge-Ressourcen ergänzen. Mit benutzerdefinierten Knowledge-Ressourcen kann der semantische Profiler von Oracle Analytics geschäftsspezifischere Semantic Types identifizieren und relevantere und besser gesteuerte Anreicherungsempfehlungen abgeben. Beispiel: Sie können eine benutzerdefinierte Knowledge-Referenz hinzufügen, die verschreibungspflichtige Medikamente in die USP-Arzneimittelkategorien "Analgetika" und "Opioide" einteilt.