10 Vorlagen für die Zusammenarbeit mit Benutzern verwenden

Mit den Oracle Machine Learning Notizbuchvorlagen können Sie mit anderen Benutzern zusammenarbeiten, indem Sie Ihre Arbeit freigeben, Ihre Arbeit als Berichte veröffentlichen und Notizbücher aus Vorlagen erstellen. Sie können Ihre Notizbücher als Vorlagen speichern, Notizbücher freigeben und anderen Benutzern Beispielvorlagen bereitstellen.

Hinweis:

Sie können auch mit anderen Oracle Machine Learning Notebooks-Benutzern zusammenarbeiten, indem Sie Zugriff auf Ihren Workspace erteilen. Der authentifizierte Benutzer kann dann auf die Projekte in Ihrem Workspace zugreifen und auf Ihre Notizbücher zugreifen. Die Zugriffsebene hängt vom erteilten Berechtigungstyp ab - Manager, Developer oder Viewer. Weitere Informationen zur Zusammenarbeit zwischen Benutzern finden Sie unter So arbeiten Sie in Oracle Machine Learning Notebooks zusammen

10.1 Persönliche Vorlagen verwenden

In Persönliche Vorlagen werden die von Ihnen erstellten Notizbuchvorlagen aufgeführt.

Sie können folgende Aufgaben durchführen:
  • Ausgewählte Vorlagen im schreibgeschützten Modus anzeigen.

  • Erstellen Sie neue Notizbücher aus ausgewählten Vorlagen.

  • Ausgewählte Vorlagen bearbeiten.

  • Ausgewählte Notizbuchvorlagen in Gemeinsam verwendete Vorlagen freigeben.

  • Löschen Sie ausgewählte Notizbuchvorlagen.

10.1.1 Notizbücher aus Vorlagen erstellen

Sie können neue Notizbücher aus einer vorhandenen Vorlage erstellen und sie zur späteren Verwendung in Persönliche Vorlagen speichern.

Sie müssen eine Notizbuchvorlage auswählen.
So erstellen Sie ein neues Notizbuch aus einer Vorlage:
  1. Wählen Sie auf der Seite Persönliche Vorlagen die Vorlage aus, auf der Sie das Notizbuch erstellen möchten, und klicken Sie auf Neues Notizbuch.
    Das Dialogfeld Notizbuch erstellen wird angezeigt.
  2. Geben Sie im Feld Name einen Namen für das Notizbuch an.
  3. Geben Sie im Feld Bemerkungen ggf. Kommentare ein.
  4. Wählen Sie im Feld Projekt das Projekt aus, in dem Sie das Notizbuch speichern möchten.
  5. Im Feld Verbindung ist die Standardverbindung ausgewählt.
  6. Klicken Sie auf OK.
Das Notizbuch wird erstellt und ist auf der Seite Notizbücher verfügbar.

10.1.2 Notizbuchvorlagen teilen

Sie können Vorlagen aus Persönliche Vorlagen freigeben.Sie können außerdem Vorlagen zum Bearbeiten freigeben.

So geben Sie eine Vorlage frei:
  1. Wählen Sie die Notizbuchvorlage unter Persönliche Vorlagen aus, und klicken Sie auf Freigeben.
    Das Dialogfeld In freigegebenen Vorlagen speichern wird geöffnet.
  2. Geben Sie im Feld Name einen neuen Namen für die Vorlage ein.
  3. Geben Sie im Feld Kommentare gegebenenfalls Kommentare an.
  4. Geben Sie im Feld Tags durch Komma getrennte Tags ein. Verwenden Sie beschreibende Tags, um die einfache Suche zu ermöglichen.
  5. Klicken Sie auf OK.
Nachdem die Vorlage erfolgreich erstellt und freigegeben wurde, wird eine Meldung angezeigt, dass die Vorlage unter Freigegeben erstellt wurde.

10.1.3 Einstellungen für Notizbuchvorlagen bearbeiten

Sie können die Einstellungen einer vorhandenen Notizbuchvorlage unter Persönliche Vorlagen ändern.

So bearbeiten Sie Notizbuchvorlageneinstellungen:
  1. Wählen Sie die Notizbuchvorlage in "Persönliche Vorlagen" aus, und klicken Sie auf Einstellungen bearbeiten.
    Das Dialogfeld Vorlage bearbeiten wird geöffnet.
  2. Bearbeiten Sie den Namen gegebenenfalls im Feld Name.
  3. Bearbeiten Sie im Feld Kommentare gegebenenfalls die Kommentare.
  4. Bearbeiten Sie die Tags gegebenenfalls im Feld Tags.
  5. Klicken Sie auf OK.

10.2 Gemeinsame Vorlagen verwenden

In Gemeinsam verwendete Vorlagen können Sie Notizbuchvorlagen für alle authentifizierten Benutzer freigeben, die Notizbuchvorlagen, die Sie aus vorhandenen Notizbüchern erstellen, die in Vorlagen verfügbar sind.

Auf der Seite Gemeinsam verwendete Vorlagen werden Notizbuchvorlagen verfolgt, wenn Sie Folgendes ausführen:
  • Vorlage

  • Notizbücher aus Vorlagen erstellen

  • Templates anzeigen

Auf der Seite Gemeinsam verwendete Vorlagen werden die folgenden Informationen zu den Vorlagen angezeigt:
  • Vorlagenname

  • Beschreibung

  • Anzahl Likes

  • Anzahl Kreationen

  • Anzahl statische Ansichten

Sie können folgende Aufgaben durchführen:
  • Erstellen Sie Vorlagen, indem Sie auf Neues Notizbuch klicken

  • Vorlageneinstellungen bearbeiten, indem Sie auf Einstellungen bearbeiten klicken.

  • Löschen Sie alle ausgewählten Vorlagen, indem Sie auf Löschen klicken

  • Vorlagen nach Name, Tag, Autor suchen

  • Vorlagen nach Name, Datum, Autor, Gefallen, Anzeigen, Verwendet sortieren

  • Sie können Vorlagen anzeigen, indem Sie auf Nur gewünschte Elemente anzeigen oder Nur eigene Elemente anzeigen klicken.

10.2.1 Notizbücher aus Vorlagen erstellen

Sie können neue Notizbücher aus einer vorhandenen Vorlage erstellen und sie zur späteren Verwendung in Persönliche Vorlagen speichern.

Sie müssen eine Notizbuchvorlage auswählen.
So erstellen Sie ein neues Notizbuch aus einer Vorlage:
  1. Wählen Sie auf der Seite Persönliche Vorlagen die Vorlage aus, auf der Sie das Notizbuch erstellen möchten, und klicken Sie auf Neues Notizbuch.
    Das Dialogfeld Notizbuch erstellen wird angezeigt.
  2. Geben Sie im Feld Name einen Namen für das Notizbuch an.
  3. Geben Sie im Feld Bemerkungen ggf. Kommentare ein.
  4. Wählen Sie im Feld Projekt das Projekt aus, in dem Sie das Notizbuch speichern möchten.
  5. Im Feld Verbindung ist die Standardverbindung ausgewählt.
  6. Klicken Sie auf OK.
Das Notizbuch wird erstellt und ist auf der Seite Notizbücher verfügbar.

10.2.2 Einstellungen für Notizbuchvorlagen bearbeiten

Sie können die Einstellungen einer vorhandenen Notizbuchvorlage unter Persönliche Vorlagen ändern.

So bearbeiten Sie Notizbuchvorlageneinstellungen:
  1. Wählen Sie die Notizbuchvorlage in "Persönliche Vorlagen" aus, und klicken Sie auf Einstellungen bearbeiten.
    Das Dialogfeld Vorlage bearbeiten wird geöffnet.
  2. Bearbeiten Sie den Namen gegebenenfalls im Feld Name.
  3. Bearbeiten Sie im Feld Kommentare gegebenenfalls die Kommentare.
  4. Bearbeiten Sie die Tags gegebenenfalls im Feld Tags.
  5. Klicken Sie auf OK.

10.3 Beispielvorlagen verwenden

Auf der Seite Beispielvorlagen werden die vorab ausgefüllten Oracle Machine Learning-Notizbuchvorlagen aufgeführt. Sie können diese Vorlagen anzeigen und verwenden, um Ihre Notizbücher zu erstellen.

Auf der Seite Beispielvorlagen werden die folgenden Informationen zu den Vorlagen angezeigt:
  • Vorlagenname

  • Beschreibung

  • Anzahl Likes. Klicken Sie auf Gefällt mir, um es als "Gefällt mir" zu markieren.

  • Anzahl statische Ansichten

  • Anzahl Verwendungen

Sie können keine Vorlagen auf der Seite Beispielvorlagen ändern. Es gibt folgende Suchoptionen:
  • Vorlagen nach Name, Tag, Autor suchen

  • Vorlagen nach Name, Datum, Autor, Gefallen, Anzeigen, Verwendet sortieren

  • Zeigen Sie Vorlagen an, die Ihnen gefallen, indem Sie auf Nur Likes anzeigen klicken.

10.3.1 Notizbuch aus den Beispielvorlagen erstellen

Mit den Oracle Machine Learning-Beispielvorlagen können Sie ein Notizbuch aus den verfügbaren Vorlagen erstellen.

To create a notebook:
  1. Wählen Sie auf der Seite Beispielvorlagen die Vorlage aus, auf der Sie ein Notizbuch erstellen möchten.
  2. Klicken Sie auf Neues Notizbuch.
    Das Dialogfeld Notizbuch erstellen wird angezeigt.
  3. Im Dialogfeld Notizbuch erstellen wird der Name der ausgewählten Vorlage angezeigt. Sie können den Notizbuchnamen im Feld Name ändern.
    Dialogfeld "Notizbuch erstellen"
  4. Wenn ein Kommentar für die Vorlage verfügbar ist, wird er im Feld Kommentar angezeigt. Sie können den Kommentar bearbeiten.
  5. Klicken Sie im Feld Projekt auf das Bearbeitungssymbol Bearbeiten.
  6. Wählen Sie das Projekt aus, in dem Sie das Notizbuch speichern möchten.
  7. Im Feld Verbindung ist die Standardverbindung ausgewählt.
  8. Klicken Sie auf OK.
Das Notizbuch wird erstellt und ist auf der Seite Notizbücher verfügbar.

10.3.2 Beispielvorlagen

Oracle Machine Learning Notebooks bieten Notizbuchbeispielvorlagen, die auf verschiedenen Algorithmen und Sprachen für maschinelles Lernen basieren, wie Python, R und SQL. Die Beispielvorlagen werden in Oracle Autonomous Database verarbeitet.

Sie können eigene bearbeitbare und ausführbare Oracle Machine Learning-Notizbücher erstellen, die auf einem der folgenden Oracle Machine Learning for R-Beispielvorlagennotizbücher basieren:
  • OML - Serialisierte Modelle exportieren und importieren: Verwenden Sie dieses Notizbuch, um native serialisierte Modelle mit den Prozeduren DBMS_DATA_MINING.EXPORT_SERMODEL und DBMS_DATA_MINING.IMPORT_SERMODEL zu exportieren und zu importieren. Oracle Machine Learning bietet APIs zur Optimierung des Migrationsprozesses von Modellen über Datenbanken und Plattformen hinweg.
  • OML Wiki ESA-Modell: Verwenden Sie dieses Notizbuch für die Kategorisierung von Textdokumenten, indem Sie die semantische Beziehung (wie ähnlich die Bedeutung von zwei Wörtern oder Textteilen zueinander ist) zwischen den Dokumenten und einer Gruppe von Themen berechnen, die explizit von Menschen definiert und beschrieben werden. Die Oracle Machine Learning for SQL-Funktion ESA, die Oracle Machine Learning for Python-Funktion oml.esa und die Oracle Machine Learning for R-Funktion ore.odmESA extrahieren textbasierte Features aus einem Korpus von Dokumenten und führen Dokumentähnlichkeitsvergleiche aus. In diesem Notizbuch wird das Wiki-ESA-Modell zur Verwendung mit den folgenden OML-Vorlagennotizbuchbeispielen in Autonomous Database importiert:
    • OML4SQL Feature Extraktion ESA Wiki Modell
    • OML4Py Feature Extraktion ESA Wiki Modell
    • OML4R Feature Extraktion ESA Wiki Modell
  • OML Services-Batchscoring: Verwenden Sie dieses Notizbuch, um Batchscoringjobs über eine REST-Schnittstelle über OML Services auszuführen. OML Services unterstützt Batch-Scoring für Regression, Klassifizierung, Clustering und Featureextraktion.
    • Datenbankbenutzer authentifizieren und Token abrufen
    • Batchbewertungsjob erstellen
    • Details und Ausgabe des Batchbewertungsjobs anzeigen
    • Batchbewertungsjob aktualisieren, deaktivieren und löschen
  • OML Services-Datenüberwachung: Verwenden Sie dieses Notizbuch, um Datenüberwachung auszuführen. In dieser Notizbuchausführung werden die Schritte des Datenüberwachungsworkflows über die REST-Schnittstelle bereitgestellt, die Folgendes umfasst:
    • Datenbankbenutzer authentifizieren und Token abrufen
    • Datenüberwachungsjob erstellen
    • Details und Ausgabe des Datenüberwachungsjobs anzeigen
    • Datenüberwachungsjobs aktualisieren, deaktivieren und löschen
  • OML Services-Modellüberwachung: Mit diesem Notizbuch können Sie Modellüberwachung verstehen und ausführen. In dieser Notizbuchausführung werden die Workflowschritte für die Modellüberwachung über die REST-Schnittstelle bereitgestellt, die Folgendes umfasst:
    • Datenbankbenutzer authentifizieren und Token abrufen
    • Modellüberwachungsjob erstellen
    • Details und Ausgabe des Modellüberwachungsjobs anzeigen
    • Modellüberwachungsjobs aktualisieren, deaktivieren und löschen
  • OML-Pakete von Drittanbietern - Umgebung erstellen: Verwenden Sie dieses Notizbuch, um die Conda-Umgebung herunterzuladen und zu aktivieren und die Librarys in Ihren Notizbuchsessions zu verwenden. Oracle Machine Learning Notebooks stellen einen Conda-Interpreter bereit, um Python- und R-Librarys von Drittanbietern in einer Conda-Umgebung zur Verwendung in Oracle Machine Learning Notebooks-Sessions sowie in eingebetteten Ausführungsaufrufen in Oracle Machine Learning for Python und Oracle Machine Learning for R zu installieren.

    Die in Oracle Machine Learning Notebooks installierten Drittanbieterbibliotheken können verwendet werden in:

    • Standard-Python
    • Standard VK
    • In Oracle Machine Learning for Python eingebettete Python-Ausführung über die Python-, SQL- und REST-APIs
    • Oracle Machine Learning for R eingebettete R-Ausführung aus den R-, SQL- und REST-APIs

    Hinweis:

    Die Conda-Umgebung wird vom ADMIN-Benutzer mit der Rolle OML_SYS_ADMIN installiert und verwaltet. Der Administrator kann eine gemeinsam genutzte Umgebung erstellen und Packages hinzufügen oder daraus löschen. Die Conda-Umgebungen werden im Object Storage-Bucket gespeichert, der mit Autonomous Database verknüpft ist.

    Conda ist ein Open-Source-Package- und Umgebungsverwaltungssystem, das die Verwendung virtueller Umgebungen ermöglicht, die R- und Python-Packages von Drittanbietern enthalten. Mit Conda-Umgebungen können Sie Packages und deren Abhängigkeiten installieren und aktualisieren und zwischen Umgebungen wechseln, um projektspezifische Packages zu verwenden.

    Dieses Vorlagennotizbuch OML-Pakete von Drittanbietern - Umgebungserstellung enthält einen typischen Workflow für die Erstellung und Packageinstallation von Umgebungen von Drittanbietern in Oracle Machine Learning Notebooks.

    • Abschnitt 1 enthält Befehle zum Erstellen und Testen von Conda-Umgebungen.
    • Abschnitt 2 enthält Befehle zum Erstellen einer Conda-Umgebung, zum Installieren von Packages und Befehlen zum Hochladen der Conda-Umgebung in einen Objektspeicher-Bucket, der mit Oracle Autonomous Database verknüpft ist.

    Abbildung 10-1: Beispielvorlagen für Conda

    Conda-Beispielvorlagen
  • OML-Pakete von Drittanbietern - Verwendung der Python-Umgebung: Mit diesem Vorlagennotizbuch können Sie den typischen Workflow für die Verwendung von Drittanbieterumgebungen in Oracle Machine Learning Notebooks mit Python und Oracle Machine Learning for Python verstehen. Sie können die Librarys in Conda-Umgebungen herunterladen und verwenden, die zuvor erstellt und in einem Object Storage-Bucket-Ordner gespeichert wurden, der mit Autonomous Database verknüpft ist.
    Dieses Notizbuch enthält Befehle für:
    • Alle in Object Storage gespeicherten Umgebungen auflisten
    • Benannte Umgebung auflisten, die in Object Storage gespeichert ist
    • Laden Sie die mypyenv-Umgebung herunter, und aktivieren Sie sie
    • In der Conda-Umgebung verfügbare Packages auflisten
    • Python-Librarys importieren
    • Datasets laden
    • Modelle erstellen
    • Score-Modelle
    • Benutzerdefinierte Python-Funktionen (UDFs) erstellen
    • Benutzerdefinierte Funktionen (UDFs) in Python ausführen
    • Benutzerdefinierte Funktionen in den SQL- und REST-APIs für eingebettete Python-Ausführung erstellen und ausführen
    • Benutzerdefinierte Python-Funktionen mit der SQL-API für eingebettete Python-Ausführung erstellen und ausführen - asynchroner Modus
  • OML-Pakete von Drittanbietern - Verwendung der R-Umgebung: Mit diesem Vorlagennotizbuch können Sie den typischen Workflow für die Verwendung von Fremdanwendungen in Oracle Machine Learning for R verstehen.
    Dieses Notizbuch enthält Befehle für:
    • Alle in Object Storage gespeicherten Umgebungen auflisten
    • Benannte Umgebung auflisten, die in Object Storage gespeichert ist
    • Laden Sie die myrenv-Umgebung herunter, und aktivieren Sie sie
    • Liste der verfügbaren OML4R-Conda-Umgebungen anzeigen
    • R-Bibliotheken importieren
    • Daten laden und vorbereiten
    • Modelle erstellen
    • Score-Modelle
    • Benutzerdefinierte R-Funktionen (UDFs) erstellen
    • Benutzerdefinierte Funktionen (UDFs) in R ausführen
    • Benutzerdefinierte Funktionen (UDFs) im Skript-Repository speichern
    • Benutzerdefinierte R-Funktion in SQL- und REST-APIs für eingebettete R-Ausführung ausführen
    • OML-Benutzer zur Access Control-Liste hinzufügen
    • Benutzerdefinierte R-Funktionen mit der REST-API für eingebettete R-Ausführung im synchronen Modus ausführen
  • OML4R-1: Einführung: In diesem Notizbuch werden folgende Themen behandelt:
    • ORE-Bibliothek laden
    • Datenbanktabellen erstellen
    • Transparenzebene verwenden
    • Attribute für Vorhersagewerte mit dem datenbankinternen Attributbedeutungsalgorithmus einstufen
    • Erstellen von Vorhersagemodellen und
    • Daten anhand dieser Modelle bewerten

    Abbildung 10-2 Oracle Machine Learning for R - Beispielvorlagen

    OML4R Beispielvorlagen
  • OML4R-2: Datenauswahl und -bearbeitung: Verwenden Sie dieses Notizbuch, um die Features der Transparenzschicht zu verstehen, die Datenauswahl und -manipulation umfasst.
  • OML4R-3: Datenspeicher und Skript-Repository: Verwenden Sie dieses Notizbuch, um die Datenspeicher- und Skript-Repository-Features von OML4R zu verstehen.
  • OML4R-4: Eingebettete R-Ausführung: In diesem Notizbuch wird die eingebettete R-Ausführung von OML4R beschrieben. Zuerst wird ein lineares Modell direkt in R erstellt, dann wird eine benutzerdefinierte R-Funktion erstellt, um das lineare Modell zu erstellen, die Funktion wird dann im Skript-Repository gespeichert und die Daten werden parallel mit R-Engines bewertet, die von der Oracle Autonomous Database-Umgebung gestartet werden. Das Notizbuch zeigt auch, wie diese Skripte mit der SQL-Schnittstelle und der REST-API für R mit eingebetteter R-Ausführung aufgerufen werden.

    Hinweis:

    Um die SQL-API für die eingebettete R-Ausführung verwenden zu können, muss sich eine benutzerdefinierte R-Funktion im Skript-Repository OML4R befinden. Um ein Authentifizierungstoken abzurufen, müssen ein Oracle Machine Learning-(OML-)Cloud-Account USERNAME, PASSWORD und eine URL angegeben werden.
  • OML4R Support Vector Machine (SVM) zur Anomalieerkennung: Mit diesem Notizbuch können Sie ein Ein-Klasse-SVM-Modell erstellen und dann ungewöhnliche oder verdächtige Datensätze kennzeichnen.
  • OML4R Verknüpfungsregeln Apriori: Verwenden Sie dieses Notizbuch, um Verknüpfungsregelmodelle mit dem Algorithmus "A Priori" mit Daten aus dem SH-Schema (SH.SALES) zu erstellen. Die gesamte Berechnung erfolgt in Oracle Autonomous Database.
  • OML4R Attributbedeutung - Mindestbeschreibungslänge (MDL): Verwenden Sie dieses Notizbuch, um die Attributbedeutung, die den Algorithmus "Mindestbeschreibungslänge" verwendet, für die SH-Schemadaten zu berechnen. Alle Funktionen werden in Oracle Autonomous Database ausgeführt. Oracle Machine Learning unterstützt die Attributbedeutung, um Schlüsselfaktoren wie Attribute, Prädiktoren und Variablen zu identifizieren, die den größten Einfluss auf ein Zielattribut haben.
  • OML4R Classification Generalized Linear Model (GLM): Verwenden Sie dieses Notizbuch, um Kunden vorherzusagen, die am ehesten positiv auf ein Affinity Card-Treueprogramm reagieren. Dieses Notizbuch erstellt und wendet ein generalisiertes lineares Klassifizierungsmodell mit den Vertriebshistoriendaten (SH) an. Die gesamte Verarbeitung erfolgt in Oracle Autonomous Database.
  • OML4R Klassifizierung Naive Bayes (NB): Verwenden Sie dieses Notizbuch, um Kunden vorherzusagen, die am ehesten positiv auf ein Affinity Card-Treueprogramm reagieren. Dieses Notizbuch erstellt und wendet ein Klassifizierungsentscheidungsbaummodell mit den Vertriebshistoriendaten (SH) an. Die gesamte Verarbeitung erfolgt in Oracle Autonomous Database.
  • OML4R Classification Random Forest (RF): Verwenden Sie dieses Notizbuch, um den Random Forest-Algorithmus zur Klassifizierung in OML4R zu verwenden und Kunden vorherzusagen, die am ehesten positiv auf ein Affinity Card-Treueprogramm reagieren.
  • OML4R Klassifizierungsmodellierung zur Vorhersage von Zielkunden mit Support Vector Machine (SVM): Verwenden Sie dieses Notizbuch, um mit der Klassifizierungsmodellierung Zielkunden mit dem Support Vector Machine-Modell vorherzusagen.
  • OML4R Clustering - Kundensegmente mit Expectation Maximization Clustering identifizieren: In diesem Notizbuch erfahren Sie, wie Sie natürliche Cluster von Kunden mit dem CUSTOMERS-Dataset aus dem SH-Schema mit dem EM-Algorithmus (Unupervised Learning Expectation Maximization) identifizieren. Die Datenexploration, -vorbereitung und das maschinelle Lernen werden in Oracle Autonomous Database ausgeführt.
  • OML4R Clustering - Kundensegmente mit K-Means-Clustering identifizieren: In diesem Notizbuch erfahren Sie, wie Sie natürliche Cluster von Kunden mit dem CUSTOMERS -Dataset aus dem SH-Schema mit dem K-Means-(KM-)Algorithmus für nicht überwachtes Lernen identifizieren. Die Datenexploration, -vorbereitung und das maschinelle Lernen werden in Oracle Autonomous Database ausgeführt.
  • OML4R Clustering - Orthogonal Partitioning Clustering (OC): In diesem Notizbuch erfahren Sie, wie Sie natürliche Cluster von Kunden anhand des CUSTOMERS-Datasets aus dem SH-Schema mit dem k-Means-Algorithmus für nicht überwachtes Lernen identifizieren. Die Datenexploration, -vorbereitung und das maschinelle Lernen werden in Oracle Autonomous Database ausgeführt.
  • OML4R Datenbereinigungsausreißer: Mit diesem Notizbuch können Sie Datensätze mit Ausreißern mit OML4R verstehen und ausschließen.
  • OML4R Datenreinigung - Synonyme Werte umcodieren: Verwenden Sie dieses Notizbuch, um einen synonymen Wert mit OML4R neu zu codieren.
  • OML4R Dataset erstellen: Mit diesem Notizbuch können Sie die Beispiel-Datasets MTCARS und IRIS laden und mit der Funktion ore.create() in die Oracle Autonomous Database-Instanz importieren.

Hinweis:

In den folgenden Beispielvorlagennotizbüchern mit einem Sternchen (*) wird das Dataset CUSTOMER_INSURANCE_LTV verwendet. Dieses Dataset wird vom Notizbuch OML Run-me-first generiert. Daher müssen Sie das Notizbuch OML Run-me-first ausführen, das unter den Beispielvorlagen verfügbar ist.
  • * OML4R Datenreinigung - Fehlende Daten: Verwenden Sie dieses Notizbuch, um einen Ersatz für fehlende Werte mit OML4R auszuführen.
  • * OML4R Entfernen doppelter Datenlöschungen: Verwenden Sie dieses Notizbuch, um doppelte Datensätze mit OML4R zu entfernen.
  • * OML4R Datentransformations-Binning: Mit diesem Notizbuch können Sie numerische Spalten mit OML4R abbinden.
  • * OML4R Kategorischer Datensatz für Datentransformation: Verwenden Sie dieses Notizbuch, um eine kategorische Zeichenfolgenvariable mit OML4R in eine numerische Variable und eine Zeichenfolge-zu-Zeichenfolge-Recodierung umzucodieren.
  • * OML4R Datentransformation: Normalisierung und Skalierung: Verwenden Sie dieses Notizbuch, um Daten mit OML4R zu normalisieren und zu skalieren.
  • * OML4R Datentransformation: One-Hot-Codierung: Verwenden Sie dieses Notizbuch, um eine One-Hot-Codierung mit OML4R auszuführen.
  • * OML4R Featureauswahl - Überwachter Algorithmus: Verwenden Sie dieses Notizbuch, um die Funktionsauswahl mit datenbankinternen überwachten Algorithmen mit OML4R auszuführen. Dieses Notizbuch zeigt, wie Sie ein Random Forest-Modell erstellen, um vorherzusagen, ob der Kunde eine Versicherung kauft oder nicht, und dann die Featurewichtigkeit zur Funktionsauswahl verwenden.
  • * OML4R Featureauswahl mit Übersichtsstatistiken: Verwenden Sie dieses Notizbuch, um die Featureauswahl mithilfe von Übersichtsstatistiken mit OML4R auszuführen. Dieses Notizbuch zeigt, wie Sie mit OML4R Features basierend auf der Anzahl eindeutiger Werte, Nullwerten und dem Anteil konstanter Werte auswählen.
  • OML4R Aggregation für Feature Engineering: Verwenden Sie dieses Notizbuch, um die Aggregation für Min., Max., Mittelwert und Anzahl mit OML4R auszuführen. Diese Vorlage verwendet die Tabelle SALES im Schema SH und zeigt, wie Sie Features erstellen, indem Sie den verkauften Betrag für jedes Kunden- und Produktpaar aggregieren.
  • OML4R Featureextraktion Explizite semantische Analyse (ESA) Wiki-Modell: Dieses Notizbuch verwendet das Wikipedia-Modell als Beispiel. Verwenden Sie dieses Notizbuch, um die Oracle Machine Learning for R-Funktion ore.odmESA zu verwenden, um textbasierte Features aus einem Korpus von Dokumenten zu extrahieren und Dokumentähnlichkeitsvergleiche durchzuführen. Die gesamte Verarbeitung erfolgt in Oracle Autonomous Database.

    Hinweis:

    Das vordefinierte Wikipedia-Modell muss in Ihrer Autonomous Database-Instanz installiert sein, um dieses Notizbuch ausführen zu können.
  • OML4R Datentypen für Datentransformationsdatum: Mit diesem Notizbuch können Sie verschiedene Vorgänge mit Datums- und Uhrzeitdaten mit Proxyobjekten der Datenbanktabelle mit Oracle Machine Learning for R ausführen.
  • OML4R Featureextraktion - Singuläre Wertzersetzung (SVD): Verwenden Sie dieses Notizbuch, um die datenbankinterne SVD für die Featureextraktion zu verwenden. Dieses Notizbuch verwendet die Oracle Machine Learning for R-Funktion ore.odmSVD, um ein Modell zu erstellen, das den Singular Value Decomposition-(SVD-)Algorithmus für die Featureextraktion verwendet.
  • OML4R Partitionierte Modell-Support Vector Machine (SVM): Verwenden Sie dieses Notizbuch, um ein SVM-Modell zu erstellen, um die Anzahl der Jahre vorherzusagen, in denen ein Kunde seinen Wohnsitz hat, jedoch nach Kundengeschlecht partitioniert ist. Das Modell wird dann verwendet, um das Ziel vorherzusagen und dann das Ziel mit Vorhersagedetails vorherzusagen.
  • OML4R Generalisiertes lineares Regressionsmodell (GLM): Verwenden Sie dieses Notizbuch, um zu verstehen, wie numerische Werte mithilfe mehrerer Regressionen vorhergesagt werden. Dieses Notizbuch verwendet den Algorithmus "Allgemeines lineares Modell".
  • OML4R Regression Neural Network (NN): Verwenden Sie dieses Notizbuch, um zu verstehen, wie numerische Werte mit mehreren Regressionen vorhergesagt werden. Dieses Notebook verwendet den Neural Network-Algorithmus.
  • OML4R Regression Support Vector Machine (SVM): Verwenden Sie dieses Notizbuch, um zu verstehen, wie numerische Werte mit mehreren Regressionen vorhergesagt werden. Dieses Notizbuch verwendet den Support Vector Machine-Algorithmus.
  • REST-API OML4R: In diesem Notizbuch wird erläutert, wie Sie mit der REST-API OML4R benutzerdefinierte R-Funktionen aufrufen und die im R-Skript-Repository verfügbaren Funktionen auflisten.

    Hinweis:

    Um ein Skript auszuführen, muss es im R-Skript-Repository gespeichert sein. Ein Benutzername und ein Kennwort für den Cloud-Serviceaccount von Oracle Machine Learning müssen zur Authentifizierung angegeben werden.
  • Statistische Funktion OML4R: Verwenden Sie dieses Notizbuch, um verschiedene statistische Funktionen zu verstehen und zu verwenden. Das Notizbuch verwendet Daten aus dem SH-Schema über den Transparenzlayer OML4R.
  • OML4R Text Mining Support Vector Machine (SVM): In diesem Notizbuch erfahren Sie, wie Sie mit unstrukturierten Textdaten Modelle für maschinelles Lernen erstellen, Oracle Text nutzen, die datenbankinternen Algorithmen von Oracle Machine Learning verwenden und Funktionen aus Textspalten extrahieren.

    Dieses Notizbuch erstellt ein Support Vector Machine-(SVM-)Modell, um Kunden vorherzusagen, die am ehesten positiv auf ein Affinity Card-Treueprogramm reagieren. Die Daten stammen aus einer Textspalte, die benutzergenerierte Kommentare enthält.

Oracle Machine Learning for Python - Beispielvorlagen

Sie können Ihre Oracle Machine Learning-Notizbücher basierend auf einer der folgenden Oracle Machine Learning for Python-Beispielvorlagen erstellen:

Abbildung 10-3: Beispielvorlagen für Oracle Machine Learning for Python

OML4Py Beispielvorlagen
  • Mein erstes Notizbuch: Verwenden Sie das Notizbuch "Mein erstes Notizbuch" für grundlegende Funktionen für maschinelles Lernen, Datenauswahl und Datenanzeige. Diese Vorlage verwendet die Schemadaten SH.
  • OML4Py -0- Tour: Dieses Notizbuch ist das erste einer Serie 0 bis 5, mit der Sie in kurzen Beispielen den Bereich der OML4Py-Funktionalität kennenlernen können.
  • OML4Py -1- Einführung: Dieses Notizbuch bietet einen Überblick darüber, wie Sie die OML-Bibliothek laden, Datenbanktabellen erstellen, den Transparenzlayer verwenden, Attribute für Vorhersagewerte mit dem datenbankinternen Attributbedeutungsalgorithmus einstufen, Vorhersagemodelle erstellen und Daten mit diesen Modellen bewerten.
  • OML4Py -2- Datenauswahl und -bearbeitung: In diesem Notizbuch erfahren Sie, wie Sie mit der Transparenzschicht arbeiten, die Datenauswahl und -manipulation umfasst.
  • OML4Py -3- Datenspeicher: In diesem Notizbuch erfahren Sie, wie Sie mit Datenspeichern arbeiten, Objekte zwischen Datenspeicher und Python-Sessions verschieben, Datenspeicherberechtigungen verwalten, Modellobjekte und Python-Objekte in einem Datenspeicher speichern, Datenspeicher löschen usw.
  • OML4Py -4- Eingebettete Python-Ausführung: Verwenden Sie dieses Notizbuch, um die eingebettete Python-Ausführung zu verstehen. In diesem Notizbuch wird ein lineares Modell direkt in Python erstellt. Anschließend wird eine Funktion erstellt, die Python-Engines verwendet, die von der Autonomous Database-Umgebung gestartet werden.
  • OML4Py -5- AutoML: Verwenden Sie dieses Notizbuch, um den Workflow AutoML in OML4Py zu verstehen. In diesem Notizbuch wird der WINE-Datensatz von scikit-learn verwendet. Hier wird AutoML zur Klassifizierung in der Spalte target und zur Regression in der Spalte alcohol verwendet.

Hinweis:

In den folgenden Beispielvorlagennotizbüchern mit einem Sternchen (*) wird das Dataset CUSTOMER_INSURANCE_LTV_PY verwendet. Dieses Dataset enthält doppelte Werte, die vom Notizbuch OML4SQL Noise künstlich generiert wurden. Daher müssen Sie zuerst OML4SQL Noise ausführen, bevor Sie das Notizbuch ausführen.
  • * OML4Py Entfernen von Datenbereinigungsduplikaten: In diesem Notizbuch erfahren Sie, wie Sie doppelte Datensätze mit OML4Py entfernen. Dieses Notizbuch verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat.
  • * OML4Py Datenreinigung - Fehlende Daten: In diesem Notizbuch erfahren Sie, wie Sie fehlende Werte mit OML4Py ausfüllen. Dieses Notizbuch verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat.
  • * OML4Py Synonyme Werte für Datenreinigungsrecode: In diesem Notizbuch erfahren Sie, wie Sie synonymen Wert mit OML4Py neu codieren. Dieses Notizbuch verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat.
  • OML4Py Entfernen von Datenreinigungsausreißern: In diesem Notizbuch erfahren Sie, wie Sie Daten bereinigen, um Ausreißer zu entfernen. Dieses Notizbuch verwendet das Dataset CUSTOMER_INSURANCE_LTV, das Kundenfinanzinformationen, den Lebenszeitwert und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat oder nicht. Im Dataset CUSTOMER_INSURANCE_LTV liegt der Fokus auf numerischen Werten und dem Entfernen von Datensätzen mit Werten in den oberen und unteren 5%.
  • OML4Py Datentransformations-Binning: Verwenden Sie dieses Notizbuch, um zu verstehen, wie eine numerische Spalte gebinst und die Verteilung visualisiert wird.
  • OML4Py Datentransformationskategorisch - Kategorische Variablen in numerische Variablen konvertieren: In diesem Notizbuch erfahren Sie, wie Sie kategorische Variablen mit OML4Py in numerische Variablen konvertieren. Die Notizbücher zeigen, wie Sie eine kategorische Variable mit jeder eindeutigen Ebene/jedem eindeutigen Wert in einen Ganzzahldatentyp konvertieren.
  • OML4Py Normalisierung und Skalierung der Datentransformation: In diesem Notizbuch erfahren Sie, wie Sie Daten mit z-Score (Mittelwert und Standardabweichung), MinMax-Skalierung und Logskalierung normalisieren und skalieren.

    Hinweis:

    Wenn Sie ein Modell mit datenbankinternen Oracle Machine Learning-Algorithmen erstellen oder anwenden, normalisiert die automatische Datenvorbereitung Daten nach Bedarf automatisch durch bestimmte Algorithmen.
  • OML4Py Datentransformation Eine Hot-Codierung: In diesem Notizbuch erfahren Sie, wie Sie eine Hot-Codierung mit OML4Py ausführen. Algorithmen für maschinelles Lernen können nicht direkt mit kategorischen Daten arbeiten. Kategorische Daten müssen in Zahlen konvertiert werden. Dieses Notizbuch verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat.

    Hinweis:

    Wenn Sie die datenbankinternen Algorithmen verwenden möchten, wird automatisch eine Hot-Codierung für die Algorithmen angewendet, die dies erfordern. Die in-databae-Algorithmen explodieren automatisch die kategorialen Spalten und passen das Modell intern an die vorbereiteten Daten an.
  • OML4Py Anomalieerkennung: Mit diesem Notizbuch können Sie anomale Datensätze, Kunden oder Transaktionen in Ihren Daten erkennen. Diese Vorlage verwendet den nicht überwachten Lernalgorithmus 1-Klasse Support Vector Machine. Die Notizbuchvorlage erstellt ein 1-Klasse Support Vector Machine-(SVM-)Modell.
  • OML4Py-Verknüpfungsregeln: Verwenden Sie dieses Notizbuch zur Marktkorbanalyse Ihrer Daten oder zur Erkennung von gemeinsam auftretenden Elementen, Fehlern oder Ereignissen in Ihren Daten. Diese Vorlage verwendet das apriori-Verknüpfungsregelmodell mit den Schemadaten SH (SH.SALES).
  • OML4Py Attributbedeutung: Mit diesem Notizbuch können Sie Schlüsselattribute identifizieren, die den maximalen Einfluss auf das Zielattribut haben. Das Zielattribut in den Build-Daten eines überwachten Modells ist das Attribut, das Sie vorhersagen möchten. Die Vorlage erstellt ein Attributwichtigkeitsmodell mit den Schemadaten SH.
  • OML4Py Klassifizierung: Verwenden Sie dieses Notizbuch, um das Kundenverhalten und ähnliche Vorhersagen vorherzusagen. Die Vorlage erstellt und wendet den Entscheidungsbaum des Klassifizierungsalgorithmus an, um ein Klassifizierungsmodell basierend auf den Beziehungen zwischen den Prädiktorwerten und den Zielwerten zu erstellen. Die Vorlage verwendet die Schemadaten SH.
  • OML4Py Clustering: Mit diesem Notizbuch können Sie natürliche Cluster in Ihren Daten identifizieren. Die Notizbuchvorlage verwendet den nicht überwachten k-Means-Algorithmus für Lernaktivitäten in den SH Schemadaten.
  • OML4Py Datentransformation: Verwenden Sie dieses Notizbuch, um kategorische Variablen mit OML4Py in numerische Variablen zu konvertieren. Diese Vorlage zeigt, wie Sie eine kategorische Variable mit jeder eindeutigen Ebene/jedem eindeutigen Wert in einen Ganzzahldatentyp konvertieren.
  • OML4Py Dataset erstellen: Verwenden Sie dieses Notizbuch, um ein Dataset mit OML4Py vom sklearn-Package zum OML-Datenframe zu erstellen.
  • OML4Py Aggregation für Feature Engineering: Mit dieser Notizbuchvorlage können Sie fehlende Werte mit OML4Py ausfüllen. Dieses Notizbuch verwendet die Tabelle SALES des Schemas SH, die Transaktionsdatensätze für jeden Kunden und die gekauften Produkte enthält. Features werden erstellt, indem der verkaufte Betrag für jedes Kunden- und Produktpaar aggregiert wird.
  • OML4Py Featureauswahl "Algorithmusbasiert überwachen": Verwenden Sie dieses Notizbuch, um die Featureauswahl mit datenbankinternen überwachten Algorithmen mit OML4Py auszuführen.
  • OML4Py Statistik der Featureauswahlübersicht: Verwenden Sie diese Notizbuchvorlage, um die Featureauswahl mithilfe von Übersichtsstatistiken mit OML4Py auszuführen. Das Notizbuch zeigt, wie Sie mit OML4Py Features basierend auf der Anzahl eindeutiger Werte, Nullwerten und dem Anteil konstanter Werte auswählen. Das hier verwendete Dataset CUSTOMER_INSURANCE_LTV_PY enthält Nullwerte, die vom OML4SQL Noise-Notizbuch künstlich generiert wurden. Sie müssen zuerst das Notizbuch "OML4SQL Noise" ausführen, bevor Sie das Notizbuch "OML4Py Feature Selection Summary Statistics" ausführen.
  • OML4Py Partitioniertes Modell: Verwenden Sie dieses Notizbuch, um partitionierte Modelle zu erstellen. Dieses Notizbuch erstellt ein SVM-Modell, um die Anzahl der Jahre vorherzusagen, in denen ein Kunde seinen Wohnsitz hat, aber auf das Geschlecht des Kunden aufgeteilt ist. Es verwendet das Modell, um das Ziel vorherzusagen und dann das Ziel mit Vorhersagedetails vorherzusagen.

    Oracle Machine Learning ermöglicht die automatische Erstellung eines Ensemblemodells, das aus mehreren Untermodellen besteht, eines für jede Datenpartition. Untermodelle existieren und werden als ein Modell verwendet, was zu einer vereinfachten Bewertung nur mit dem Modell der obersten Ebene führt. Das richtige Untermodell wird vom System basierend auf den Partitionswerten in der zu bewertenden Datenzeile gewählt. Partitionierte Modelle erzielen potenziell bessere Genauigkeit durch mehrere gezielte Modelle.

  • REST-API OMP4Py: Verwenden Sie dieses Notizbuch, um die eingebettete Python-Ausführung aufzurufen. OML4Py enthält eine REST-API zur Ausführung benutzerdefinierter Python-Funktionen, die im Skript-Repository gespeichert sind. Die REST-API wird verwendet, wenn die Trennung zwischen Client und Datenbankserver vorteilhaft ist. Verwenden Sie die REST-API OML4Py, um Skripte zu erstellen, zu trainieren, bereitzustellen und zu verwalten.

    Hinweis:

    Um ein Skript auszuführen, muss es im Skript-Repository OML4Py gespeichert sein. Ein Benutzername und ein Kennwort für den Cloud-Serviceaccount von Oracle Machine Learning müssen zur Authentifizierung angegeben werden.
  • OML4Py Regressionsmodellierung zur Vorhersage numerischer Werte: Verwenden Sie dieses Notizbuch, um numerische Werte mit mehreren Regressionen vorherzusagen.
  • OML4Py Statistische Funktionen: Verwenden Sie dieses Notizbuch, um verschiedene statistische Funktionen zu verwenden. Die statistischen Funktionen verwenden Daten aus dem Schema SH über den Transparenzlayer OML4Py.
  • OML4Py Text-Mining: Verwenden Sie dieses Notizbuch, um Modelle mit der Text-Mining-Funktion in Oracle Machine Learning zu erstellen.

    In diesem Notebook wird ein SVM-Modell entwickelt, um Kunden vorherzusagen, die am ehesten positiv auf ein Affinity Card-Treueprogramm reagieren. Die Daten werden mit einer Textspalte geliefert, die benutzergenerierte Kommentare enthält. Mit einigen zusätzlichen Spezifikationen verwendet der Algorithmus automatisch die Textspalte und erstellt das Modell sowohl auf strukturierten Daten als auch auf unstrukturiertem Text.

Beispielvorlagen für Oracle Machine Learning for SQL

Sie können Ihre Oracle Machine Learning-Notizbücher basierend auf einer der folgenden Oracle Machine Learning for SQL-Beispielvorlagen erstellen:

Abbildung 10-4: Beispielvorlagen für Oracle Machine Learning for SQL

OML4SQL Beispielvorlagen
  • OML4SQL Anomalieerkennung: Mit diesem Notizbuch können Sie ungewöhnliche oder seltene Vorkommen erkennen. Oracle Machine Learning unterstützt die Anomalieerkennung, um seltene oder ungewöhnliche Datensätze (Kunden, Transaktionen usw.) in den Daten mit dem semi-überwachten Lernalgorithmus One-Class Support Vector Machine zu identifizieren. Dieses Notebook erstellt ein 1Class-SVM-Modell und verwendet es dann, um ungewöhnliche oder verdächtige Datensätze zu kennzeichnen. Die gesamte Methodik für maschinelles Lernen wird in Oracle Autonomous Database ausgeführt.
  • OML4SQL-Verknüpfungsregeln: Verwenden Sie dieses Notizbuch, um die Machine Learning-Technik "Verknüpfungsregeln" (auch als "Marktkorbanalyse" bezeichnet) anzuwenden, um gemeinsam auftretende Artikel, Status, die zu Fehlern führen, oder nicht offensichtliche Ereignisse zu ermitteln. Dieses Notizbuch erstellt Verknüpfungsregelmodelle mit dem A Priori-Algorithmus mit den SH.SALES-Daten aus dem SH-Schema. Die gesamte Berechnung erfolgt in Oracle Autonomous Database.
  • OML4SQL Attributbedeutung - Wichtige Faktoren identifizieren: In diesem Notizbuch können Sie Schlüsselfaktoren identifizieren, die auch als Attribute, Prädiktoren und Variablen bezeichnet werden, die den größten Einfluss auf ein Zielattribut haben. Dieses Notizbuch erstellt ein Attributbedeutungsmodell, das den Algorithmus "Mindestbeschreibungslänge" mit den Schemadaten SH verwendet. Alle Funktionen werden in Oracle Autonomous Database ausgeführt.
  • OML4SQL Klassifizierung - Zielkunden vorhersagen: Verwenden Sie dieses Notizbuch, um Kunden vorherzusagen, die am ehesten positiv auf ein Affinity Card-Treueprogramm reagieren. Dieses Notizbuch erstellt und wendet Klassifizierungsentscheidungsbaummodelle mit den Schemadaten SH an. Die gesamte Verarbeitung erfolgt in Oracle Autonomous Database.
  • OML4SQL Clustering - Kundensegmente identifizieren: Mit diesem Notizbuch können Sie natürliche Cluster von Kunden identifizieren. Oracle Machine Learning unterstützt Clustering mit verschiedenen Algorithmen, einschließlich k-Means, O-Cluster und Erwartungsmaximierung. Dieses Notizbuch verwendet das Dataset CUSTOMERS aus dem Schema SH mit dem Algorithmus "k-Means" (nicht überwachtes Lernen). Die Datenexploration, -vorbereitung und das maschinelle Lernen werden in Oracle Autonomous Database ausgeführt.
  • OML4SQL Datenreinigung - Duplikate entfernen: Verwenden Sie dieses Notizbuch, um doppelte Datensätze mit Oracle SQL zu entfernen. Das Notizbuch verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat. Das Dataset CUSTOMER_INSURANCE_LTV_SQL enthält doppelte Werte, die vom Noise-Notizbuch OML4SQL generiert werden.

    Hinweis:

    Sie müssen zuerst das Noise-Notizbuch OML4SQL ausführen, bevor Sie das Data Cleaning-Notizbuch OML4SQL ausführen.
  • OML4SQL Datenreinigung - Fehlende Daten: Verwenden Sie diese Vorlage, um fehlende Werte mit Oracle SQL und dem Package DBMS_DATA_MINING_TRANSFORM zu ersetzen. Im Dataset CUSTOMER_INSURANCE_LTV_SQL fehlen Werte, die vom OML4SQL Noise-Notizbuch künstlich generiert wurden. Sie müssen zuerst das Noise-Notizbuch OML4SQL ausführen, bevor Sie das Data Cleaning-Notizbuch OML4SQL ausführen.

    Hinweis:

    Wenn Sie ein Modell mit datenbankinternen Oracle Machine Learning-Algorithmen erstellen oder anwenden, ist dieser Vorgang möglicherweise nicht separat erforderlich, wenn die automatische Datenvorbereitung aktiviert ist. Die automatische Datenaufbereitung ersetzt fehlende Werte von numerischen Attributen automatisch durch den Mittelwert und fehlende Werte von kategorialen Attributen durch den Modus.
  • OML4SQL Entfernen von Datenreinigungsausreißern: Verwenden Sie dieses Notizbuch, um Ausreißer mit Oracle SQL und dem Package DBMS_DATA_MINING_TRANSFORM zu entfernen. Das Notizbuch verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat. Im Dataset CUSTOMER_INSURANCE_LTV konzentriert er sich auf numerische Werte und entfernt Datensätze mit Werten im oberen und unteren Bereich von 5%.
  • OML4SQL Synonyme Werte für Datenreinigungsrecode: Verwenden Sie dieses Notizbuch, um den synonymen Wert einer Spalte mit Oracle SQL neu zu codieren. Das Notizbuch verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat. Das Dataset CUSTOMER_INSURANCE_LTV_SQL enthält vom Noise-Notizbuch OML4SQL generierte neu codierte Werte. Sie müssen zuerst das Notizbuch OML4SQL Noise ausführen, bevor Sie das Notizbuch OML4SQL Data Cleaning - Recode Synonymous Values ausführen.
  • OML4SQL Datentransformations-Binning: Mit diesem Notizbuch können Sie numerische Spalten mit Oracle SQL und dem Package DBMS_DATA_MINING_TRANSFORM ablagern. Dieses Notizbuch zeigt, wie Sie eine numerische Spalte ablegen und die Verteilung visualisieren.
  • OML4SQL Datentransformation kategorisch: Mit diesem Notizbuch können Sie eine kategorische Variable mit Oracle SQL in eine numerische Variable konvertieren. Das Notizbuch zeigt, wie Sie eine kategorische Variable mit jeder eindeutigen Ebene/jedem eindeutigen Wert in eine Ganzzahl konvertieren und wie Sie eine Indikatorvariable basierend auf einem einfachen Prädikat erstellen.
  • OML4SQL Normalisierung und Skalierung der Datentransformation: Verwenden Sie dieses Notizbuch, um Daten mit Oracle SQL und dem Package DBMS_DATA_MINING_TRANSFORM zu normalisieren und zu skalieren. Das Notizbuch zeigt, wie Daten mit z-Score (Mittelwert und Standardabweichung), MinMax-Skalierung und Log-Skalierung normalisiert werden. Beim Erstellen oder Anwenden eines Modells mit datenbankinternen Oracle Machine Learning-Algorithmen normalisiert die automatische Datenvorbereitung Daten nach Bedarf automatisch durch bestimmte Algorithmen.
  • OML4SQL Dimensionalitätsreduzierung - Nicht-negative Matrixfaktorisierung: Verwenden Sie dieses Notizbuch, um die Dimensionalitätsreduzierung mit dem datenbankinternen nicht-negativen Matrixfaktorisierungsalgorithmus auszuführen. Dieses Notizbuch zeigt, wie Sie eine Tabelle mit vielen Spalten in ein reduziertes Featureset konvertieren. Die nicht-negative Matrix Factorization erzeugt nicht-negative Koeffizienten.
  • OML4SQL Dimensionalitätsreduzierung - Einzelwertzerlegung: Verwenden Sie dieses Notizbuch, um die Dimensionalität mit dem datenbankinternen Singular Value Decomposition-(SVD-)Algorithmus zu reduzieren.
  • OML4SQL: Serialisierte Modelle exportieren: Mit diesem Notizbuch können Sie serialisierte Modelle in Oracle Cloud Object Storage exportieren. Dieses Notizbuch erstellt Regressions- und Klassifizierungsmodelle für Oracle Machine Learning und exportiert die Modelle in einem serialisierten Format, sodass sie mit der REST-API für Oracle Machine Learning-(OML-)Services bewertet werden können. OML Services stellt REST-API-Endpunkte bereit, die auf Oracle Autonomous Database gehostet werden. Mit diesen Endpunkten können Oracle Machine Learning-Modelle zusammen mit ihren Metadaten gespeichert und Scoringendpunkte für das Modell erstellt werden. Die REST-API für OML-Services unterstützt sowohl Oracle Machine Learning-Modelle als auch ONNX-Formatmodelle und ermöglicht kognitive Textfunktionen.
  • OML4SQL Feature Engineering Aggregation and Time: Verwenden Sie dieses Notizbuch, um aggregierte Features zu generieren und Datums- und Uhrzeitfunktionen mit Oracle SQL zu extrahieren. Das Notizbuch zeigt auch, wie Sie Datums- und Uhrzeitfunktionen aus dem Feld TIME_ID extrahieren.
  • OML4SQL Featureauswahlalgorithmusbasiert: Verwenden Sie dieses Notizbuch, um die Featureauswahl mit datenbankinternen überwachten Algorithmen auszuführen. Das Notizbuch erstellt zunächst ein zufälliges Gesamtstrukturmodell, um vorherzusagen, ob der Kunde eine Versicherung kauft, und verwendet dann Werte für die Featurewichtigkeit für die Featureauswahl. Anschließend wird ein Entscheidungsbaummodell für dieselbe Klassifizierungsaufgabe erstellt und geteilte Knoten abgerufen. Für die Top-Splitting-Knoten mit der höchsten Unterstützung werden Features ausgewählt, die diesen Knoten zugeordnet sind.
  • OML4SQL Featureauswahl Nicht überwachte Attributbedeutung: Verwenden Sie dieses Notizbuch, um die Funktionsauswahl mit dem datenbankinternen nicht überwachten Algorithmus "Erwartungsmaximierung" (Expectation Maximization, EM) auszuführen. Dieses Notizbuch veranschaulicht die Verwendung der Funktion CREATE_MODEL, die die Einstellungstabelle im Gegensatz zur Funktion CREATE_MODEL2 nutzt, die in anderen Notizbüchern verwendet wird.
  • OML4SQL Featureauswahl mit Übersichtsstatistiken: Verwenden Sie dieses Notizbuch, um die Funktionsauswahl mithilfe von Übersichtsstatistiken mit Oracle SQL auszuführen. Das Dataset CUSTOMER_INSURANCE_LTV_SQL enthält Nullwerte, die vom OML4SQL Noise-Notizbuch künstlich generiert wurden. Sie müssen zuerst das Noise-Notizbuch OML4SQL ausführen, bevor Sie die Featureauswahl OML4SQL mit Übersichtsstatistiken ausführen.
  • OML4SQL Rauschen: Mit diesem Notizbuch können Sie normale Werte durch Nullwerte ersetzen und doppelte Zeilen hinzufügen. In diesem Notizbuch wird der von den Data Preparation-Notizbüchern verwendete Datensatz vorbereitet, insbesondere für die Datenreinigung und Featureauswahl. Es verwendet das Dataset für den Customer Insurance Lifetime Value, das Kundenfinanzinformationen, den Lifetime Value und die Angabe enthält, ob der Kunde eine Versicherung gekauft hat.

    Hinweis:

    Führen Sie das Notizbuch "OML4SQL Noise" vor den Notizbüchern zur Datenvorbereitung aus.
  • OML4SQL Partitioniertes Modell: Verwenden Sie dieses Notizbuch, um partitionierte Modelle zu erstellen. Partitionierte Modelle erzielen potenziell bessere Genauigkeit durch mehrere gezielte Modelle. Das Notebook erstellt ein SVM-Modell, um die Anzahl der Jahre vorherzusagen, in denen ein Kunde seinen Wohnsitz hat, aber auf das Geschlecht des Kunden aufgeteilt ist. Das Modell wird dann verwendet, um das Ziel zuerst vorherzusagen und dann das Ziel mit Vorhersagedetails vorherzusagen.
  • OML4SQL Text-Mining: Verwenden Sie dieses Notizbuch, um Modelle mit Text-Mining-Funktionen zu erstellen. Oracle Machine Learning verarbeitet sowohl strukturierte Daten als auch unstrukturierte Textdaten. Durch die Nutzung von Oracle Text extrahieren datenbankinterne Oracle Machine Learning-Algorithmen automatisch Vorhersagefunktionen aus der Textspalte.

    Dieses Notizbuch erstellt ein SVM-Modell, um Kunden vorherzusagen, die am ehesten positiv auf ein Affinity Card-Treueprogramm reagieren. Die Daten werden mit einer Textspalte geliefert, die benutzergenerierte Kommentare enthält. Mit einigen zusätzlichen Spezifikationen verwendet der Algorithmus automatisch die Textspalte und erstellt das Modell sowohl auf strukturierten Daten als auch auf unstrukturiertem Text.

  • OML4SQL Regression: Verwenden Sie dieses Notizbuch, um numerische Werte vorherzusagen. Diese Vorlage verwendet mehrere Regressionsalgorithmen wie Generalized Linear Models (GLM).
  • OML4SQL Statistische Funktion: Verwenden Sie dieses Notizbuch für beschreibende und vergleichende statistische Funktionen. Die Notizbuchvorlage verwendet SH-Schemadaten.
  • OML4SQL Zeitreihe: Verwenden Sie dieses Notizbuch, um Zeitreihenmodelle auf Ihren Zeitreihendaten für Prognosen zu erstellen. Dieses Notizbuch basiert auf dem Exponentialglättungsalgorithmus. Das Beispiel für Umsatzprognosen in diesem Notizbuch basiert auf den SH.SALES-Daten. Alle Berechnungen werden in Oracle Autonomous Database ausgeführt.