10 Utiliser des modèles pour collaborer avec les utilisateurs

En utilisant les modèles de bloc-notes Oracle Machine Learning, vous pouvez collaborer avec d'autres utilisateurs en partageant votre travail, en publiant votre travail sous forme de rapports et en créant des blocs-notes à partir de modèles. Vous pouvez stocker vos blocs-notes sous forme de modèles, partager des blocs-notes et fournir des exemples de modèles à d'autres utilisateurs.

Remarques :

Vous pouvez également collaborer avec d'autres utilisateurs de blocs-notes Oracle Machine Learning en donnant accès à votre espace de travail. L'utilisateur authentifié peut alors accéder aux projets de votre espace de travail et à vos blocs-notes. Le niveau d'accès dépend du type d'autorisation accordé : Gestionnaire, Développeur ou Visualiseur. Pour plus d'informations sur la collaboration entre les utilisateurs, reportez-vous à Comment collaborer dans Oracle Machine Learning Notebooks

10.1 Utiliser les modèles personnels

Modèles personnels répertorie les modèles de bloc-notes que vous avez créés.

Vous pouvez effectuer les opérations suivantes :
  • Afficher les modèles sélectionnés en mode lecture seule.

  • Créez des blocs-notes à partir des modèles sélectionnés.

  • Modifier les modèles sélectionnés.

  • Partagez les modèles de bloc-notes sélectionnés dans Modèles partagés.

  • Supprimer les modèles de bloc-notes sélectionnés.

10.1.1 Création de blocs-notes à partir de modèles

Vous pouvez créer des blocs-notes à partir d'un modèle existant et les stocker dans des modèles personnels pour une utilisation ultérieure.

Vous devez sélectionner un modèle de bloc-notes.
Pour créer un bloc-notes à partir d'un modèle, procédez comme suit :
  1. Sur la page Modèles personnels, sélectionnez le modèle en fonction duquel créer le bloc-notes, puis cliquez sur Nouveau bloc-notes.
    La boîte de dialogue Créer un bloc-notes s'ouvre.
  2. Dans le champ Nom, indiquez le nom du bloc-notes.
  3. Dans le champ Comments, entrez des commentaires, le cas échéant.
  4. Dans le champ Projet, sélectionnez le projet dans lequel enregistrer le bloc-notes.
  5. Dans le champ Connexion, la connexion par défaut est sélectionnée.
  6. Cliquez sur OK.
Le bloc-notes est créé et est disponible sur la page Bloc-notes.

10.1.2 Partage de modèles de bloc-notes

Vous pouvez partager des modèles à partir de Modèles personnels.Vous pouvez également partager des modèles pour les modifier.

Pour partager un modèle, procédez comme suit :
  1. Sélectionnez le modèle de bloc-notes dans Modèles personnels et cliquez sur Partager.
    La boîte de dialogue Enregistrer dans des modèles partagés apparaît.
  2. Dans le champ Nom, entrez le nouveau nom du modèle.
  3. Dans le champ Comments, indiquez des commentaires, le cas échéant.
  4. Dans le champ Balises, entrez des balises séparées par des virgules. Pour faciliter la recherche, utilisez des balises descriptives.
  5. Cliquez sur OK.
Une fois le modèle créé et partagé, un message s'affiche indiquant que le modèle est créé dans Partagé.

10.1.3 Modifier les paramètres des modèles de bloc-notes

Vous pouvez modifier les paramètres d'un modèle de bloc-notes existant dans Modèles personnels.

Pour modifier les paramètres d'un modèle de bloc-notes, procédez comme
  1. Sélectionnez le modèle de bloc-notes dans Modèles personnels et cliquez sur Modifier les paramètres.
    La boîte de dialogue Modifier le modèle s'ouvre.
  2. Dans le champ Nom, modifiez le nom, le cas échéant.
  3. Dans le champ Comments, modifiez les commentaires, le cas échéant.
  4. Dans le champ Balises, modifiez les balises, le cas échéant.
  5. Cliquez sur OK.

10.2 Utiliser les modèles partagés

Dans Modèles partagés, vous pouvez partager avec tous les utilisateurs authentifiés les modèles de bloc-notes que vous créez à partir de blocs-notes existants disponibles dans Modèles.

La page Modèles partagés suit les modèles de bloc-notes lorsque vous effectuez les opérations suivantes :
  • Modèle Like

  • Créer des blocs-notes à partir de modèles

  • Visualiser les modèles

La page Modèles partagés affiche les informations suivantes sur les modèles :
  • Nom de modèle

  • Description

  • Nombre de likes

  • Nombre de créations

  • Nombre de vues statiques

Vous pouvez effectuer les opérations suivantes :
  • Créer des modèles en cliquant sur Nouveau bloc-notes

  • Modifier les paramètres du modèle en cliquant sur Modifier les paramètres

  • Supprimer un modèle sélectionné en cliquant sur Supprimer

  • Rechercher des modèles par nom, étiquette, auteur

  • Trier les modèles par nom, date, auteur, aimé, consulté, utilisé

  • Pour afficher les modèles, cliquez sur Afficher uniquement les éléments qui vous intéressent ou sur Afficher uniquement mes éléments.

10.2.1 Création de blocs-notes à partir de modèles

Vous pouvez créer des blocs-notes à partir d'un modèle existant et les stocker dans des modèles personnels pour une utilisation ultérieure.

Vous devez sélectionner un modèle de bloc-notes.
Pour créer un bloc-notes à partir d'un modèle, procédez comme suit :
  1. Sur la page Modèles personnels, sélectionnez le modèle en fonction duquel créer le bloc-notes, puis cliquez sur Nouveau bloc-notes.
    La boîte de dialogue Créer un bloc-notes s'ouvre.
  2. Dans le champ Nom, indiquez le nom du bloc-notes.
  3. Dans le champ Comments, entrez des commentaires, le cas échéant.
  4. Dans le champ Projet, sélectionnez le projet dans lequel enregistrer le bloc-notes.
  5. Dans le champ Connexion, la connexion par défaut est sélectionnée.
  6. Cliquez sur OK.
Le bloc-notes est créé et est disponible sur la page Bloc-notes.

10.2.2 Modifier les paramètres des modèles de bloc-notes

Vous pouvez modifier les paramètres d'un modèle de bloc-notes existant dans Modèles personnels.

Pour modifier les paramètres d'un modèle de bloc-notes, procédez comme
  1. Sélectionnez le modèle de bloc-notes dans Modèles personnels et cliquez sur Modifier les paramètres.
    La boîte de dialogue Modifier le modèle s'ouvre.
  2. Dans le champ Nom, modifiez le nom, le cas échéant.
  3. Dans le champ Comments, modifiez les commentaires, le cas échéant.
  4. Dans le champ Balises, modifiez les balises, le cas échéant.
  5. Cliquez sur OK.

10.3 Utiliser les exemples de modèle

La page Exemples de modèle répertorie les modèles de bloc-notes Oracle Machine Learning préremplis. Vous pouvez afficher et utiliser ces modèles pour créer vos blocs-notes.

La page Exemples de modèle affiche les informations suivantes sur les modèles :
  • Nom de modèle

  • Description

  • Nombre de likes. Cliquez sur J'aime pour le marquer comme aimé.

  • Nombre de vues statiques

  • Nombre d'utilisation

Vous ne pouvez modifier aucun modèle dans la page Exemples de modèle. Les options de recherche sont les suivantes :
  • Rechercher des modèles par nom, étiquette, auteur

  • Trier les modèles par nom, date, auteur, aimé, consulté, utilisé

  • Afficher les modèles qui vous plaisent en cliquant sur Afficher uniquement les modèles qui vous plaisent

10.3.1 Créer un bloc-notes à partir des exemples de modèle

A l'aide des modèles d'exemple Oracle Machine Learning, vous pouvez créer un bloc-notes à partir des modèles disponibles.

To create a notebook:
  1. Sur la page Exemples de modèle, sélectionnez le modèle en fonction duquel créer un bloc-notes.
  2. Cliquez sur Nouveau bloc-notes.
    La boîte de dialogue Créer un bloc-notes s'ouvre.
  3. Dans la boîte de dialogue Créer un bloc-notes, le nom du modèle sélectionné apparaît. Vous pouvez modifier le nom du bloc-notes dans le champ Nom.
    Boîte de dialogue Créer un bloc-notes
  4. Dans le champ Commentaire, si un commentaire est disponible pour le modèle, il est affiché. Vous pouvez modifier le commentaire.
  5. Dans le champ Projet, cliquez sur l'icône de modification modifier.
  6. Sélectionnez le projet dans lequel vous souhaitez enregistrer le bloc-notes.
  7. Dans le champ Connexion, la connexion par défaut est sélectionnée.
  8. Cliquez sur OK.
Le bloc-notes est créé et disponible sur la page Blocs-notes.

10.3.2 Exemples de modèle

Oracle Machine Learning Notebooks vous fournit des exemples de modèles de bloc-notes basés sur différents algorithmes et langages d'apprentissage automatique tels que Python, R et SQL. Les exemples de modèle sont traités dans Oracle Autonomous Database.

Vous pouvez créer vos propres blocs-notes Oracle Machine Learning modifiables et exécutables en fonction de l'un des exemples de bloc-notes de modèle Oracle Machine Learning for R suivants :
  • Exporter et importer des modèles sérialisés OML : utilisez ce bloc-notes pour exporter et importer des modèles sérialisés natifs à l'aide des procédures DBMS_DATA_MINING.EXPORT_SERMODEL et DBMS_DATA_MINING.IMPORT_SERMODEL. Oracle Machine Learning fournit des API pour rationaliser le processus de migration des modèles entre les bases de données et les plates-formes.
  • Modèle OML Wiki ESA : utilisez ce bloc-notes pour la catégorisation des documents textuels en calculant les relations sémantiques (comment la signification de deux mots ou morceaux de texte est-elle similaire) entre les documents et un ensemble de sujets explicitement définis et décrits par les humains. Les fonctions Oracle Machine Learning for SQL ESA, Oracle Machine Learning for Python oml.esa et Oracle Machine Learning for R ore.odmESA extraient des fonctionnalités textuelles à partir d'un corpus de documents et effectuent des comparaisons de similarité de documents. Dans ce bloc-notes, le modèle ESA wiki est importé dans Autonomous Database pour être utilisé avec les exemples de bloc-notes de modèle OML suivants :
    • OML4SQL Modèle Wiki d'extraction de fonctionnalités ESA
    • OML4Py Modèle Wiki d'extraction de fonctionnalités ESA
    • OML4R Modèle Wiki d'extraction de fonctionnalités ESA
  • Notation par lots des services OML : utilisez ce bloc-notes pour exécuter des travaux d'évaluation par lots via une interface REST via les services OML. OML Services prend en charge l'évaluation par lots pour la régression, la classification, le clustering et l'extraction de fonctionnalités.
    • Authentifier l'utilisateur de base de données et obtenir un jeton
    • Créer un travail d'évaluation par score par lots
    • Afficher les détails et la sortie du travail d'évaluation par score du lot
    • Mettre à jour, désactiver et supprimer un travail d'évaluation par lots
  • Surveillance des données des services OML : utilisez ce bloc-notes pour effectuer la surveillance des données. Cette exécution de bloc-notes vous fournit les étapes de workflow de surveillance des données via l'interface REST qui inclut les éléments suivants :
    • Authentifier l'utilisateur de base de données et obtenir un jeton
    • Créer un travail de surveillance des données
    • Visualiser les détails et la sortie du travail de surveillance des données
    • Mettre à jour, désactiver et supprimer un travail de surveillance des données
  • Surveillance des modèles de services OML : utilisez ce bloc-notes pour comprendre et effectuer la surveillance des modèles. Cette exécution de bloc-notes vous fournit les étapes de workflow de surveillance de modèle via l'interface REST qui inclut les éléments suivants :
    • Authentifier l'utilisateur de base de données et obtenir un jeton
    • Créer un travail de surveillance de modèle
    • Visualiser les détails et la sortie du travail de surveillance de modèle
    • Mettre à jour, désactiver et supprimer un travail de surveillance de modèle
  • Packages tiers OML - Création d'environnement : utilisez ce bloc-notes pour télécharger et activer l'environnement conda, ainsi que pour utiliser les bibliothèques dans vos sessions de bloc-notes. Oracle Machine Learning Notebooks fournit un interpréteur Conda pour installer des bibliothèques Python et R tierces dans un environnement Conda à utiliser dans les sessions Oracle Machine Learning Notebooks, ainsi que dans les appels d'exécution intégrés Oracle Machine Learning for Python et Oracle Machine Learning for R.

    Les bibliothèques tierces installées dans Oracle Machine Learning Notebooks peuvent être utilisées dans :

    • Python standard
    • R standard
    • Exécution Python intégrée d'Oracle Machine Learning for Python à partir des API Python, SQL et REST
    • Exécution R intégrée d'Oracle Machine Learning for R à partir des API R, SQL et REST

    Remarques :

    L'environnement conda est installé et géré par l'utilisateur ADMIN avec le rôle OML_SYS_ADMIN. L'administrateur peut créer un environnement partagé et en ajouter ou en supprimer des packages. Les environnements conda sont stockés dans le bucket Object Storage associé à Autonomous Database.

    Conda est un système de gestion d'environnement et de packages open source qui permet l'utilisation d'environnements virtuels contenant des packages R et Python tiers. Avec les environnements conda, vous pouvez installer et mettre à jour des packages et leurs dépendances, et passer d'un environnement à l'autre pour utiliser des packages spécifiques au projet.

    Ce modèle de bloc-notes Packages tiers OML - Création d'environnement contient un workflow standard pour la création d'environnements tiers et l'installation de packages dans Oracle Machine Learning Notebooks.

    • La section 1 contient des commandes permettant de créer et de tester des environnements conda.
    • La section 2 contient des commandes permettant de créer un environnement conda, d'installer des packages et de télécharger l'environnement conda vers un bucket Object Storage associé à Oracle Autonomous Database.

    Figure 10-1 Exemples de modèles conda

    Exemples de modèles conda
  • Packages tiers OML - Utilisation de l'environnement Python : utilisez ce bloc-notes de modèle pour comprendre le workflow standard d'utilisation d'environnement tiers dans Oracle Machine Learning Notebooks à l'aide de Python et d'Oracle Machine Learning for Python. Vous téléchargez et utilisez les bibliothèques dans des environnements conda précédemment créés et enregistrés dans un dossier de bucket Object Storage associé à Autonomous Database.
    Ce bloc-notes contient des commandes permettant de :
    • Répertorier tous les environnements stockés dans Object Storage
    • Enumération d'un environnement nommé stocké dans Object Storage
    • Téléchargez et activez l'environnement mypyenv
    • Répertorier les packages disponibles dans l'environnement Conda
    • Importer des bibliothèques Python
    • Charger des ensembles de données
    • Création de modèles
    • Modèles de score
    • Créer des fonctions définies par l'utilisateur (UDF) Python
    • Exécuter les fonctions définies par l'utilisateur (UDF) en Python
    • Créer et exécuter des fonctions définies par l'utilisateur dans les API SQL et REST pour l'exécution Python intégrée
    • Créer et exécuter des fonctions définies par l'utilisateur Python à l'aide de l'API SQL pour l'exécution Python imbriquée - mode asynchrone
  • Packages tiers OML - Utilisation de l'environnement R : utilisez ce bloc-notes de modèle pour comprendre le workflow standard d'utilisation d'environnement tiers dans Oracle Machine Learning for R.
    Ce bloc-notes contient des commandes permettant de :
    • Répertorier tous les environnements stockés dans Object Storage
    • Enumération d'un environnement nommé stocké dans Object Storage
    • Téléchargez et activez l'environnement myrenv
    • Afficher la liste des environnements conda OML4R disponibles
    • Importer des bibliothèques R
    • Charger et préparer les données
    • Création de modèles
    • Modèles de score
    • Créer des fonctions définies par l'utilisateur R (UDF)
    • Exécuter des fonctions définies par l'utilisateur (UDF) dans R
    • Enregistrer les fonctions définies par l'utilisateur (UDF) dans le référentiel de scripts
    • Exécuter la fonction définie par l'utilisateur R dans les API SQL et REST pour l'exécution R intégrée
    • Ajouter l'utilisateur OML à la liste de contrôle d'accès
    • Exécuter les fonctions définies par l'utilisateur R à l'aide de l'API REST pour l'exécution R intégrée en mode synchrone
  • OML4R-1 : Introduction : utilisez ce bloc-notes pour comprendre comment :
    • Charger la bibliothèque ORE
    • Créer des tables de base de données
    • Utiliser la couche de transparence
    • Classer les attributs d'une valeur prédictive à l'aide de l'algorithme d'importance des attributs dans la base de
    • Créer des modèles prédictifs, et
    • Evaluer les données à l'aide de ces modèles

    Figure 10-2 Exemples de modèles Oracle Machine Learning for R

    OML4R Exemples de modèle
  • OML4R-2 : Sélection et manipulation des données : utilisez ce bloc-notes pour comprendre les fonctionnalités de la couche de transparence impliquant la sélection et la manipulation des données.
  • OML4R-3 : banque de données et référentiel de scripts : utilisez ce bloc-notes pour comprendre les fonctionnalités de banque de données et de référentiel de scripts de OML4R.
  • OML4R-4 : exécution R imbriquée : utilisez ce bloc-notes pour comprendre l'exécution R imbriquée OML4R. Tout d'abord, un modèle linéaire est directement intégré à R, puis une fonction R définie par l'utilisateur est créée pour créer le modèle linéaire, la fonction est ensuite enregistrée dans le référentiel de scripts et les données sont évaluées en parallèle à l'aide des moteurs R générés dynamiquement par l'environnement Oracle Autonomous Database. Le bloc-notes explique également comment appeler ces scripts à l'aide de l'interface SQL et de l'API REST pour R avec exécution R intégrée.

    Remarques :

    Pour utiliser l'API SQL pour l'exécution R imbriquée, une fonction R définie par l'utilisateur doit résider dans le référentiel de scripts OML4R et un compte cloud Oracle Machine Learning (OML) USERNAME, PASSWORD et URL doit être fourni pour obtenir un jeton d'authentification.
  • OML4R Anomaly Detection Support Vector Machine (SVM) : utilisez ce bloc-notes pour créer un modèle SVM de classe unique, puis pour signaler les enregistrements inhabituels ou suspects.
  • OML4R Règles d'association Apriori : utilisez ce bloc-notes pour créer des modèles de règles d'association à l'aide de l'algorithme A Priori avec des données du schéma SH (SH.SALES). Tous les calculs ont lieu dans Oracle Autonomous Database.
  • OML4R Longueur de description minimale d'importance d'attribut (MDL) : Utilisez ce bloc-notes pour calculer l'importance d'attribut, qui utilise l'algorithme Longueur de description minimale, sur les données du schéma SH. Toutes les fonctionnalités sont exécutées dans Oracle Autonomous Database. Oracle Machine Learning prend en charge l'importance des attributs pour identifier les facteurs clés tels que les attributs, les prédicteurs et les variables qui ont le plus d'influence sur un attribut cible.
  • OML4R Modèle linéaire généralisé de classification (GLM) : Utilisez ce bloc-notes pour prévoir les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Ce bloc-notes crée et applique un modèle linéaire généralisé de classification à l'aide des données du schéma Historique des ventes (SH). Tous les traitements ont lieu dans Oracle Autonomous Database.
  • OML4R Classification Naive Bayes (NB) : Utilisez ce bloc-notes pour prévoir les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Ce bloc-notes crée et applique un modèle d'arborescence de décision de classification à l'aide des données du schéma Historique des ventes (SH). Tous les traitements ont lieu dans Oracle Autonomous Database.
  • OML4R Classification Random Forest (RF) : Utilisez ce bloc-notes pour utiliser l'algorithme Random Forest pour la classification dans OML4R et prédire les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card.
  • OML4R Modélisation de classification pour prédire les clients cible à l'aide de Support Vector Machine (SVM) : utilisez ce bloc-notes pour utiliser la modélisation de classification afin de prédire les clients cible à l'aide du modèle Support Vector Machine.
  • OML4R Clusterisation - Identifier des segments client à l'aide du clustering de maximisation des attentes : Utilisez ce bloc-notes pour comprendre comment identifier des clusters naturels de clients à l'aide du jeu de données CUSTOMERS du schéma SH à l'aide de l'algorithme de maximisation des attentes de formation non supervisée (EM). L'exploration, la préparation et le machine learning des données sont exécutés dans Oracle Autonomous Database.
  • OML4R Clustering - Identifier des segments client à l'aide du clustering K-Means : utilisez ce bloc-notes pour comprendre comment identifier des clusters naturels de clients à l'aide de l'ensemble de données CUSTOMERS du schéma SH à l'aide de l'algorithme K-Means (KM) de formation non supervisée. L'exploration, la préparation et le machine learning des données sont exécutés dans Oracle Autonomous Database.
  • OML4R Clustering - Clustering de partitionnement orthogonal (OC) : utilisez ce bloc-notes pour comprendre comment identifier des clusters naturels de clients à l'aide de l'ensemble de données CUSTOMERS du schéma SH à l'aide de l'algorithme k-Means d'apprentissage non supervisé. L'exploration, la préparation et le machine learning des données s'exécutent dans Oracle Autonomous Database.
  • OML4R Valeur aberrante de nettoyage des données : utilisez ce bloc-notes pour comprendre et exclure les enregistrements avec des valeurs aberrantes à l'aide de OML4R.
  • OML4R Nettoyage des données - Recoder les valeurs synonymes : utilisez ce bloc-notes pour recoder la valeur synonyme à l'aide de OML4R.
  • Création de l'ensemble de données OML4R : utilisez ce bloc-notes pour charger les exemples d'ensembles de données MTCARS et IRIS, et pour les importer dans votre instance Oracle Autonomous Database à l'aide de la fonction ore.create().

Remarques :

Les exemples de bloc-notes de modèle suivants précédés d'un astérisque (*) utilisent le jeu de données CUSTOMER_INSURANCE_LTV. Cet ensemble de données est généré par le bloc-notes OML Run-me-first. Par conséquent, vous devez exécuter le bloc-notes OML Run-me-first disponible sous Modèles d'exemple.
  • * OML4R Données manquantes de nettoyage des données : utilisez ce bloc-notes pour effectuer le remplacement des valeurs manquantes à l'aide de OML4R.
  • * OML4R Suppression des doublons de nettoyage de données : utilisez ce bloc-notes pour enlever les enregistrements en double à l'aide de OML4R.
  • * OML4R Catégorisation des données par transformation : utilisez ce bloc-notes pour classer les colonnes numériques à l'aide de OML4R.
  • * OML4R Enregistrement de catégorie de transformation de données : utilisez ce bloc-notes pour recoder une variable de chaîne catégorique en une variable numérique et un recodage chaîne-chaîne à l'aide de OML4R.
  • * OML4R Transformation des données : normalisation et mise à l'échelle : utilisez ce bloc-notes pour normaliser et mettre à l'échelle les données à l'aide de OML4R.
  • * OML4R Transformation des données : codage ponctuel : utilisez ce bloc-notes pour effectuer un codage ponctuel à l'aide de OML4R.
  • * OML4R Sélection de fonctionnalité - Algorithme supervisé : utilisez ce bloc-notes pour effectuer la sélection de fonctionnalité à l'aide d'algorithmes supervisés dans la base de données à l'aide de OML4R. Ce bloc-notes explique comment créer un modèle Forêt aléatoire pour prédire si le client achèterait une assurance ou non, puis utiliser l'importance des fonctionnalités pour effectuer la sélection des fonctionnalités.
  • * OML4R Sélection de fonctionnalités à l'aide des statistiques récapitulatives : utilisez ce bloc-notes pour effectuer la sélection de fonctionnalités à l'aide des statistiques récapitulatives à l'aide de OML4R. Ce bloc-notes explique comment utiliser OML4R pour sélectionner des fonctionnalités en fonction du nombre de valeurs distinctes, des valeurs NULL et de la proportion de valeurs constantes.
  • OML4R Agrégation d'ingénierie des fonctionnalités : utilisez ce bloc-notes pour effectuer une agrégation pour min, max, moyenne et nombre à l'aide de OML4R. Ce modèle utilise la table SALES présente dans le schéma SH et montre comment créer des fonctionnalités en agrégeant le montant vendu pour chaque paire client/produit.
  • OML4R Modèle Wiki d'extraction de fonctionnalités d'analyse sémantique explicite (ESA) : ce bloc-notes utilise le modèle Wikipédia comme exemple. Utilisez ce bloc-notes pour utiliser la fonction Oracle Machine Learning for R ore.odmESA afin d'extraire des fonctionnalités textuelles d'un corpus de documents et d'effectuer des comparaisons de similarité de documents. Tous les traitements ont lieu dans Oracle Autonomous Database.

    Remarques :

    Le modèle Wikipedia prédéfini doit être installé dans votre instance Autonomous Database pour exécuter ce bloc-notes.
  • OML4R Types de données de date de transformation de données : utilisez ce bloc-notes pour effectuer diverses opérations sur les données de date et d'heure à l'aide d'objets proxy de table de base de données à l'aide d'Oracle Machine Learning for R.
  • OML4R SVD (Singular Value Decomposition) d'extraction de fonctionnalités : utilisez ce bloc-notes pour utiliser le SVD dans la base de données pour l'extraction de fonctionnalités. Ce bloc-notes utilise la fonction Oracle Machine Learning for R ore.odmSVD pour créer un modèle qui utilise l'algorithme de décomposition de la valeur unique (SVD) pour l'extraction de fonctionnalités.
  • OML4R Modèle partitionné Support Vector Machine (SVM) : utilisez ce bloc-notes pour créer un modèle SVM afin de prévoir le nombre d'années pendant lesquelles un client réside chez lui mais est partitionné en fonction du sexe du client. Le modèle est ensuite utilisé pour prédire la cible, puis prédire la cible avec des détails de prédiction.
  • OML4R Modèle linéaire généralisé de régression : utilisez ce bloc-notes pour comprendre comment prédire des valeurs numériques à l'aide de plusieurs régressions. Ce bloc-notes utilise l'algorithme Modèle linéaire généralisé.
  • OML4R Réseau neuronal de régression (NN) : utilisez ce bloc-notes pour comprendre comment prédire des valeurs numériques à l'aide de plusieurs régressions. Ce bloc-notes utilise l'algorithme Réseau neuronal.
  • OML4R Regression Support Vector Machine (SVM) : utilisez ce bloc-notes pour comprendre comment prédire des valeurs numériques à l'aide de plusieurs régressions. Ce bloc-notes utilise l'algorithme Support Vector Machine.
  • API REST OML4R : utilisez ce bloc-notes pour comprendre comment utiliser l'API REST OML4R afin d'appeler des fonctions R définies par l'utilisateur et pour répertorier celles disponibles dans le référentiel de scripts R.

    Remarques :

    Pour exécuter un script, il doit résider dans le référentiel de scripts R. Un nom utilisateur et un mot de passe de compte de service cloud Oracle Machine Learning doivent être fournis pour l'authentification.
  • OML4R Fonction statistique : utilisez ce bloc-notes pour comprendre et utiliser diverses fonctions statistiques. Le bloc-notes utilise les données du schéma SH via la couche de transparence OML4R.
  • OML4R Text Mining Support Vector Machine (SVM) : utilisez ce bloc-notes pour comprendre comment utiliser des données texte non structurées pour créer des modèles de machine learning, tirer parti d'Oracle Text, utiliser les fonctionnalités prédictives des algorithmes dans la base de données d'Oracle Machine Learning et extraire des fonctionnalités des colonnes de texte.

    Ce bloc-notes construit un modèle Support Vector Machine (SVM) pour prédire les clients qui sont les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Les données proviennent d'une colonne de texte contenant des commentaires générés par l'utilisateur.

Modèles d'exemple Oracle Machine Learning for Python

Vous pouvez créer vos blocs-notes Oracle Machine Learning à partir de l'un des exemples de modèle Oracle Machine Learning for Python suivants :

Figure 10-3 Exemples de modèles Oracle Machine Learning for Python

OML4Py Exemples de modèle
  • Mon premier bloc-notes : utilisez le bloc-notes Mon premier bloc-notes pour les fonctions de machine learning de base, la sélection des données et l'affichage des données. Ce modèle utilise les données de schéma SH.
  • OML4Py -0- Visite guidée : ce bloc-notes est le premier d'une série 0 à 5 destinée à vous présenter la gamme de fonctionnalités OML4Py à l'aide de courts exemples.
  • OML4Py -1- Introduction : ce bloc-notes présente le chargement de la bibliothèque OML, la création de tables de base de données, l'utilisation de la couche de transparence, le classement des attributs de valeur prédictive à l'aide de l'algorithme d'importance d'attribut dans la base de données, la création de modèles prédictifs et l'évaluation des données à l'aide de ces modèles.
  • OML4Py -2- Sélection et manipulation des données : utilisez ce bloc-notes pour apprendre à utiliser la couche de transparence qui implique la sélection et la manipulation des données.
  • OML4Py -3- Banques de données : utilisez ce bloc-notes pour apprendre à utiliser des banques de données, à déplacer des objets entre une banque de données et une session Python, à gérer des privilèges de banque de données, à enregistrer des objets de modèle et des objets Python dans une banque de données, à supprimer des banques de données, etc.
  • OML4Py -4- Exécution Python intégrée : utilisez ce bloc-notes pour comprendre l'exécution Python intégrée. Dans ce bloc-notes, un modèle linéaire est créé directement en Python, puis une fonction qui utilise des moteurs Python générés dynamiquement par l'environnement Autonomous Database est créée.
  • OML4Py -5- AutoML : utilisez ce bloc-notes pour comprendre le workflow AutoML dans OML4Py. Dans ce bloc-notes, l'ensemble de données WINE de scikit-learn est utilisé. Ici, AutoML est utilisé pour la classification sur la colonne target et pour la régression sur la colonne alcohol.

Remarques :

Les exemples de bloc-notes de modèle suivants précédés d'un astérisque (*) utilisent le jeu de données CUSTOMER_INSURANCE_LTV_PY. Ce jeu de données comporte des valeurs en double générées artificiellement par le bloc-notes OML4SQL Noise. Par conséquent, vous devez exécuter OML4SQL Noise avant d'exécuter le bloc-notes.
  • * OML4Py Suppression des doublons de nettoyage de données : utilisez ce bloc-notes pour comprendre comment enlever les enregistrements en double à l'aide de OML4Py. Ce bloc-notes utilise le jeu de données sur la valeur vie client de l'assurance, qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance.
  • * OML4Py Données manquantes de nettoyage de données : utilisez ce bloc-notes pour comprendre comment renseigner les valeurs manquantes à l'aide de OML4Py. Ce bloc-notes utilise le jeu de données sur la valeur vie client de l'assurance, qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance.
  • * OML4Py Data Cleaning Recode Synonymous Values : utilisez ce bloc-notes pour comprendre comment recoder une valeur synonyme à l'aide de OML4Py. Ce bloc-notes utilise le jeu de données sur la valeur vie client de l'assurance, qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance.
  • OML4Py Suppression des valeurs aberrantes de nettoyage des données : utilisez ce bloc-notes pour comprendre comment nettoyer les données afin d'enlever les valeurs aberrantes. Ce bloc-notes utilise l'ensemble de données CUSTOMER_INSURANCE_LTV qui contient les informations financières du client, la valeur à vie et indique si le client a acheté une assurance. Dans l'ensemble de données CUSTOMER_INSURANCE_LTV, l'accent est mis sur les valeurs numériques et la suppression des enregistrements dont les valeurs figurent dans les 5 % supérieur et inférieur.
  • OML4Py Catégorisation des données par transformation : utilisez ce bloc-notes pour comprendre comment classer une colonne numérique et visualiser la distribution.
  • OML4Py Transformation de données catégorielle - Convertir des variables de catégorie en variables numériques : utilisez ce bloc-notes pour comprendre comment convertir des variables de catégorie en variables numériques à l'aide de OML4Py. Les blocs-notes montrent comment convertir une variable catégorique avec chaque niveau/valeur distinct codé en type de données entier.
  • OML4Py Normalisation et mise à l'échelle de la transformation des données : utilisez ce bloc-notes pour comprendre comment normaliser et mettre à l'échelle les données à l'aide de z-score (écart-type et moyen), de min max et de log scaling.

    Remarques :

    Lors de la création ou de l'application d'un modèle à l'aide d'algorithmes Oracle Machine Learning dans la base de données, la préparation automatique des données normalise automatiquement les données selon les besoins, par des algorithmes spécifiques.
  • OML4Py Transformation des données - Un codage à chaud : utilisez ce bloc-notes pour comprendre comment effectuer un codage à chaud à l'aide de OML4Py. Les algorithmes d'apprentissage automatique ne peuvent pas utiliser directement des données catégoriques. Les données de catégorie doivent être converties en nombres. Ce bloc-notes utilise le jeu de données sur la valeur vie client de l'assurance, qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance.

    Remarques :

    Si vous prévoyez d'utiliser les algorithmes de la base de données, un codage à chaud est automatiquement appliqué aux algorithmes qui en ont besoin. Les algorithmes in-databae explosent automatiquement les colonnes catégorielles et adaptent le modèle aux données préparées en interne.
  • OML4Py Détection d'anomalies : utilisez ce bloc-notes pour détecter les enregistrements, les clients ou les transactions anormaux dans vos données. Ce modèle utilise l'algorithme d'apprentissage non supervisé 1-Class Support Vector Machine. Le modèle de bloc-notes crée un modèle Support Vector Machine (SVM) de 1 classe.
  • OML4Py Règles d'association : utilisez ce bloc-notes pour analyser vos données dans le panier d'achat ou pour détecter les éléments, défaillances ou événements qui se produisent simultanément dans vos données. Ce modèle utilise le modèle de règles d'association apriori à l'aide des données de schéma SH (SH.SALES).
  • OML4Py Importance de l'attribut : utilisez ce bloc-notes pour identifier les attributs clés ayant une influence maximale sur l'attribut cible. L'attribut cible dans les données de construction d'un modèle supervisé est l'attribut à prévoir. Le modèle crée un modèle d'importance d'attribut à l'aide des données de schéma SH.
  • OML4Py Classification : utilisez ce bloc-notes pour prévoir le comportement des clients et des prévisions similaires. Le modèle crée et applique l'algorithme de classification Arborescence de décision pour créer un modèle de classification basé sur les relations entre les valeurs de prédicteur et les valeurs cible. Le modèle utilise les données de schéma SH.
  • OML4Py Clusterisation : utilisez ce bloc-notes pour identifier les clusters naturels dans vos données. Le modèle de bloc-notes utilise l'algorithme k- de formation non supervisée sur les données de schéma SH .
  • OML4Py Transformation des données : utilisez ce bloc-notes pour convertir des variables catégoriques en variables numériques à l'aide de OML4Py. Ce modèle montre comment convertir une variable catégorique avec chaque niveau/valeur distinct codé en type de données entier.
  • OML4Py Création d'ensemble de données : utilisez ce bloc-notes pour créer un ensemble de données à partir du package sklearn vers le cadre de données OML à l'aide de OML4Py.
  • OML4Py Agrégation d'ingénierie des fonctionnalités : utilisez ce modèle de bloc-notes pour renseigner les valeurs manquantes à l'aide de OML4Py. Ce bloc-notes utilise la table SALES du schéma SH, qui contient les enregistrements de transaction pour chaque client et produit achetés. Les fonctions sont créées en regroupant le montant vendu pour chaque paire client/produit.
  • OML4Py Sélection de fonctionnalités basée sur un algorithme supervisé : utilisez ce bloc-notes pour effectuer la sélection de fonctionnalités à l'aide d'algorithmes supervisés dans la base de données à l'aide de OML4Py.
  • OML4Py Statistiques récapitulatives de sélection de fonctionnalités : utilisez ce modèle de bloc-notes pour effectuer la sélection de fonctionnalités à l'aide des statistiques récapitulatives à l'aide de OML4Py. Le bloc-notes montre comment utiliser OML4Py pour sélectionner des fonctionnalités en fonction du nombre de valeurs distinctes, des valeurs NULL et de la proportion de valeurs constantes. L'ensemble de données utilisé ici CUSTOMER_INSURANCE_LTV_PY contient des valeurs NULL générées artificiellement par le bloc-notes de bruit OML4SQL. Vous devez d'abord exécuter le bloc-notes de bruit OML4SQL avant d'exécuter le bloc-notes Statistiques récapitulatives de sélection de fonctionnalités OML4Py.
  • OML4Py Modèle partitionné : utilisez ce bloc-notes pour créer des modèles partitionnés. Ce bloc-notes construit un modèle SVM pour prédire le nombre d'années pendant lesquelles un client réside à sa résidence mais est divisé en fonction du sexe du client. Il utilise le modèle pour prédire la cible, puis prédit la cible avec des détails de prédiction.

    Oracle Machine Learning permet de créer automatiquement un modèle d'ensemble composé de plusieurs sous-modèles, un pour chaque partition de données. Les sous-modèles existent et sont utilisés comme un seul modèle, ce qui simplifie l'évaluation à l'aide du modèle de niveau supérieur uniquement. Le sous-modèle approprié est choisi par le système en fonction des valeurs de partition dans la ligne de données à noter. Les modèles partitionnés obtiennent potentiellement une meilleure précision grâce à plusieurs modèles ciblés.

  • API REST OMP4Py : utilisez ce bloc-notes pour appeler l'exécution Python imbriquée. OML4Py contient une API REST permettant d'exécuter des fonctions Python définies par l'utilisateur enregistrées dans le référentiel de scripts. L'API REST est utilisée lorsque la séparation entre le client et le serveur de base de données est bénéfique. Utiliser l'API REST OML4Py pour créer, entraîner, déployer et gérer des scripts.

    Remarques :

    Pour exécuter un script, il doit résider dans le référentiel de scripts OML4Py. Un nom utilisateur et un mot de passe de compte de service cloud Oracle Machine Learning doivent être fournis pour l'authentification.
  • OML4Py Modélisation de régression pour prédire des valeurs numériques : Utilisez ce bloc-notes pour prédire des valeurs numériques à l'aide de plusieurs régressions.
  • OML4Py Fonctions statistiques : utilisez ce bloc-notes pour utiliser différentes fonctions statistiques. Les fonctions statistiques utilisent les données du schéma SH via la couche de transparence OML4Py.
  • OML4Py Exploration de texte : utilisez ce bloc-notes pour créer des modèles à l'aide de la fonctionnalité d'exploration de texte dans Oracle Machine Learning.

    Dans cet ordinateur portable, un modèle SVM est conçu pour prédire les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Les données sont fournies avec une colonne de texte contenant des commentaires générés par l'utilisateur. Avec quelques spécifications supplémentaires, l'algorithme utilise automatiquement la colonne de texte et construit le modèle sur les données structurées et le texte non structuré.

Modèles d'exemple Oracle Machine Learning for SQL

Vous pouvez créer vos blocs-notes Oracle Machine Learning à partir de l'un des exemples de modèle Oracle Machine Learning for SQL suivants :

Figure 10-4 Exemples de modèles Oracle Machine Learning for SQL

OML4SQL Exemples de modèle
  • OML4SQL Détection d'anomalies : utilisez ce bloc-notes pour détecter les occurrences inhabituelles ou rares. Oracle Machine Learning prend en charge la détection d'anomalies pour identifier les enregistrements rares ou inhabituels (clients, transactions, etc.) dans les données à l'aide de l'algorithme d'apprentissage semi-supervisé One-Class Support Vector Machine. Ce bloc-notes crée un modèle 1Class-SVM, puis l'utilise pour signaler les dossiers inhabituels ou suspects. L'ensemble de la méthodologie de machine learning s'exécute dans Oracle Autonomous Database.
  • OML4SQL Règles d'association : utilisez ce bloc-notes pour appliquer la technique d'apprentissage automatique des règles d'association, également appelée analyse de panier d'achat, pour repérer les éléments cooccurrents, les états qui entraînent des échecs ou les événements non évidents. Ce bloc-notes construit des modèles de règles d'association à l'aide de l'algorithme A Priori avec les données SH.SALES du schéma SH. Tous les calculs ont lieu dans Oracle Autonomous Database.
  • OML4SQL Importance d'attribut - Identifier les facteurs clés : utilisez ce bloc-notes pour identifier les facteurs clés, également appelés attributs, prédicteurs et variables, qui ont le plus d'influence sur un attribut cible. Ce bloc-notes crée un modèle d'importance d'attribut, qui utilise l'algorithme Longueur minimale de la description, à l'aide des données de schéma SH. Toutes les fonctionnalités sont exécutées dans Oracle Autonomous Database.
  • OML4SQL Classification - Prévoir les clients cibles : Utilisez ce bloc-notes pour prévoir les clients qui sont les plus susceptibles de répondre positivement à un programme de fidélité Affinity Card. Ce bloc-notes crée et applique des modèles d'arborescence de décision de classification à l'aide des données de schéma SH. Tous les traitements ont lieu dans Oracle Autonomous Database.
  • OML4SQL Clusterisation - Identification des segments client : utilisez ce bloc-notes pour identifier les clusters naturels de clients. Oracle Machine Learning prend en charge le clustering à l'aide de plusieurs algorithmes, notamment k-Means, O-Cluster et Expectation Maximization. Ce bloc-notes utilise l'ensemble de données CUSTOMERS du schéma SH à l'aide de l'algorithme k-Means d'apprentissage non supervisé. L'exploration, la préparation et le machine learning des données s'exécutent dans Oracle Autonomous Database.
  • OML4SQL Nettoyage des données - Suppression des doublons : utilisez ce bloc-notes pour enlever les enregistrements en double à l'aide d'Oracle SQL. Le bloc-notes utilise le jeu de données sur la valeur vie de l'assurance client qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance. L'ensemble de données CUSTOMER_INSURANCE_LTV_SQL contient des valeurs en double générées par le bloc-notes de bruit OML4SQL.

    Remarques :

    Vous devez d'abord exécuter le bloc-notes de bruit OML4SQL avant d'exécuter le bloc-notes de nettoyage des données OML4SQL.
  • OML4SQL Nettoyage des données - Données manquantes : utilisez ce modèle pour remplacer les valeurs manquantes à l'aide d'Oracle SQL et du package DBMS_DATA_MINING_TRANSFORM. Des valeurs sont manquantes dans l'ensemble de données CUSTOMER_INSURANCE_LTV_SQL généré artificiellement par le bloc-notes de bruit OML4SQL. Vous devez d'abord exécuter le bloc-notes de bruit OML4SQL avant d'exécuter le bloc-notes de nettoyage des données OML4SQL.

    Remarques :

    Lors de la création ou de l'application d'un modèle à l'aide d'algorithmes Oracle Machine Learning dans la base de données, cette opération peut ne pas être nécessaire séparément si la préparation automatique des données est activée. La préparation automatique des données remplace automatiquement les valeurs manquantes des attributs numériques par les valeurs moyennes et manquantes des attributs de catégorie par le mode.
  • OML4SQL Suppression des valeurs aberrantes de nettoyage des données : utilisez ce bloc-notes pour enlever les valeurs aberrantes à l'aide d'Oracle SQL et du package DBMS_DATA_MINING_TRANSFORM. Le bloc-notes utilise le jeu de données sur la valeur vie de l'assurance client, qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance. Dans l'ensemble de données CUSTOMER_INSURANCE_LTV, il se concentre sur les valeurs numériques et supprime les enregistrements dont les valeurs figurent dans les 5 % supérieur et inférieur.
  • OML4SQL Data Cleaning Recode Synonymous Values : utilisez ce bloc-notes pour recoder la valeur synonyme d'une colonne à l'aide d'Oracle SQL. Le bloc-notes utilise le jeu de données sur la valeur vie de l'assurance client, qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance. Le jeu de données CUSTOMER_INSURANCE_LTV_SQL contient des valeurs recodées générées par le bloc-notes de bruit OML4SQL. Vous devez d'abord exécuter le bloc-notes de bruit OML4SQL avant d'exécuter le bloc-notes Nettoyage des données - Recoder les valeurs synonymes OML4SQL.
  • OML4SQL Catégorisation des données par transformation : utilisez ce bloc-notes pour classer les colonnes numériques à l'aide d'Oracle SQL et du package DBMS_DATA_MINING_TRANSFORM. Ce bloc-notes montre comment classer une colonne numérique et visualiser la distribution.
  • OML4SQL Catégories de transformation de données : utilisez ce bloc-notes pour convertir une variable catégorielle en variable numérique à l'aide d'Oracle SQL. Le bloc-notes montre comment convertir une variable catégorique avec chaque niveau/valeur distinct codé en entier, et comment créer une variable d'indicateur basée sur un prédicat simple.
  • OML4SQL Normalisation et évolutivité de la transformation des données : utilisez ce bloc-notes pour normaliser et redimensionner les données à l'aide d'Oracle SQL et du package DBMS_DATA_MINING_TRANSFORM. Le bloc-notes montre comment normaliser les données à l'aide de l'échelle z-score (moyenne et écart-type), de l'échelle min max et de l'échelle log. Lors de la création ou de l'application d'un modèle à l'aide d'algorithmes Oracle Machine Learning dans la base de données, la préparation automatique des données normalise automatiquement les données, selon les besoins, par des algorithmes spécifiques.
  • OML4SQL Réduction de dimensionnalité - Factorisation de matrice non négative : utilisez ce bloc-notes pour effectuer une réduction de dimensionnalité à l'aide de l'algorithme de factorisation de matrice non négative dans la base de données. Ce bloc-notes montre comment convertir un tableau comportant de nombreuses colonnes en un ensemble de fonctionnalités réduit. La factorisation matrice non négative produit des coefficients non négatifs.
  • OML4SQL Réduction de dimensionnalité - Décomposition de valeur singulière : utilisez ce bloc-notes pour effectuer une réduction de dimensionnalité à l'aide de l'algorithme de décomposition de valeur singulière (SVD) dans la base de données.
  • OML4SQL : export de modèles sérialisés : utilisez ce bloc-notes pour exporter des modèles sérialisés vers Oracle Cloud Object Storage. Ce bloc-notes crée des modèles de régression et de classification Oracle Machine Learning et exporte les modèles dans un format sérialisé afin qu'ils puissent être évalués à l'aide de l'API REST des services Oracle Machine Learning (OML). Les services OML fournissent des adresses d'API REST hébergées sur Oracle Autonomous Database. Ces adresses permettent de stocker des modèles Oracle Machine Learning avec ses métadonnées et de créer des adresses d'évaluation pour le modèle. L'API REST pour les services OML prend en charge les modèles Oracle Machine Learning et les modèles au format ONNX, et active la fonctionnalité de texte cognitif.
  • OML4SQL Agrégation et heure d'ingénierie des fonctionnalités : utilisez ce bloc-notes pour générer des fonctionnalités agrégées et extraire des fonctionnalités de date et d'heure à l'aide d'Oracle SQL. Le bloc-notes montre également comment extraire les fonctionnalités de date et d'heure du champ TIME_ID.
  • OML4SQL Basé sur un algorithme de sélection de fonctionnalités : Utilisez ce bloc-notes pour effectuer la sélection de fonctionnalités à l'aide d'algorithmes supervisés dans la base de données. Le bloc-notes construit d'abord un modèle de forêt aléatoire pour prédire si le client achètera une assurance, puis il utilise les valeurs d'importance des fonctionnalités pour la sélection des fonctionnalités. Il crée ensuite un modèle d'arbre de décision pour la même tâche de classification et obtient les noeuds fractionnés. Pour les noeuds de fractionnement les plus pris en charge, les fonctions associées à ces noeuds sont sélectionnées.
  • OML4SQL Importance de l'attribut non supervisé de la sélection de fonctionnalités : Utilisez ce bloc-notes pour effectuer la sélection de fonctionnalités à l'aide de l'algorithme non supervisé dans la base de données Expectation Maximization (EM). Ce bloc-notes illustre l'utilisation de la fonction CREATE_MODEL, qui exploite la table des paramètres contrairement à la fonction CREATE_MODEL2 utilisée dans d'autres blocs-notes.
  • OML4SQL Sélection de fonctionnalités à l'aide de statistiques récapitulatives : utilisez ce bloc-notes pour effectuer la sélection de fonctionnalités à l'aide de statistiques récapitulatives à l'aide d'Oracle SQL. L'ensemble de données CUSTOMER_INSURANCE_LTV_SQL contient des valeurs NULL générées artificiellement par le bloc-notes de bruit OML4SQL. Vous devez d'abord exécuter le bloc-notes de bruit OML4SQL avant d'exécuter la sélection de fonctionnalités OML4SQL à l'aide des statistiques récapitulatives.
  • OML4SQL Bruit : utilisez ce bloc-notes pour remplacer les valeurs normales par des valeurs NULL et pour ajouter des lignes en double. Dans ce bloc-notes, l'ensemble de données utilisé par les blocs-notes de préparation des données est préparé, en particulier ceux destinés au nettoyage des données et à la sélection des fonctionnalités. Il utilise le jeu de données sur la valeur vie de l'assurance client qui contient les informations financières du client, la valeur vie et indique si le client a acheté une assurance.

    Remarques :

    Exécutez le bloc-notes de bruit OML4SQL avant les blocs-notes de préparation des données.
  • OML4SQL Modèle partitionné : utilisez ce bloc-notes pour créer des modèles partitionnés. Les modèles partitionnés obtiennent potentiellement une meilleure précision grâce à plusieurs modèles ciblés. Le bloc-notes construit un modèle SVM pour prédire le nombre d'années pendant lesquelles un client réside à sa résidence mais est divisé en fonction du sexe du client. Le modèle est ensuite utilisé pour prédire d'abord la cible, puis pour prédire la cible avec des détails de prédiction.
  • OML4SQL Exploration de texte : utilisez ce bloc-notes pour créer des modèles à l'aide de la fonctionnalité d'exploration de texte. Oracle Machine Learning gère à la fois les données structurées et les données texte non structurées. En tirant parti d'Oracle Text, les algorithmes dans la base de données d'Oracle Machine Learning extraient automatiquement les fonctionnalités prédictives de la colonne de texte.

    Ce bloc-notes construit un modèle SVM pour prédire les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Les données sont fournies avec une colonne de texte contenant des commentaires générés par l'utilisateur. Avec quelques spécifications supplémentaires, l'algorithme utilise automatiquement la colonne de texte et construit le modèle sur les données structurées et le texte non structuré.

  • OML4SQL Régression : utilisez ce bloc-notes pour prévoir les valeurs numériques. Ce modèle utilise plusieurs algorithmes de régression tels que les modèles linéaires généralisés (GLM).
  • OML4SQL Fonction statistique : utilisez ce bloc-notes pour les fonctions statistiques descriptives et comparatives. Le modèle de bloc-notes utilise les données de schéma SH.
  • OML4SQL Séries temporelles : utilisez ce bloc-notes pour créer des modèles de série temporelle sur vos données de série temporelle à des fins de prévision. Ce bloc-notes est basé sur l'algorithme de lissage exponentiel. L'exemple de prévision des ventes de ce bloc-notes est basé sur les données SH.SALES. Tous les calculs sont effectués dans Oracle Autonomous Database.