10 Utiliser des modèles pour collaborer avec les utilisateurs
À l'aide des modèles de carnets d'Oracle Machine Learning, vous pouvez collaborer avec d'autres utilisateurs en partageant votre travail, en publiant votre travail sous forme de rapports et en créant des carnets à partir de modèles. Vous pouvez stocker vos carnets en tant que modèles, partager des carnets et fournir des exemples de modèles à d'autres utilisateurs.
Note :
Vous pouvez également collaborer avec d'autres utilisateurs d'Oracle Machine Learning Notebooks en fournissant l'accès à votre espace de travail. L'utilisateur authentifié peut ensuite accéder aux projets de votre espace de travail et à vos carnets. Le niveau d'accès dépend du type d'autorisation accordé (gestionnaire, développeur ou visualiseur). Pour plus d'informations sur la collaboration entre les utilisateurs, voir Comment collaborer dans Oracle Machine Learning Notebooks- Utiliser les modèles personnels
Modèles personnels répertorie les modèles de carnet que vous avez créés. - Utiliser les modèles partagés
Dans les modèles partagés, vous pouvez partager les modèles de carnet avec tous les utilisateurs authentifiés à partir des modèles de carnet existants disponibles dans les modèles. - Utiliser les exemples de modèles
La page Exemples de modèles répertorie les modèles de carnet Oracle Machine Learning préalimentés. Vous pouvez voir et utiliser ces modèles pour créer vos carnets.
10.1 Utiliser les modèles personnels
Les modèles personnels répertorient les modèles de carnet que vous avez créés.
-
Voir les modèles sélectionnés en mode lecture seule.
-
Créer de nouveaux carnets à partir des modèles sélectionnés.
-
Modifiez les modèles sélectionnés.
-
Partager les modèles de carnet sélectionnés dans Modèles partagés.
-
Supprimer les modèles de carnet sélectionnés.
- Créer des carnets à partir de modèles
Vous pouvez créer de nouveaux carnets à partir d'un modèle existant et les stocker dans des modèles personnels pour une utilisation ultérieure. - Partager des modèles de carnet
Vous pouvez partager des modèles à partir de Modèles personnels. Vous pouvez également partager des modèles à modifier. - Modifier les paramètres des modèles de carnet
Vous pouvez modifier les paramètres d'un modèle de carnet existant dans Modèles personnels.
Rubrique parent : Utiliser des modèles pour collaborer avec les utilisateurs
10.1.1 Créer des carnets à partir de modèles
Vous pouvez créer de nouveaux carnets à partir d'un modèle existant et les stocker dans des modèles personnels pour une utilisation ultérieure.
Rubrique parent : Utiliser les modèles personnels
10.1.2 Partager les modèles de carnet
Vous pouvez partager des modèles à partir de Modèles personnels.Vous pouvez également partager des modèles à modifier.
Rubrique parent : Utiliser les modèles personnels
10.1.3 Modifier les paramètres des modèles de carnet
Vous pouvez modifier les paramètres d'un modèle de carnet existant dans Modèles personnels.
Rubrique parent : Utiliser les modèles personnels
10.2 Utiliser les modèles partagés
Dans Modèles partagés, vous pouvez partager avec tous les utilisateurs authentifiés les modèles de carnet que vous créez à partir de carnets existants disponibles dans Modèles.
-
Modèle J'aime
-
Créer des carnets à partir de modèles
-
Voir les modèles
-
Nom de modèle
-
Description
-
Nombre de likes
-
Nombre de créations
-
Nombre de vues statiques
-
Créer des modèles en cliquant sur Nouveau carnet
-
Modifier les paramètres du modèle en cliquant sur Modifier les paramètres
-
Supprimer un modèle sélectionné en cliquant sur Supprimer
-
Rechercher des modèles par nom, marqueur, auteur
-
Trier les modèles par nom, date, auteur, aimé, consulté, utilisé
-
Voir les modèles en cliquant sur Afficher les articles aimés seulement ou sur Afficher mes articles seulement
- Créer des carnets à partir de modèles
Vous pouvez créer de nouveaux carnets à partir d'un modèle existant et les stocker dans des modèles personnels pour une utilisation ultérieure. - Modifier les paramètres des modèles de carnet
Vous pouvez modifier les paramètres d'un modèle de carnet existant dans Modèles personnels.
Rubrique parent : Utiliser des modèles pour collaborer avec les utilisateurs
10.2.1 Créer des carnets à partir de modèles
Vous pouvez créer de nouveaux carnets à partir d'un modèle existant et les stocker dans des modèles personnels pour une utilisation ultérieure.
Rubrique parent : Utiliser les modèles partagés
10.2.2 Modifier les paramètres des modèles de carnet
Vous pouvez modifier les paramètres d'un modèle de carnet existant dans Modèles personnels.
Rubrique parent : Utiliser les modèles partagés
10.3 Utilisez les exemples de modèles
La page Exemples de modèles répertorie les modèles de carnet Oracle Machine Learning préalimentés. Vous pouvez voir et utiliser ces modèles pour créer vos carnets.
-
Nom de modèle
-
Description
-
Nombre de likes. Cliquez sur J'aime pour le marquer comme aimé.
-
Nombre de vues statiques
-
Nombre d'utilisation
-
Rechercher des modèles par nom, marqueur, auteur
-
Trier les modèles par nom, date, auteur, aimé, consulté, utilisé
-
Voir les modèles aimés en cliquant sur Afficher les modèles aimés seulement
- Créer un carnet à partir des exemples de modèles
À l'aide des exemples de modèles d'Oracle Machine Learning, vous pouvez créer un carnet à partir des modèles disponibles. - Exemples de modèles
Oracle Machine Learning Notebooks vous fournit des exemples de modèles de carnet basés sur différents algorithmes et langages d'apprentissage automatique tels que Python, R et SQL. Les exemples de modèles sont traités dans Oracle Autonomous Database.
Rubrique parent : Utiliser des modèles pour collaborer avec les utilisateurs
10.3.1 Créez un carnet à partir des exemples de modèles
À l'aide des exemples de modèles d'Oracle Machine Learning, vous pouvez créer un carnet à partir des modèles disponibles.
Rubrique parent : Utiliser les exemples de modèles
10.3.2 Exemples de modèles
Oracle Machine Learning Notebooks vous fournit des exemples de modèles de carnet basés sur différents algorithmes et langages d'apprentissage automatique tels que Python, R et SQL. Les exemples de modèles sont traités dans Oracle Autonomous Database.
- Exportation et importation de modèles avec numéro de série OML : Utilisez ce carnet pour exporter et importer des modèles avec numéro de série natifs à l'aide des procédures
DBMS_DATA_MINING.EXPORT_SERMODEL
etDBMS_DATA_MINING.IMPORT_SERMODEL
. Oracle Machine Learning fournit des API pour simplifier le processus de migration de modèles entre les bases de données et les plateformes. - Modèle OML Wiki ESA : Utilisez ce carnet pour la catégorisation des documents texte en calculant la relation sémantique (comment deux mots ou morceaux de texte sont similaires entre eux) entre les documents et un ensemble de sujets explicitement définis et décrits par les humains. La fonction Oracle Machine Learning for SQL
ESA
, la fonction Oracle Machine Learning for Pythonoml.esa
et la fonction Oracle Machine Learning for Rore.odmESA
extraient des fonctions textuelles à partir d'un corpus de documents et effectuent des comparaisons de similarité de documents. Dans ce carnet, le modèle ESA wiki est importé dans Autonomous Database pour être utilisé avec les exemples de carnet de modèle OML suivants :- OML4SQL Modèle de Wiki ESA d'extraction de fonctionnalités
- OML4Py Modèle de Wiki ESA d'extraction de fonctionnalités
- OML4R Modèle de Wiki ESA d'extraction de fonctionnalités
- Notation de lot de services OML : Utilisez ce carnet pour exécuter des tâches de notation par lots au moyen d'une interface REST au moyen des services OML. OML Services prend en charge la notation par lots pour la régression, la classification, la mise en grappe et l'extraction de fonctions.
- Authentifier l'utilisateur de la base de données et obtenir un jeton
- Créer une tâche de notation par lots
- Voir les détails et la sortie de la tâche de notation par lots
- Mettre à jour, désactiver et supprimer une tâche de notation par lots
- Surveillance des données des services OML : Utilisez ce carnet pour effectuer la surveillance des données. Cette exécution de carnet vous fournit les étapes du flux de travail de surveillance des données au moyen de l'interface REST, notamment :
- Authentifier l'utilisateur de la base de données et obtenir un jeton
- créer une tâche de surveillance de données
- Voir les détails et la sortie de la tâche de surveillance des données
- Mettre à jour, désactiver et supprimer une tâche de surveillance des données
- Surveillance des modèles de services OML : Utilisez ce carnet pour comprendre et effectuer la surveillance des modèles. Cette exécution de carnet vous fournit les étapes de flux de travail de surveillance de modèle au moyen de l'interface REST, notamment :
- Authentifier l'utilisateur de la base de données et obtenir un jeton
- Créer une tâche de surveillance de modèle
- Voir les détails et la sortie de la tâche de surveillance de modèle
- Mettre à jour, désactiver et supprimer une tâche de surveillance de modèle
- Ensembles de tierce partie OML - Création d'environnement : Utilisez ce carnet pour télécharger et activer l'environnement Conda et pour utiliser les bibliothèques de vos sessions de carnet. Oracle Machine Learning Notebooks fournit un interpréteur Conda pour installer des bibliothèques Python et R de tierce partie dans un environnement Conda à utiliser dans les sessions Oracle Machine Learning Notebooks, ainsi que dans les appels d'exécution intégrés Oracle Machine Learning for Python et Oracle Machine Learning for R.
Les bibliothèques de tierce partie installées dans Oracle Machine Learning Notebooks peuvent être utilisées dans :
- Python standard
- Standard - À recevoir
- Oracle Machine Learning for Python embedded Python execution from the Python, SQL and REST APIs
- Exécution R intégrée d'Oracle Machine Learning for R à partir des API R, SQL et REST
Note :
L'environnement Conda est installé et géré par l'utilisateur ADMIN doté du rôleOML_SYS_ADMIN
. L'administrateur peut créer un environnement partagé et y ajouter ou supprimer des ensembles. Les environnements Conda sont stockés dans le seau de stockage d'objets associé à Autonomous Database.Conda est un ensemble à code source libre et un système de gestion de l'environnement qui permet l'utilisation d'environnements virtuels contenant des ensembles R et Python de tierce partie. Avec les environnements Conda, vous pouvez installer et mettre à jour des ensembles et leurs dépendances, et passer d'un environnement à l'autre pour utiliser des ensembles propres à un projet.
Ce modèle d'ensembles de tierce partie OML - Création d'environnement contient un flux de travail type pour la création d'environnements de tierce partie et l'installation d'ensembles dans Oracle Machine Learning Notebooks.
- La section 1 contient des commandes pour créer et tester des environnements Conda.
- La section 2 contient des commandes pour créer un environnement Conda, installer des ensembles et des commandes pour charger l'environnement Conda dans un seau de stockage d'objets associé à Oracle Autonomous Database.
Figure 10-1 Exemples de modèles Conda
- Ensembles de tierce partie OML - Utilisation de l'environnement Python : Utilisez ce modèle de carnet pour comprendre le flux de travail type pour l'utilisation de l'environnement de tierce partie dans Oracle Machine Learning Notebooks à l'aide de Python et d'Oracle Machine Learning for Python. Vous téléchargez et utilisez les bibliothèques des environnements Conda précédemment créées et enregistrées dans un dossier de seau de stockage d'objets associé à Autonomous Database.
Ce carnet contient des commandes pour :
- Répertorier tous les environnements stockés dans le stockage d'objets
- Lister un environnement nommé stocké dans le stockage d'objets
- Télécharger et activer l'environnement
mypyenv
- Répertorier les packages disponibles dans l'environnement Conda
- Importer des bibliothèques Python
- Charger les jeux de données
- Créer des modèles
- Modèles de notation
- Créer des fonctions définies par l'utilisateur Python (CDU)
- Exécuter les fonctions définies par l'utilisateur (CDU) dans Python
- Créer et exécuter des fonctions définies par l'utilisateur dans les API SQL et REST pour l'exécution Python intégrée
- Créer et exécuter des fonctions définies par l'utilisateur Python à l'aide de l'API SQL pour l'exécution Python intégrée - mode asynchrone
- Ensembles de tierce partie OML - Utilisation de l'environnement R : Utilisez ce modèle de carnet pour comprendre le flux de travail type pour l'utilisation de l'environnement de tierce partie dans Oracle Machine Learning for R.
Ce carnet contient des commandes pour :
- Répertorier tous les environnements stockés dans le stockage d'objets
- Lister un environnement nommé stocké dans le stockage d'objets
- Télécharger et activer l'environnement
myrenv
- Afficher la liste des environnements Conda OML4R disponibles
- Importer les bibliothèques R
- Charger et préparer les données
- Créer des modèles
- Modèles de notation
- Créer R fonctions définies par l'utilisateur (CDU)
- Exécuter les fonctions définies par l'utilisateur (CDU) dans R
- Enregistrer les fonctions définies par l'utilisateur (CDU) dans le référentiel de scripts
- Exécuter la fonction R définie par l'utilisateur dans les API SQL et REST pour l'exécution R intégrée
- Ajouter l'utilisateur OML à la liste de contrôle d'accès
- Exécuter les fonctions R définies par l'utilisateur à l'aide de l'API REST pour l'exécution R intégrée en mode synchrone
- OML4R-1 : Introduction : Utilisez ce carnet pour comprendre comment :
- Charger la bibliothèque ORE
- Créer des tables de base de données
- Utiliser la couche de transparence
- Classer les attributs pour la valeur prédictive à l'aide de l'algorithme d'importance des attributs dans la
- Créer des modèles prédictifs, et
- Noter les données à l'aide de ces modèles
Figure 10-2 Exemple de modèles d'Oracle Machine Learning for R
- OML4R-2 : Sélection et manipulation de données : Utilisez ce carnet pour comprendre les fonctions de la couche de transparence impliquant la sélection et la manipulation de données.
- OML4R-3 : Magasin de données et référentiel de scripts : Utilisez ce carnet pour comprendre les fonctions du magasin de données et du référentiel de scripts de OML4R.
- OML4R-4 : Exécution R intégrée : Utilisez ce carnet pour comprendre l'exécution R intégrée à OML4R. Tout d'abord, un modèle linéaire est créé dans R directement, puis une fonction R définie par l'utilisateur est créée pour créer le modèle linéaire, la fonction est ensuite enregistrée dans le référentiel de scripts et les données sont notées en parallèle à l'aide de moteurs R générés dynamiquement par l'environnement Oracle Autonomous Database. Le carnet montre également comment appeler ces scripts à l'aide de l'interface SQL et de l'API REST pour R avec exécution R intégrée.
Note :
Pour utiliser l'API SQL pour l'exécution R intégrée, une fonction R définie par l'utilisateur doit résider dans le référentiel de scripts OML4R, et un compte en nuage Oracle Machine Learning (OML) USERNAME, PASSWORD et une URL doivent être fournis pour obtenir un jeton d'authentification. - OML4R Machine vectorielle de prise en charge de la détection d'anomalies : Utilisez ce carnet pour créer un modèle SVM d'une classe, puis utilisez-le pour marquer des enregistrements inhabituels ou suspects.
- OML4R Règles d'association Apriori : Utilisez ce carnet pour créer des modèles de règles d'association à l'aide de l'algorithme A Priori avec des données du schéma SH (SH.SALES). Tous les calculs sont effectués dans Oracle Autonomous Database.
- OML4R Longueur minimale de description de l'importance de l'attribut (MDL) : Utilisez ce carnet pour calculer l'importance de l'attribut, qui utilise l'algorithme Longueur minimale de description, sur les données du schéma SH. Toutes les fonctionnalités s'exécutent dans Oracle Autonomous Database. Oracle Machine Learning prend en charge l'importance des attributs pour identifier les facteurs clés tels que les attributs, les prédicteurs et les variables qui ont le plus d'influence sur un attribut cible.
- OML4R Modèle linéaire généralisé de classification (GLM) : Utilisez ce carnet pour prédire les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Carte d'affinité. Ce carnet crée et applique un modèle linéaire généralisé de classification à l'aide des données du schéma Historique des ventes (SH). Tous les traitements sont effectués dans Oracle Autonomous Database.
- OML4R Classification Naive Bayes (NB) : Utilisez ce carnet pour prédire les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Carte d'affinité. Ce carnet crée et applique un modèle d'arbre de décision de classification à l'aide des données du schéma Historique des ventes (SH). Tous les traitements sont effectués dans Oracle Autonomous Database.
- OML4R Classification Random Forest (RF) : Utilisez ce carnet pour utiliser l'algorithme Random Forest pour la classification dans OML4R et prédisez les clients les plus susceptibles d'être des répondants positifs à un programme de fidélisation Affinity Card.
- OML4R Modélisation de la classification pour prédire les clients cibles à l'aide d'une machine à vecteurs de soutien : Utilisez ce carnet pour utiliser la modélisation de la classification afin de prédire les clients cibles à l'aide du modèle de machine à vecteurs de soutien.
- OML4R Mise en grappe - Identification des segments de client à l'aide de la mise en grappe d'espérance-maximisation : Utilisez ce carnet pour comprendre comment identifier les grappes naturelles de clients à l'aide du jeu de données CUSTOMERS à partir du schéma SH à l'aide de l'algorithme d'espérance-maximisation (EM) d'apprentissage non supervisé. L'exploration, la préparation et l'apprentissage automatique des données s'exécutent dans Oracle Autonomous Database.
- OML4R Mise en grappe - Identification des segments de client à l'aide de la mise en grappe k moyennes : Utilisez ce carnet pour comprendre comment identifier des grappes naturelles de clients à l'aide du jeu de données
CUSTOMERS
à partir du schéma SH à l'aide de l'algorithme K moyennes (KM) d'apprentissage non supervisé. L'exploration, la préparation et l'apprentissage automatique des données s'exécutent dans Oracle Autonomous Database. - OML4R Mise en grappe - Mise en grappe par partitionnement orthogonal (OC) : Utilisez ce carnet pour comprendre comment identifier les grappes naturelles de clients à l'aide du jeu de données CUSTOMERS à partir du schéma SH à l'aide de l'algorithme k-Means d'apprentissage non supervisé. L'exploration, la préparation et l'apprentissage automatique des données s'exécutent dans Oracle Autonomous Database.
- OML4R Valeur aberrante pour le nettoyage des données : Utilisez ce carnet pour comprendre et exclure les enregistrements comportant des valeurs aberrantes à l'aide de OML4R.
- OML4R Nettoyage de données - Recoder les valeurs synonymes : Utilisez ce carnet pour recoder la valeur synonyme à l'aide de OML4R.
- Création de jeu de données OML4R : Utilisez ce carnet pour charger les jeux de données-échantillons
MTCARS
etIRIS
et les importer dans votre instance Oracle Autonomous Database à l'aide de la fonctionore.create()
.
Note :
L'exemple de carnet de modèle suivant, précédé d'un astérisque (*), utilise le jeu de donnéesCUSTOMER_INSURANCE_LTV
. Ce jeu de données est généré par le carnet OML Run-me-first
. Par conséquent, vous devez exécuter le carnet OML Run-me-first
disponible sous Exemples de modèles.
- * OML4R Nettoyage des données manquantes : Utilisez ce carnet pour effectuer un remplacement de valeur manquant à l'aide de OML4R.
- * OML4R Suppression des doubles pour le nettoyage des données : Utilisez ce carnet pour supprimer les enregistrements en double à l'aide de OML4R.
- * OML4R Discrétisation de la transformation des données : Utilisez ce carnet pour classer les colonnes numériques à l'aide de OML4R.
- * OML4R Enregistrement catégorique de transformation de données : Utilisez ce carnet pour recoder une variable de chaîne catégorique en variable numérique et en recodage chaîne à chaîne à l'aide de OML4R.
- * OML4R Transformation de données : Normalisation et ajustement : Utilisez ce carnet pour normaliser et ajuster les données à l'aide de OML4R.
- * OML4R Transformation de données : Encodage à un point chaud : Utilisez ce carnet pour effectuer un encodage à un point chaud à l'aide de OML4R.
- * OML4R Sélection de fonctions - Algorithme supervisé : Utilisez ce carnet pour effectuer la sélection de fonctions à l'aide d'algorithmes supervisés dans la base de données à l'aide de OML4R. Ce bloc-notes montre comment construire un modèle Forêt aléatoire pour prédire si le client achèterait une assurance ou non, puis utiliser l'importance des fonctions pour effectuer la sélection des fonctions.
- * OML4R Sélection de fonction à l'aide des statistiques sommaires : Utilisez ce carnet pour effectuer une sélection de fonction à l'aide des statistiques sommaires à l'aide de OML4R. Ce carnet montre comment utiliser OML4R pour sélectionner des fonctions en fonction du nombre de valeurs distinctes, des valeurs nulles et de la proportion de valeurs constantes.
- Agrégation d'ingénierie de fonction OML4R : Utilisez ce carnet pour effectuer l'agrégation pour les valeurs minimale, maximale, moyenne et nombre à l'aide de OML4R. Ce modèle utilise la table
SALES
présente dans le schémaSH
et montre comment créer des fonctions en agrégeant le montant vendu pour chaque paire client-produit. - OML4R Modèle de wiki pour l'analyse sémantique explicite d'extraction de fonctions (ESA) : Ce carnet utilise le modèle Wikipédia comme exemple. Utilisez ce carnet pour utiliser la fonction Oracle Machine Learning for R
ore.odmESA
afin d'extraire des fonctions textuelles d'un corpus de documents et d'effectuer des comparaisons de similarité de documents. Tous les traitements sont effectués dans Oracle Autonomous Database.Note :
Le modèle Wikipedia prédéfini doit être installé dans votre instance Autonomous Database pour exécuter ce carnet. - OML4R Types de données Date de transformation des données : Utilisez ce carnet pour effectuer diverses opérations sur les données de date et d'heure à l'aide d'objets mandataires de table de base de données à l'aide d'Oracle Machine Learning for R.
- OML4R Décomposition de la valeur singulière d'extraction de fonctions (SVD) : Utilisez ce carnet pour utiliser le SVD dans la base de données pour l'extraction de fonctions. Ce carnet utilise la fonction
ore.odmSVD
d'Oracle Machine Learning for R pour créer un modèle qui utilise l'algorithme de décomposition de valeur singulière (SVD) pour l'extraction de fonction. - OML4R Machine vectorielle de prise en charge des modèles partitionnés (SVM) : Utilisez ce carnet pour créer un modèle SVM afin de prédire le nombre d'années pendant lesquelles un client réside à sa résidence, mais partitionné en fonction du sexe du client. Le modèle est ensuite utilisé pour prédire la cible, puis pour prédire la cible avec les détails de prédiction.
- OML4R Modèle linéaire généralisé de régression (GLM) : Utilisez ce carnet pour comprendre comment prédire des valeurs numériques à l'aide de plusieurs régressions. Ce carnet utilise l'algorithme de modèle linéaire généralisé.
- OML4R Réseau neuronal de régression (NN) : Utilisez ce carnet pour comprendre comment prédire des valeurs numériques à l'aide de plusieurs régressions. Ce bloc-notes utilise l'algorithme Neural Network.
- OML4R Machine vectorielle de prise en charge de la régression (SVM) : Utilisez ce carnet pour comprendre comment prédire des valeurs numériques à l'aide de plusieurs régressions. Ce carnet utilise l'algorithme Support Vector Machine.
- API REST OML4R : Utilisez ce carnet pour comprendre comment utiliser l'API REST OML4R pour appeler des fonctions R définies par l'utilisateur et pour lister celles disponibles dans le référentiel de scripts R.
Note :
Pour exécuter un script, il doit résider dans le référentiel de scripts R. Un nom d'utilisateur et un mot de passe pour le compte de service en nuage Oracle Machine Learning doivent être fournis pour l'authentification. - OML4R Fonction statistique : Utilisez ce carnet pour comprendre et utiliser diverses fonctions statistiques. Le carnet utilise les données du schéma SH au moyen de la couche de transparence OML4R.
- OML4R Machine vectorielle de prise en charge de l'exploration de texte (SVM) : Utilisez ce carnet pour comprendre comment utiliser des données textuelles non structurées pour créer des modèles d'apprentissage automatique, tirer parti d'Oracle Text, utiliser les fonctionnalités prédictives des algorithmes de base de données d'Oracle Machine Learning et extraire des fonctions des colonnes de texte.
Ce bloc-notes construit un modèle de machine à vecteurs de soutien (SVM) pour prédire les clients qui sont les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Les données proviennent d'une colonne de texte contenant des commentaires générés par l'utilisateur.
Exemples de modèles Oracle Machine Learning for Python
Figure 10-3 Exemples de modèles Oracle Machine Learning for Python
- Mon premier carnet : Utilisez le premier carnet pour les fonctions d'apprentissage automatique de base, la sélection des données et la consultation des données. Ce modèle utilise les données du schéma
SH
. - OML4Py -0- Présentation : Ce carnet est le premier d'une série de 0 à 5 destiné à vous présenter la gamme de fonctionnalités OML4Py à l'aide de courts exemples.
- OML4Py -1- Introduction : Ce carnet fournit un aperçu sur le chargement de la bibliothèque OML, la création de tables de base de données, l'utilisation de la couche de transparence, le classement des attributs pour la valeur prédictive à l'aide de l'algorithme d'importance des attributs dans la base de données, la création de modèles prédictifs et la notation des données à l'aide de ces modèles.
- OML4Py -2- Sélection et manipulation de données : Utilisez ce carnet pour apprendre à utiliser la couche de transparence qui implique la sélection et la manipulation des données.
- OML4Py -3- Magasins de données : Utilisez ce carnet pour apprendre à utiliser des magasins de données, à déplacer des objets entre un magasin de données et une session Python, à gérer les privilèges de magasin de données, à enregistrer des objets de modèle et des objets Python dans un magasin de données, à supprimer des magasins de données, etc.
- OML4Py -4- Exécution Python intégrée : Utilisez ce carnet pour comprendre l'exécution Python intégrée. Dans ce carnet, un modèle linéaire est créé directement dans Python, puis une fonction qui utilise des moteurs Python générés dynamiquement par l'environnement Autonomous Database est créée.
- OML4Py -5- AutoML : Utilisez ce carnet pour comprendre le flux de travail AutoML dans OML4Py. Dans ce carnet, le jeu de données
WINE
de scikit-learn est utilisé. Ici, AutoML est utilisé pour la classification sur la colonnetarget
et pour la régression sur la colonnealcohol
.
Note :
L'exemple de carnet de modèle suivant, précédé d'un astérisque (*), utilise le jeu de donnéesCUSTOMER_INSURANCE_LTV_PY
. Ce jeu de données comporte des valeurs en double générées artificiellement par le carnet OML4SQL Bruit. Par conséquent, vous devez d'abord exécuter le bruit OML4SQL avant d'exécuter le carnet.
- * OML4Py Suppression des doubles pour le nettoyage des données : Utilisez ce carnet pour comprendre comment supprimer les enregistrements en double à l'aide de OML4Py. Ce bloc-notes utilise le jeu de données sur la valeur à vie de l'assurance client qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance.
- * OML4Py Nettoyage des données manquantes : Utilisez ce carnet pour comprendre comment remplir les valeurs manquantes à l'aide de OML4Py. Ce bloc-notes utilise le jeu de données sur la valeur à vie de l'assurance client qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance.
- * OML4Py Valeurs synonymes de nettoyage de données : Utilisez ce carnet pour comprendre comment recoder la valeur synonyme à l'aide de OML4Py. Ce bloc-notes utilise le jeu de données sur la valeur à vie de l'assurance client qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance.
- OML4Py Suppression des valeurs aberrantes pour le nettoyage des données : Utilisez ce carnet pour comprendre comment nettoyer les données afin de supprimer les valeurs aberrantes. Ce bloc-notes utilise le jeu de données
CUSTOMER_INSURANCE_LTV
qui contient les informations financières du client, la valeur à vie et si le client a acheté une assurance ou non. Dans le jeu de donnéesCUSTOMER_INSURANCE_LTV
, l'accent est mis sur les valeurs numériques et la suppression des enregistrements avec des valeurs dans les 5 % supérieur et inférieur. - Discrétisation de la transformation des données à l'adresse OML4Py : Utilisez ce carnet pour comprendre comment discrétiser une colonne numérique et visualiser la distribution.
- OML4Py Transformation de données catégorique - Convertir des variables catégoriques en variables numériques : Utilisez ce carnet pour comprendre comment convertir des variables catégoriques en variables numériques à l'aide de OML4Py. Les carnets montrent comment convertir une variable catégorique avec chaque niveau/valeur distinct codé en un type de données entier.
- Normalisation et mise à l'échelle de la transformation des données OML4Py : Utilisez ce carnet pour comprendre comment normaliser et mettre à l'échelle les données à l'aide de z-score (moyenne et écart-type), de la mise à l'échelle minimale maximale et de la mise à l'échelle des journaux.
Note :
Lors de la création ou de l'application d'un modèle à l'aide d'algorithmes Oracle Machine Learning intégrés à la base de données, la préparation automatique des données normalisera automatiquement les données selon les besoins, par des algorithmes particuliers. - OML4Py Data Transformation One Hot Encoding : Utilisez ce carnet pour comprendre comment effectuer un encodage à chaud à l'aide de OML4Py. Les algorithmes d'apprentissage automatique ne peuvent pas fonctionner directement avec des données catégoriques. Les données catégoriques doivent être converties en nombres. Ce bloc-notes utilise le jeu de données sur la valeur à vie de l'assurance client qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance.
Note :
Si vous envisagez d'utiliser les algorithmes de la base de données, un codage à chaud est automatiquement appliqué pour les algorithmes qui en ont besoin. Les algorithmes in-databae explosent automatiquement les colonnes catégoriques et s'adaptent au modèle sur les données préparées en interne. - OML4Py Détection des anomalies : Utilisez ce carnet pour détecter les enregistrements, les clients ou les transactions anormaux dans vos données. Ce modèle utilise l'algorithme d'apprentissage non supervisé 1-Class Support Vector Machine. Le modèle de carnet crée un modèle de machine à vecteurs de soutien de 1 classe (SVM).
- OML4Py Règles d'association : Utilisez ce carnet pour l'analyse du panier de vos données ou pour détecter les articles, les échecs ou les événements simultanés dans vos données. Ce modèle utilise le modèle apriori Association Rules à l'aide des données de schéma
SH
(SH.SALES
). - Importance de l'attribut OML4Py : Utilisez ce carnet pour identifier les attributs clés qui ont une influence maximale sur l'attribut cible. L'attribut cible dans les données de création d'un modèle supervisé est l'attribut que vous voulez prédire. Le modèle crée un modèle d'importance d'attribut à l'aide des données du schéma
SH
. - OML4Py Classification : Utilisez ce carnet pour prédire le comportement des clients et les prédictions similaires. Le modèle crée et applique l'arbre de décision de l'algorithme de classification pour créer un modèle de classification basé sur les relations entre les valeurs prédictives et les valeurs cibles. Le modèle utilise les données du schéma
SH
. - OML4Py Mise en grappe : Utilisez ce carnet pour identifier les grappes naturelles dans vos données. Le modèle de carnet utilise l'algorithme d'apprentissage non supervisé k-Means sur les données de schéma
SH
. - OML4Py Transformation de données : Utilisez ce carnet pour convertir des variables catégoriques en variables numériques à l'aide de OML4Py. Ce modèle montre comment convertir une variable catégorique avec chaque niveau/valeur distinct codé en un type de données entier.
- Création de jeu de données OML4Py : Utilisez ce carnet pour créer un jeu de données à partir de l'ensemble sklearn vers une trame de données OML à l'aide de OML4Py.
- OML4Py Agrégation de l'ingénierie des fonctions : Utilisez ce modèle de carnet pour remplir les valeurs manquantes à l'aide de OML4Py. Ce carnet utilise la table SALES du schéma
SH
, qui contient des enregistrements de transaction pour chaque client et produit acheté. Les fonctions sont créées en regroupant le montant vendu pour chaque paire client-produit. - OML4Py Sélection de fonctions basée sur un algorithme supervisé : Utilisez ce carnet pour effectuer une sélection de fonctions à l'aide d'algorithmes supervisés dans la base de données à l'aide de OML4Py.
- OML4Py Statistiques sommaires de sélection de fonctions : Utilisez ce modèle de carnet pour effectuer une sélection de fonctions à l'aide des statistiques sommaires à l'aide de OML4Py. Le carnet montre comment utiliser OML4Py pour sélectionner des fonctions en fonction du nombre de valeurs distinctes, des valeurs nulles et de la proportion de valeurs constantes. Le jeu de données utilisé ici
CUSTOMER_INSURANCE_LTV_PY
comporte des valeurs nulles générées artificiellement par le carnet de bruit OML4SQL. Vous devez d'abord exécuter le carnet de notes OML4SQL avant d'exécuter le carnet de statistiques sommaires sur la sélection de fonctions OML4Py. - OML4Py Modèle partitionné : Utilisez ce carnet pour créer des modèles partitionnés. Ce bloc-notes construit un modèle SVM pour prédire le nombre d'années pendant lesquelles un client réside à sa résidence, mais partitionné en fonction du sexe du client. Il utilise le modèle pour prédire la cible, puis la prédire avec les détails de prédiction.
Oracle Machine Learning permet de créer automatiquement un modèle d'ensemble composé de plusieurs sous-modèles, un pour chaque partition de données. Les sous-modèles existent et sont utilisés comme un seul modèle, ce qui simplifie la notation en utilisant uniquement le modèle de niveau supérieur. Le sous-modèle approprié est choisi par le système en fonction des valeurs de partition dans l'enregistrement de données à noter. Les modèles partitionnés obtiennent potentiellement une meilleure précision grâce à plusieurs modèles ciblés.
- API REST OMP4Py : Utilisez ce carnet pour appeler l'exécution Python intégrée. OML4Py contient une API REST pour exécuter des fonctions Python définies par l'utilisateur enregistrées dans le référentiel de scripts. L'API REST est utilisée lorsque la séparation entre le client et le serveur de base de données est bénéfique. Utilisez l'API REST OML4Py pour créer, entraîner, déployer et gérer des scripts.
Note :
Pour exécuter un script, il doit résider dans le référentiel de scripts OML4Py. Un nom d'utilisateur et un mot de passe pour le compte de service en nuage Oracle Machine Learning doivent être fournis pour l'authentification. - OML4Py Modélisation de régression pour prédire les valeurs numériques : Utilisez ce carnet pour prédire les valeurs numériques à l'aide de plusieurs régressions.
- OML4Py Fonctions statistiques : Utilisez ce carnet pour utiliser diverses fonctions statistiques. Les fonctions statistiques utilisent les données du schéma
SH
au moyen de la couche de transparence OML4Py. - OML4Py Exploration de texte : Utilisez ce carnet pour créer des modèles à l'aide de la fonction d'exploration de texte dans Oracle Machine Learning.
Dans cet ordinateur portable, un modèle SVM est conçu pour prédire les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Les données sont fournies avec une colonne de texte contenant des commentaires générés par l'utilisateur. Avec quelques spécifications supplémentaires, l'algorithme utilise automatiquement la colonne de texte et construit le modèle sur les données structurées et le texte non structuré.
Exemples de modèles Oracle Machine Learning for SQL
Figure 10-4 Exemple de modèles pour Oracle Machine Learning for SQL
- OML4SQL Détection des anomalies : Utilisez ce carnet pour détecter les occurrences inhabituelles ou rares. Oracle Machine Learning prend en charge la détection d'anomalies pour identifier les enregistrements rares ou inhabituels (clients, transactions, etc.) dans les données à l'aide de l'algorithme d'apprentissage semi-supervisé Machine vectorielle de soutien de classe unique. Ce bloc-notes crée un modèle 1Class-SVM, puis l'utilise pour marquer les enregistrements inhabituels ou suspects. Toute la méthodologie d'apprentissage automatique s'exécute dans Oracle Autonomous Database.
- OML4SQL Règles d'association : Utilisez ce carnet pour appliquer la technique d'apprentissage automatique Règles d'association, également connue sous le nom d'analyse du panier d'achat (Market Basket Analysis) afin de détecter les éléments récurrents, les états qui entraînent des échecs ou des événements non évidents. Ce carnet crée des modèles de règles d'association à l'aide de l'algorithme A Priori avec les données
SH.SALES
du schémaSH
. Tous les calculs sont effectués dans Oracle Autonomous Database. - OML4SQL Importance de l'attribut - Identifier les facteurs clés : Utilisez ce carnet pour identifier les facteurs clés, également appelés attributs, prédicteurs, variables qui ont le plus d'influence sur un attribut cible. Ce carnet crée un modèle d'importance d'attribut, qui utilise l'algorithme Longueur minimale de la description, à l'aide des données du schéma
SH
. Toutes les fonctionnalités s'exécutent dans Oracle Autonomous Database. - OML4SQL Classification - Prévision des clients cibles : Utilisez ce carnet pour prédire les clients qui sont les plus susceptibles d'être des répondants positifs pour un programme de fidélisation Carte d'affinité. Ce carnet crée et applique des modèles d'arbre de décision de classification à l'aide des données de schéma
SH
. Tous les traitements sont effectués dans Oracle Autonomous Database. - OML4SQL Mise en grappe - Identification des segments de client : Utilisez ce carnet pour identifier les grappes naturelles de clients. Oracle Machine Learning prend en charge la mise en grappe à l'aide de plusieurs algorithmes, dont les k moyennes, la grappe O et l'espérance-maximisation. Ce carnet utilise le jeu de données CUSTOMERS du schéma
SH
à l'aide de l'algorithme k moyennes d'apprentissage non supervisé. L'exploration, la préparation et l'apprentissage automatique des données s'exécutent dans Oracle Autonomous Database. - OML4SQL Nettoyage des données - Suppression des doubles : Utilisez ce carnet pour supprimer les enregistrements en double à l'aide d'Oracle SQL. Le bloc-notes utilise le jeu de données sur la valeur à vie de l'assurance client qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance. Le jeu de données
CUSTOMER_INSURANCE_LTV_SQL
comporte des valeurs en double générées par le carnet OML4SQL Bruit.Note :
Vous devez d'abord exécuter le carnet de bruit OML4SQL avant d'exécuter le carnet de nettoyage de données OML4SQL. - OML4SQL Nettoyage de données - Données manquantes : Utilisez ce modèle pour remplacer les valeurs manquantes à l'aide d'Oracle SQL et de l'ensemble DBMS_DATA_MINING_TRANSFORM. Les valeurs du jeu de données
CUSTOMER_INSURANCE_LTV_SQL
sont manquantes générées artificiellement par le carnet de notes OML4SQL. Vous devez d'abord exécuter le carnet de bruit OML4SQL avant d'exécuter le carnet de nettoyage de données OML4SQL.Note :
Lors de la création ou de l'application d'un modèle à l'aide d'algorithmes Oracle Machine Learning dans la base de données, cette opération peut ne pas être nécessaire séparément si la préparation automatique des données est activée. La préparation automatique des données remplace automatiquement les valeurs manquantes des attributs numériques par les valeurs moyennes et manquantes des attributs catégoriques avec le mode. - Suppression des valeurs aberrantes du nettoyage de données OML4SQL : Utilisez ce carnet pour supprimer les valeurs aberrantes à l'aide d'Oracle SQL et de l'ensemble DBMS_DATA_MINING_TRANSFORM. Le bloc-notes utilise le jeu de données sur la valeur à vie de l'assurance client, qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance. Dans le jeu de données
CUSTOMER_INSURANCE_LTV
, il se concentre sur les valeurs numériques et supprime les enregistrements avec des valeurs dans les 5 % supérieurs et inférieurs. - OML4SQL Valeurs synonymes de nettoyage de données : Utilisez ce carnet pour recoder la valeur synonyme d'une colonne à l'aide d'Oracle SQL. Le bloc-notes utilise le jeu de données sur la valeur à vie de l'assurance client, qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance. Le jeu de données
CUSTOMER_INSURANCE_LTV_SQL
a des valeurs recodées générées par le carnet de notes OML4SQL. Vous devez d'abord exécuter le carnet OML4SQL Bruit avant d'exécuter le carnet OML4SQL Nettoyage de données - Recoder les valeurs synonymes. - Discrétisation de la transformation des données à l'adresse OML4SQL : Utilisez ce carnet pour classer les colonnes numériques à l'aide d'Oracle SQL et de l'ensemble DBMS_DATA_MINING_TRANSFORM. Ce carnet montre comment discrétiser une colonne numérique et visualiser la distribution.
- OML4SQL Transformation de données catégorique : Utilisez ce carnet pour convertir une variable catégorique en variable numérique à l'aide d'Oracle SQL. Le carnet montre comment convertir une variable catégorique avec chaque niveau/valeur distinct codé en un entier, et comment créer une variable indicateur basée sur un prédicat simple.
- Normalisation et mise à l'échelle de la transformation des données OML4SQL : Utilisez ce carnet pour normaliser et ajuster les données à l'aide d'Oracle SQL et de l'ensemble DBMS_DATA_MINING_TRANSFORM. Le carnet montre comment normaliser les données à l'aide de la notation z (moyenne et écart-type), de la mise à l'échelle minimale maximale et de la mise à l'échelle des journaux. Lors de la création ou de l'application d'un modèle à l'aide d'algorithmes Oracle Machine Learning intégrés à la base de données, la préparation automatique des données normalise automatiquement les données, au besoin, par des algorithmes particuliers.
- OML4SQL Dimensionality Reduction - Non-negative Matrix Factorization (Réduction de la dimensionnalité - Facteurisation de matrice non négative) : Utilisez ce carnet pour effectuer une réduction de dimensionnalité à l'aide de l'algorithme de factorisation de matrice non négative dans la base de données. Ce carnet montre comment convertir une table comportant de nombreuses colonnes en un jeu de fonctions réduit. La factorisation matricielle non négative produit des coefficients non négatifs.
- OML4SQL Réduction de la dimensionnalité - Décomposition de la valeur singulière : Utilisez ce carnet pour effectuer une réduction de la dimensionnalité à l'aide de l'algorithme de décomposition de la valeur singulière (SVD) dans la base de données.
- OML4SQL : Exportation de modèles numérotés en série : Utilisez ce carnet pour exporter des modèles numérotés en série vers le service de stockage d'objets Oracle Cloud. Ce carnet crée des modèles de régression et de classification pour Oracle Machine Learning et exporte les modèles dans un format sérialisé afin qu'ils puissent être notés à l'aide de l'API REST des services Oracle Machine Learning (OML). Les services OML fournissent des points d'extrémité d'API REST hébergés sur Oracle Autonomous Database. Ces points d'extrémité permettent le stockage des modèles Oracle Machine Learning avec leurs métadonnées et créent des points d'extrémité de notation pour le modèle. L'API REST pour les services OML prend en charge les modèles Oracle Machine Learning et les modèles de format ONNX, et active la fonctionnalité de texte cognitif.
- OML4SQL Agrégation et durée de l'ingénierie des fonctions : Utilisez ce carnet pour générer des fonctions agrégées et extraire des fonctions de date et d'heure à l'aide d'Oracle SQL. Le carnet montre également comment extraire les fonctions de date et d'heure du champ
TIME_ID
. - OML4SQL Basé sur un algorithme de sélection de fonctions : Utilisez ce carnet pour effectuer une sélection de fonctions à l'aide d'algorithmes supervisés dans la base de données. Le carnet crée d'abord un modèle de forêt aléatoire pour prédire si le client achètera une assurance, puis il utilise les valeurs d'importance de la fonction pour la sélection des fonctions. Il crée ensuite un modèle d'arbre de décision pour la même tâche de classification et obtient des noeuds fractionnés. Pour les noeuds de fractionnement supérieurs les plus pris en charge, les fonctions associées à ces noeuds sont sélectionnées.
- OML4SQL Sélection de fonction - Importance de l'attribut non supervisé : Utilisez ce carnet pour effectuer une sélection de fonction à l'aide de l'algorithme non supervisé dans la base de données - Attente maximisation (EM). Ce carnet illustre l'utilisation de la fonction
CREATE_MODEL
, qui tire parti de la table des paramètres contrairement à la fonctionCREATE_MODEL2
utilisée dans d'autres carnets. - OML4SQL Sélection de fonction à l'aide des statistiques sommaires : Utilisez ce carnet pour effectuer une sélection de fonction à l'aide des statistiques sommaires à l'aide d'Oracle SQL. Le jeu de données
CUSTOMER_INSURANCE_LTV_SQL
contient des valeurs nulles générées artificiellement par le carnet de bruit OML4SQL. Vous devez d'abord exécuter le carnet de notes OML4SQL avant d'exécuter la sélection de fonction OML4SQL à l'aide des statistiques sommaires. - OML4SQL Bruit : Utilisez ce carnet pour remplacer les valeurs normales par des valeurs nulles et pour ajouter des rangées en double. Dans ce carnet, le jeu de données utilisé par les carnets de préparation de données est préparé, en particulier ceux pour le nettoyage des données et la sélection des fonctions. Elle utilise le jeu de données sur la valeur à vie de l'assurance client qui contient les informations financières du client, la valeur à vie et si le client a acheté ou non une assurance.
Note :
Exécutez le carnet de bruit OML4SQL avant les carnets de préparation des données. - OML4SQL Modèle partitionné : Utilisez ce carnet pour créer des modèles partitionnés. Les modèles partitionnés obtiennent potentiellement une meilleure précision grâce à plusieurs modèles ciblés. Le bloc-notes construit un modèle SVM pour prédire le nombre d'années pendant lesquelles un client réside à sa résidence, mais partitionné en fonction du sexe du client. Le modèle est ensuite utilisé pour prédire la cible en premier, puis pour prédire la cible avec les détails de prédiction.
- OML4SQL Exploration de texte : Utilisez ce carnet pour créer des modèles à l'aide de la fonction d'exploration de texte. Oracle Machine Learning gère à la fois les données structurées et les données textuelles non structurées. En tirant parti d'Oracle Text, les algorithmes intégrés à la base de données d'Oracle Machine Learning extraient automatiquement les fonctions prédictives de la colonne de texte.
Cet ordinateur portable construit un modèle SVM pour prédire les clients les plus susceptibles d'être des répondants positifs à un programme de fidélité Affinity Card. Les données sont fournies avec une colonne de texte contenant des commentaires générés par l'utilisateur. Avec quelques spécifications supplémentaires, l'algorithme utilise automatiquement la colonne de texte et construit le modèle sur les données structurées et le texte non structuré.
- OML4SQL Régression : Utilisez ce carnet pour prédire les valeurs numériques. Ce modèle utilise plusieurs algorithmes de régression tels que les modèles linéaires généralisés (GLM).
- OML4SQL Fonction statistique : Utilisez ce carnet pour les fonctions statistiques descriptives et comparatives. Le modèle de carnet utilise les données de schéma
SH
. - OML4SQL Série chronologique : Utilisez ce carnet pour créer des modèles de série chronologique sur vos données de série chronologique à des fins de prévision. Ce carnet est basé sur l'algorithme de lissage exponentiel. L'exemple de prévision des ventes de ce carnet est basé sur les données
SH.SALES
. Tous les calculs sont effectués dans Oracle Autonomous Database.
Rubrique parent : Utiliser les exemples de modèles