10 Uso de plantillas para colaborar con usuarios
Al utilizar las plantillas de blocs de notas de Oracle Machine Learning, puede colaborar con otros usuarios compartiendo su trabajo, publicando su trabajo como informes y creando blocs de notas a partir de plantillas. Puede almacenar sus blocs de notas como plantillas, compartir blocs de notas y proporcionar plantillas de ejemplo a otros usuarios.
Note:
También puede colaborar con otros usuarios de Oracle Machine Learning Notebooks proporcionando acceso al espacio de trabajo. El usuario autenticado puede acceder a los proyectos del espacio de trabajo y a los blocs de notas. El nivel de acceso depende del tipo de permiso otorgado: Manager, Developer o Viewer. Para obtener más información sobre la colaboración entre usuarios, consulte Cómo colaborar en Oracle Machine Learning Notebooks- Uso de plantillas personales
Plantillas personales muestra las plantillas de bloc de notas que ha creado. - Uso de plantillas compartidas
En Plantillas compartidas, puede compartir plantillas de bloc de notas con todos los usuarios autenticados, las plantillas de bloc de notas que cree a partir de blocs de notas existentes disponibles en Plantillas. - Uso de plantillas de ejemplo
La página Plantillas de ejemplo muestra las plantillas de bloc de notas de Oracle Machine Learning rellenadas previamente. Puede ver y utilizar estas plantillas para crear los blocs de notas.
10.1 Uso de Plantillas Personales
Plantillas personales muestra las plantillas de bloc de notas que ha creado.
-
Ver las plantillas seleccionadas en modo de solo lectura.
-
Cree nuevos blocs de notas a partir de plantillas seleccionadas.
-
Editar las plantillas seleccionadas.
-
Comparta las plantillas de bloc de notas seleccionadas en Plantillas compartidas.
-
Permite suprimir las plantillas de bloc de notas seleccionadas.
- Creación de blocs de notas a partir de plantillas
Puede crear nuevos blocs de notas a partir de una plantilla existente y almacenarlos en Plantillas personales para su uso posterior. - Uso compartido de plantillas de bloc de notas
Puede compartir plantillas de Plantillas personales.También puede compartir plantillas para su edición. - Editar configuración de plantillas de bloc de notas
Puede modificar la configuración de una plantilla de bloc de notas existente en Plantillas personales.
Tema principal: Uso de plantillas para colaborar con usuarios
10.1.1 Creación de blocs de notas a partir de plantillas
Puede crear nuevos blocs de notas a partir de una plantilla existente y almacenarlos en Plantillas personales para su uso posterior.
Tema principal: Uso de plantillas personales
10.1.2 Uso compartido de plantillas de bloc de notas
Puede compartir plantillas desde Plantillas personales.También puede compartir plantillas para su edición.
Tema principal: Uso de plantillas personales
10.1.3 Edición de Valores de Plantillas de Bloc de Notas
Puede modificar la configuración de una plantilla de bloc de notas existente en Plantillas personales.
Tema principal: Uso de plantillas personales
10.2 Uso de Plantillas Compartidas
En Plantillas compartidas, puede compartir plantillas de bloc de notas con todos los usuarios autenticados, las plantillas de bloc de notas que cree a partir de blocs de notas existentes disponibles en Plantillas.
-
Plantillas modelo
-
Crear blocs de notas a partir de plantillas
-
Ver Plantillas
-
Nombre de plantilla
-
Descripción
-
Número de Me Gusta
-
Número de creaciones
-
Número de vistas estáticas
-
Crear plantillas haciendo clic en Nuevo bloc de notas
-
Editar Valores de Plantilla haciendo clic en Editar Valores
-
Para suprimir cualquier plantilla seleccionada, haga clic en Suprimir.
-
Buscar plantillas por nombre, etiqueta, autor
-
Ordenar plantillas por Nombre, Fecha, Autor, Me gustó, Visto, Usado
-
Para ver las plantillas, haga clic en Mostrar Sólo Me Gusta o en Mostrar Solo Mis Elementos.
- Creación de blocs de notas a partir de plantillas
Puede crear nuevos blocs de notas a partir de una plantilla existente y almacenarlos en Plantillas personales para su uso posterior. - Editar configuración de plantillas de bloc de notas
Puede modificar la configuración de una plantilla de bloc de notas existente en Plantillas personales.
Tema principal: Uso de plantillas para colaborar con usuarios
10.2.1 Creación de blocs de notas a partir de plantillas
Puede crear nuevos blocs de notas a partir de una plantilla existente y almacenarlos en Plantillas personales para su uso posterior.
Tema principal: Uso de plantillas compartidas
10.2.2 Edición de Valores de Plantillas de Bloc de Notas
Puede modificar la configuración de una plantilla de bloc de notas existente en Plantillas personales.
Tema principal: Uso de plantillas compartidas
10.3 Uso de Plantillas de Ejemplo
La página Plantillas de ejemplo muestra las plantillas de bloc de notas de Oracle Machine Learning rellenadas previamente. Puede ver y utilizar estas plantillas para crear los blocs de notas.
-
Nombre de plantilla
-
Descripción
-
Número de Me Gusta. Haga clic en Me gusta para marcarlo como Me gusta.
-
Número de vistas estáticas
-
Número de usos
-
Buscar plantillas por nombre, etiqueta, autor
-
Ordenar plantillas por Nombre, Fecha, Autor, Me gustó, Visto, Usado
-
Para ver las plantillas que le gustan, haga clic en Mostrar solo con Me gusta
- Creación de un bloc de notas a partir de las plantillas de ejemplo
Mediante las plantillas de ejemplo de Oracle Machine Learning, puede crear un bloc de notas a partir de las plantillas disponibles. - Plantillas de ejemplo
Oracle Machine Learning Notebooks proporcionan plantillas de ejemplo de bloc de notas basadas en diferentes algoritmos y lenguajes de aprendizaje automático, como Python, R y SQL. Las plantillas de ejemplo se procesan en Oracle Autonomous Database.
Tema principal: Uso de plantillas para colaborar con usuarios
10.3.1 Creación de un bloc de notas a partir de las plantillas de ejemplo
Con las plantillas de ejemplo de Oracle Machine Learning, puede crear un bloc de notas a partir de las plantillas disponibles.
Tema principal: Uso de plantillas de ejemplo
10.3.2 Plantillas de ejemplo
Oracle Machine Learning Notebooks proporciona plantillas de ejemplo de bloc de notas basadas en diferentes algoritmos y lenguajes de aprendizaje automático, como Python, R y SQL. Las plantillas de ejemplo se procesan en Oracle Autonomous Database.
- Exportación e importación de modelos serializados de OML: utilice este bloc de notas para exportar e importar modelos serializados nativos mediante los procedimientos
DBMS_DATA_MINING.EXPORT_SERMODEL
yDBMS_DATA_MINING.IMPORT_SERMODEL
. Oracle Machine Learning proporciona API para simplificar el proceso de migración de modelos en bases de datos y plataformas. - Modelo ESA Wiki de OML: utilice este bloc de notas para la categorización de documentos de texto mediante el cálculo de la relación semántica (qué similar es el significado de dos palabras o partes de texto entre sí) entre los documentos y un juego de temas definidos y descritos explícitamente por humanos. La función
ESA
de Oracle Machine Learning for SQL, la funciónoml.esa
de Oracle Machine Learning for Python y la funciónore.odmESA
de Oracle Machine Learning for R extraen funciones basadas en texto de un corpus de documentos y realizan comparaciones de similitud de documentos. En este bloc de notas, el modelo de ESA de wiki se importa a Autonomous Database para su uso con los siguientes ejemplos de bloc de notas de plantilla de OML:- OML4SQL Extracción de características ESA Wiki Modelo
- OML4Py Extracción de características ESA Wiki Modelo
- OML4R Extracción de características ESA Wiki Modelo
- Puntuación por lotes de servicios OML: utilice este bloc de notas para ejecutar trabajos de puntuación por lotes a través de una interfaz REST mediante servicios OML. OML Services soporta la puntuación de lotes para la regresión, clasificación, agrupación en clusters y extracción de funciones.
- Autenticar el usuario de base de datos y obtener un token
- Crear un trabajo de puntuación por lotes
- Ver los detalles y la salida del trabajo de puntuación por lotes
- Actualizar, desactivar y suprimir un trabajo de puntuación por lotes
- Supervisión de datos de servicios de OML: utilice este bloc de notas para realizar la supervisión de datos. Esta ejecución de Notebook le proporciona los pasos del flujo de trabajo de supervisión de datos a través de la interfaz REST que incluye:
- Autenticar el usuario de base de datos y obtener un token
- Crear un trabajo de supervisión de datos
- Ver los detalles y la salida del trabajo de supervisión de datos
- Actualizar, desactivar y suprimir un trabajo de supervisión de datos
- Supervisión del modelo de servicios de OML: utilice este bloc de notas para comprender y realizar la supervisión del modelo. Esta ejecución de bloc de notas le proporciona los pasos del flujo de trabajo de supervisión de modelos a través de la interfaz REST que incluye:
- Autenticar el usuario de base de datos y obtener un token
- Crear un trabajo de supervisión de modelo
- Ver los detalles y la salida del trabajo de supervisión de modelos
- Actualizar, desactivar y suprimir un trabajo de supervisión de modelo
- OML Third-Party Packages - Environment Creation: utilice este bloc de notas para descargar y activar el entorno Conda y para utilizar las bibliotecas de las sesiones de bloc de notas. Oracle Machine Learning Notebooks proporciona un intérprete Conda para instalar bibliotecas Python y R de terceros en un entorno Conda para su uso dentro de las sesiones de Oracle Machine Learning Notebooks, así como dentro de las llamadas de ejecución embebidas de Oracle Machine Learning for Python y Oracle Machine Learning for R.
Las bibliotecas de terceros instaladas en Oracle Machine Learning Notebooks se pueden utilizar en:
- Python estándar
- Estándar R
- Ejecución de Python embebido de Oracle Machine Learning for Python desde las API de Python, SQL y REST
- Ejecución de R embebida de Oracle Machine Learning for R desde las API de R, SQL y REST
Note:
El usuario ADMIN instala y gestiona el entorno Conda con el rolOML_SYS_ADMIN
. El administrador puede crear un entorno compartido y agregar o suprimir paquetes de él. Los entornos Conda se almacenan en el cubo de Object Storage asociado a Autonomous Database.Conda es un sistema de gestión de entornos y paquetes de código abierto que permite el uso de entornos virtuales que contienen paquetes R y Python de terceros. Con los entornos conda, puede instalar y actualizar paquetes y sus dependencias, y cambiar entre entornos para utilizar paquetes específicos del proyecto.
Esta plantilla de bloc de notas Paquetes de terceros de OML - Creación de entorno contiene un flujo de trabajo típico para la creación de entornos de terceros y la instalación de paquetes en Oracle Machine Learning Notebooks.
- La sección 1 contiene comandos para crear y probar entornos Conda.
- La sección 2 contiene comandos para crear un entorno conda, instalar paquetes y comandos para cargar el entorno conda en un cubo de Object Storage asociado a Oracle Autonomous Database.
Figura 10-1 Plantillas de Ejemplo Conda
- Paquetes de terceros de OML - Uso de entorno de Python: utilice este bloc de notas de plantilla para comprender el flujo de trabajo típico para el uso de entornos de terceros en Oracle Machine Learning Notebooks mediante Python y Oracle Machine Learning for Python. Descargue y utilice las bibliotecas de entornos Conda que se hayan creado y guardado previamente en una carpeta de cubo de Object Storage asociada a Autonomous Database.
Este bloc de notas contiene comandos para:
- Mostrar todos los entornos almacenados en Object Storage
- Enumerar un entorno con nombre almacenado en Object Storage
- Descargar y activar el entorno
mypyenv
- Enumerar los paquetes disponibles en el entorno Conda
- Importar bibliotecas Python
- Cargar juegos de datos
- Crear modelos
- Modelos de puntuación
- Crear funciones definidas por el usuario (UDF) de Python
- Ejecutar las funciones definidas por el usuario (UDF) en Python
- Crear y ejecutar funciones definidas por el usuario en las API de SQL y REST para la ejecución de Python embebido
- Crear y ejecutar funciones definidas por el usuario de Python mediante la API de SQL para la ejecución de Python embebido: modo asíncrono
- Paquetes de terceros OML - Uso de entorno R: utilice este bloc de notas de plantilla para comprender el flujo de trabajo típico para el uso de entornos de terceros en Oracle Machine Learning for R.
Este bloc de notas contiene comandos para:
- Mostrar todos los entornos almacenados en Object Storage
- Enumerar un entorno con nombre almacenado en Object Storage
- Descargar y activar el entorno
myrenv
- Mostrar la lista de entornos conda OML4R disponibles
- Importar bibliotecas R
- Cargar y preparar datos
- Crear modelos
- Modelos de puntuación
- Crear funciones definidas por el usuario (UDF) de R
- Ejecutar funciones definidas por el usuario (UDF) en R
- Guardar las funciones definidas por el usuario (UDF) en el repositorio de scripts
- Ejecutar la función definida por el usuario R en las API de SQL y REST para la ejecución de R embebida
- Agregar el usuario de OML a la lista de control de acceso
- Ejecutar las funciones definidas por el usuario de R mediante la API de REST para la ejecución de R embebida en modo síncrono
- OML4R-1: Introducción: utilice este bloc de notas para comprender cómo:
- Carga de la biblioteca de ORE
- Crear tablas de base de datos
- Utilizar la capa de transparencia
- Clasifique los atributos para el valor predictivo mediante el algoritmo de importancia de atributos en la base de datos.
- Cree modelos predictivos y
- Puntuación de datos mediante estos modelos
Figura 10-2 Plantillas de ejemplo de Oracle Machine Learning for R
- OML4R-2: Selección y manipulación de datos: utilice este bloc de notas para comprender las funciones de la capa de transparencia que implican la selección y manipulación de datos.
- OML4R-3: Almacén de datos y repositorio de scripts: utilice este bloc de notas para comprender las funciones de almacén de datos y repositorio de scripts de OML4R.
- OML4R-4: Ejecución de R embebida: utilice este bloc de notas para comprender la ejecución de R embebida OML4R. En primer lugar, se crea un modelo lineal en R directamente, a continuación, se crea una función R definida por el usuario para crear el modelo lineal, la función se guarda en el repositorio de scripts y los datos se puntúan en paralelo mediante motores R generados por el entorno de Oracle Autonomous Database. En el bloc de notas también se muestra cómo llamar a estos scripts mediante la interfaz SQL y la API de REST para R con ejecución de R embebida.
Note:
Para utilizar la API de SQL para la ejecución de R embebida, una función R definida por el usuario debe residir en el repositorio de scripts OML4R y se debe proporcionar una cuenta en la nube de Oracle Machine Learning (OML) USERNAME, PASSWORD y URL para obtener un token de autenticación. - OML4R Máquina vectorial de soporte de detección de anomalías (SVM): utilice este bloc de notas para crear un modelo SVM de una clase y, a continuación, utilícelo para marcar registros inusuales o sospechosos.
- OML4R Reglas de asociación Apriori: utilice este bloc de notas para crear modelos de reglas de asociación con el algoritmo A Priori con datos del esquema SH (SH.SALES). Todos los cálculos se realizan dentro de Oracle Autonomous Database.
- OML4R Longitud mínima de descripción de importancia de atributo (MDL): utilice este bloc de notas para calcular la importancia de atributo, que utiliza el algoritmo Longitud mínima de descripción, en los datos del esquema SH. Todas las funcionalidades se ejecutan dentro de Oracle Autonomous Database. Oracle Machine Learning soporta la importancia de atributo para identificar factores clave como atributos, predictores y variables que tienen mayor influencia en un atributo de destino.
- OML4R Modelo lineal generalizado de clasificación (GLM): utilice este bloc de notas para predecir los clientes que probablemente respondan positivamente a un programa de fidelización de tarjeta afinidad. Este bloc de notas crea y aplica un modelo lineal generalizado de clasificación mediante los datos del esquema Sales History (SH). Todo el procesamiento se produce dentro de Oracle Autonomous Database.
- OML4R Clasificación Naive Bayes (NB): utilice este bloc de notas para predecir los clientes que probablemente respondan positivamente a un programa de fidelización de Affinity Card. Este bloc de notas crea y aplica un modelo de árbol de decisiones de clasificación mediante los datos del esquema Sales History (SH). Todo el procesamiento se produce dentro de Oracle Autonomous Database.
- OML4R Clasificación de bosque aleatorio (RF): utilice este bloc de notas para utilizar el algoritmo Bosque aleatorio para la clasificación en OML4R y predecir los clientes que tienen más probabilidades de ser respondedores positivos a un programa de fidelización de Affinity Card.
- OML4R Modelado de clasificación para predecir clientes objetivo mediante la máquina vectorial de soporte (SVM): utilice este bloc de notas para utilizar el modelado de clasificación para predecir clientes objetivo mediante el modelo de máquina vectorial de soporte.
- OML4R Agrupación en clusters - Identificación de segmentos de clientes mediante agrupación en clusters de maximización de expectativas: utilice este bloc de notas para comprender cómo identificar clusters naturales de clientes mediante el juego de datos CUSTOMERS del esquema SH mediante el algoritmo de maximización de expectativas (EM) de aprendizaje no supervisado. La exploración, preparación y aprendizaje automático de datos se ejecutan dentro de Oracle Autonomous Database.
- Clustering de OML4R: identificación de segmentos de clientes mediante clusters de K-Means: utilice este bloc de notas para comprender cómo identificar clusters naturales de clientes mediante el juego de datos
CUSTOMERS
del esquema SH mediante el algoritmo de K-Means (KM) de aprendizaje no supervisado. La exploración, preparación y aprendizaje automático de datos se ejecutan dentro de Oracle Autonomous Database. - OML4R Clustering - Orthogonal Partitioning Clustering (OC): utilice este bloc de notas para comprender cómo identificar clusters naturales de clientes mediante el juego de datos CUSTOMERS del esquema SH mediante el algoritmo k-Means de aprendizaje no supervisado. La exploración, preparación y aprendizaje automático de datos se ejecuta dentro de Oracle Autonomous Database.
- OML4R Valor atípico de limpieza de datos: utilice esta comprensión de bloc de notas y para excluir registros con valores atípicos mediante OML4R.
- OML4R Limpieza de datos: volver a codificar valores sinónimos: utilice este bloc de notas para volver a codificar el valor sinónimo mediante OML4R.
- OML4R Creación de juego de datos: utilice este bloc de notas para cargar los juegos de datos de ejemplo
MTCARS
yIRIS
e importarlos a la instancia de Oracle Autonomous Database mediante la funciónore.create()
.
Note:
En los siguientes blocs de notas de plantilla de ejemplo con un asterisco (*), utilice el juego de datosCUSTOMER_INSURANCE_LTV
. Este juego de datos lo genera el bloc de notas OML Run-me-first
. Por lo tanto, debe ejecutar el bloc de notas OML Run-me-first
que está disponible en Plantillas de ejemplos.
- * OML4R Limpieza de datos que faltan datos: utilice este bloc de notas para realizar la sustitución de valores que faltan mediante OML4R.
- * OML4R Eliminación de duplicados de limpieza de datos: utilice este bloc de notas para eliminar registros duplicados mediante OML4R.
- * OML4R Asignación numérica de transformación de datos: utilice este bloc de notas para binar columnas numéricas mediante OML4R.
- * OML4R Registro categórico de transformación de datos: utilice este bloc de notas para volver a codificar una variable de cadena categórica en una variable numérica y la codificación de cadena a cadena mediante OML4R.
- * OML4R Transformación de datos: normalización y escalado: utilice este bloc de notas para normalizar y escalar datos mediante OML4R.
- * OML4R Transformación de datos: codificación puntual: utilice este bloc de notas para realizar la codificación puntual mediante OML4R.
- * OML4R Selección de funciones: algoritmo supervisado: utilice este bloc de notas para realizar la selección de funciones mediante algoritmos supervisados en la base de datos mediante OML4R. En este bloc de notas se muestra cómo crear un modelo de bosque aleatorio para predecir si el cliente compraría o no un seguro y, a continuación, utilizar Importancia de función para realizar la selección de funciones.
- * OML4R Selección de funciones mediante estadísticas de resumen: utilice este bloc de notas para realizar la selección de funciones mediante estadísticas de resumen con OML4R. En este bloc de notas se muestra cómo utilizar OML4R para seleccionar funciones basadas en el número de valores distintos, valores nulos y proporción de valores constantes.
- OML4R Agregación de ingeniería de funciones: utilice este bloc de notas para realizar la agregación para mínimo, máximo, medio y recuento mediante OML4R. Esta plantilla utiliza la tabla
SALES
presente en el esquemaSH
y muestra cómo crear funciones agregando la cantidad vendida para cada par de cliente y producto. - OML4R Modelo Wiki de extracción de funciones de análisis semántico explícito (ESA): este bloc de notas utiliza el modelo de Wikipedia como ejemplo. Utilice este bloc de notas para utilizar la función
ore.odmESA
de Oracle Machine Learning for R para extraer funciones basadas en texto de un corpus de documentos y realizar comparaciones de similitud de documentos. Todo el procesamiento se produce dentro de Oracle Autonomous Database.Note:
El modelo de Wikipedia predefinido se debe instalar en la instancia de Autonomous Database para ejecutar este bloc de notas. - OML4R Tipos de datos de fecha de transformación de datos: utilice este bloc de notas para realizar varias operaciones en datos de fecha y hora mediante objetos de proxy de tabla de base de datos mediante Oracle Machine Learning for R.
- OML4R Descomposición de valor singular de extracción de funciones (SVD): utilice este bloc de notas para utilizar el SVD en la base de datos para la extracción de funciones. Este bloc de notas utiliza la función
ore.odmSVD
de Oracle Machine Learning for R para crear un modelo que utilice el algoritmo de descomposición de valor singular (SVD) para la extracción de funciones. - OML4R Máquina vectorial de soporte de modelo particionado (SVM): utilice este bloc de notas para crear un modelo de SVM para predecir el número de años que un cliente reside en su residencia pero dividido en el género del cliente. El modelo se utiliza para predecir el destino y, a continuación, predecir el destino con detalles de predicción.
- OML4R Modelo lineal generalizado de regresión (GLM): utilice este bloc de notas para comprender cómo predecir valores numéricos mediante regresión múltiple. Este bloc de notas utiliza el algoritmo Modelo lineal generalizado.
- OML4R Red neuronal de regresión (NN): utilice este bloc de notas para comprender cómo predecir valores numéricos mediante regresión múltiple. Este bloc de notas utiliza el algoritmo de red neuronal.
- OML4R Máquina vectorial de soporte de regresión (SVM): utilice este bloc de notas para comprender cómo predecir valores numéricos mediante regresión múltiple. Este cuaderno utiliza el algoritmo de la máquina vectorial de soporte.
- OML4R API de REST: utilice este bloc de notas para comprender cómo utilizar la API de REST OML4R para llamar a funciones R definidas por el usuario y para mostrar las disponibles en el repositorio de script R.
Note:
Para ejecutar un script, debe residir en el repositorio de script R. Se debe proporcionar un nombre de usuario y una contraseña de la cuenta de servicio en la nube de Oracle Machine Learning para la autenticación. - OML4R Función estadística: utilice este bloc de notas para comprender y utilizar varias funciones estadísticas. El bloc de notas utiliza datos del esquema SH a través de la capa de transparencia OML4R.
- OML4R Máquina vectorial de soporte de minería de texto (SVM): utilice este bloc de notas para comprender cómo utilizar datos de texto no estructurados para crear modelos de aprendizaje automático, utilizar Oracle Text, utilizar funciones predictivas de algoritmos en la base de datos de Oracle Machine Learning y extraer funciones de columnas de texto.
Este bloc de notas crea un modelo de máquina vectorial de soporte (SVM) para predecir los clientes que tienen más probabilidades de ser respondedores positivos a un programa de fidelización de Affinity Card. Los datos proceden de una columna de texto que contiene comentarios generados por el usuario.
Plantillas de ejemplo de Oracle Machine Learning for Python
Figura 10-3 Plantillas de ejemplo de Oracle Machine Learning for Python
- Mi primer bloc de notas: utilice el bloc de notas Mi primer bloc de notas para funciones básicas de aprendizaje automático, selección de datos y visualización de datos. Esta plantilla utiliza los datos de esquema
SH
. - OML4Py -0- Tour: este bloc de notas es el primero de una serie del 0 al 5 cuyo objetivo es presentarle el rango de funcionalidad OML4Py mediante ejemplos breves.
- OML4Py -1- Introducción: este bloc de notas proporciona una visión general sobre cómo cargar la biblioteca de OML, crear tablas de base de datos, utilizar la capa de transparencia, clasificar los atributos para el valor predictivo mediante el algoritmo de importancia de atributos en la base de datos, crear modelos predictivos y puntuar datos mediante estos modelos.
- OML4Py -2- Selección y manipulación de datos: utilice este bloc de notas para aprender a trabajar con la capa de transparencia que implica la selección y manipulación de datos.
- OML4Py -3- Almacenes de datos: utilice este bloc de notas para aprender a trabajar con almacenes de datos, mover objetos entre almacenes de datos y sesiones de Python, gestionar privilegios de almacén de datos, guardar objetos de modelo y objetos de Python en un almacén de datos, suprimir almacenes de datos, etc.
- OML4Py -4- Ejecución de Python embebida: utilice este bloc de notas para comprender la ejecución de Python embebida. En este bloc de notas, se crea un modelo lineal en Python directamente y, a continuación, se crea una función que utiliza motores de Python generados por el entorno de Autonomous Database.
- OML4Py -5- AutoML: utilice este bloc de notas para comprender el flujo de trabajo AutoML en OML4Py. En este bloc de notas, se utiliza el juego de datos
WINE
de scikit-learn. En este caso, AutoML se utiliza para la clasificación en la columnatarget
y para la regresión en la columnaalcohol
.
Note:
En los siguientes blocs de notas de plantilla de ejemplo con un asterisco (*), utilice el juego de datosCUSTOMER_INSURANCE_LTV_PY
. Este juego de datos tiene valores duplicados generados artificialmente por el bloc de notas OML4SQL Noise. Por lo tanto, debe ejecutar OML4SQL Noise antes de ejecutar el bloc de notas.
- * OML4Py Eliminación de duplicados de limpieza de datos: utilice este bloc de notas para saber cómo eliminar registros duplicados mediante OML4Py. Este bloc de notas utiliza el juego de datos de valor de tiempo de vida del seguro de cliente que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro.
- * OML4Py Limpieza de datos que faltan datos: utilice este bloc de notas para saber cómo rellenar los valores que faltan con OML4Py. Este bloc de notas utiliza el juego de datos de valor de tiempo de vida del seguro de cliente que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro.
- * OML4Py Data Cleaning Recode Synonymous Values: utilice este bloc de notas para saber cómo volver a codificar el valor sinónimo mediante OML4Py. Este bloc de notas utiliza el juego de datos de valor de tiempo de vida del seguro de cliente que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro.
- OML4Py Eliminación de valores atípicos de limpieza de datos: utilice este bloc de notas para comprender cómo limpiar datos para eliminar valores atípicos. Este bloc de notas utiliza el juego de datos
CUSTOMER_INSURANCE_LTV
que contiene la información financiera del cliente, el valor de por vida y si el cliente compró o no un seguro. En el juego de datosCUSTOMER_INSURANCE_LTV
, el foco está en los valores numéricos y la eliminación de registros con valores en el 5% superior e inferior. - OML4Py Asignación numérica de transformación de datos: utilice este bloc de notas para comprender cómo agrupar una columna numérica y visualizar la distribución.
- OML4Py Transformación de datos categórica - Convertir variables categóricas en variables numéricas: utilice este bloc de notas para comprender cómo convertir variables categóricas en variables numéricas mediante OML4Py. Los blocs de notas muestran cómo convertir una variable categórica con cada nivel/valor distinto codificado en un tipo de dato entero.
- OML4Py Normalización y escalado de transformación de datos: utilice este bloc de notas para comprender cómo normalizar y escalar datos mediante z-score (desviación media y estándar), escala mínima máxima y escala de logs.
Note:
Al crear o aplicar un modelo mediante algoritmos de Oracle Machine Learning en la base de datos, la preparación automática de datos normalizará los datos automáticamente según sea necesario mediante algoritmos específicos. - OML4Py Transformación de datos: una codificación en caliente: utilice este bloc de notas para comprender cómo realizar una codificación en caliente con OML4Py. Los algoritmos de aprendizaje automático no pueden trabajar con datos categóricos directamente. Los datos categóricos se deben convertir en números. Este bloc de notas utiliza el juego de datos de valor de tiempo de vida del seguro de cliente que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro.
Note:
Si planea utilizar los algoritmos en la base de datos, se aplica automáticamente una codificación en caliente para los algoritmos que lo requieren. Los algoritmos en las bases de datos explotan automáticamente las columnas categóricas y se ajustan al modelo en los datos preparados internamente. - OML4Py Detección de anomalías: utilice este bloc de notas para detectar registros, clientes o transacciones anómalos en los datos. Esta plantilla utiliza el algoritmo de aprendizaje no supervisado 1-Class Support Vector Machine. La plantilla de bloc de notas crea un modelo de máquina vectorial de soporte de 1 clase (SVM).
- OML4Py Reglas de asociación: utilice este bloc de notas para el análisis de la cesta de la compra de sus datos o para detectar artículos, fallos o eventos coincidentes en los datos. Esta plantilla utiliza el modelo de reglas de asociación apriori con los datos de esquema
SH
(SH.SALES
). - OML4Py Importancia de atributo: utilice este bloc de notas para identificar los atributos clave que tienen la máxima influencia sobre el atributo de destino. El atributo de destino en los datos de creación de un modelo supervisado es el atributo que desea predecir. La plantilla crea un modelo de importancia de atributo con los datos de esquema
SH
. - Clasificación OML4Py: utilice este bloc de notas para predecir el comportamiento del cliente y predicciones similares. La plantilla crea y aplica el árbol de decisión del algoritmo de clasificación para crear un modelo de clasificación basado en las relaciones entre los valores del predictor y los valores de destino. La plantilla utiliza los datos de esquema
SH
. - OML4Py Clusters: utilice este bloc de notas para identificar clusters naturales en los datos. La plantilla de bloc de notas utiliza el algoritmo de medios de aprendizaje k-no supervisado en los datos del esquema
SH
. - OML4Py Transformación de datos: utilice este bloc de notas para convertir variables categóricas en variables numéricas mediante OML4Py. Esta plantilla muestra cómo convertir una variable categórica con cada nivel/valor distinto codificado en un tipo de dato entero.
- OML4Py Creación de juegos de datos: utilice este bloc de notas para crear juegos de datos desde el paquete sklearn al marco de datos OML mediante OML4Py.
- OML4Py Agregación de ingeniería de funciones: utilice esta plantilla de bloc de notas para rellenar los valores que faltan mediante OML4Py. Este bloc de notas utiliza la tabla SALES del esquema
SH
, que contiene registros de transacciones para cada cliente y producto adquirido. Las funciones se crean agregando la cantidad vendida para cada cliente y par de productos. - OML4Py Selección de funciones basada en algoritmos supervisados: utilice este bloc de notas para realizar la selección de funciones mediante algoritmos supervisados en la base de datos mediante OML4Py.
- OML4Py Estadísticas de resumen de selección de funciones: utilice esta plantilla de bloc de notas para realizar la selección de funciones mediante estadísticas de resumen con OML4Py. El bloc de notas muestra cómo utilizar OML4Py para seleccionar funciones basadas en el número de valores distintos, valores nulos y proporción de valores constantes. El juego de datos utilizado aquí
CUSTOMER_INSURANCE_LTV_PY
tiene valores nulos generados artificialmente por el bloc de notas de ruido OML4SQL. Primero debe ejecutar el Notebook OML4SQL Noise antes de ejecutar el Notebook OML4Py Feature Selection Summary Statistics. - OML4Py Modelo particionado: utilice este bloc de notas para crear modelos particionados. Este bloc de notas crea un modelo de SVM para predecir el número de años que un cliente reside en su residencia, pero dividido en el género del cliente. Utiliza el modelo para predecir el destino y, a continuación, predecir el destino con detalles de predicción.
Oracle Machine Learning permite crear automáticamente un modelo de conjunto compuesto por varios submodelos, uno para cada partición de datos. Los submodelos existen y se utilizan como un modelo, lo que da como resultado una puntuación simplificada utilizando solo el modelo de nivel superior. El sistema selecciona el submodelo adecuado en función de los valores de partición de la fila de datos que se van a puntuar. Los modelos particionados logran una precisión potencialmente mejor a través de varios modelos dirigidos.
- OMP4Py API de REST: utilice este bloc de notas para llamar a la ejecución de Python embebido. OML4Py contiene una API de REST para ejecutar funciones de Python definidas por el usuario guardadas en el repositorio de scripts. La API de REST se utiliza cuando la separación entre el cliente y el servidor de base de datos es beneficiosa. Utilice la API de REST OML4Py para crear, entrenar, desplegar y gestionar scripts.
Note:
Para ejecutar un script, debe residir en el repositorio de scripts OML4Py. Se debe proporcionar un nombre de usuario y una contraseña de la cuenta de servicio en la nube de Oracle Machine Learning para la autenticación. - OML4Py Modelado de regresión para predecir valores numéricos: utilice este bloc de notas para predecir valores numéricos mediante regresión múltiple.
- OML4Py Funciones estadísticas: utilice este bloc de notas para utilizar varias funciones estadísticas. Las funciones estadísticas utilizan datos del esquema
SH
a través de la capa de transparencia OML4Py. - OML4Py Minería de texto: utilice este bloc de notas para crear modelos con la capacidad de minería de texto de Oracle Machine Learning.
En este bloc de notas, se crea un modelo de SVM para predecir que los clientes probablemente respondan positivamente a un programa de fidelización de Affinity Card. Los datos incluyen una columna de texto que contiene comentarios generados por el usuario. Con algunas especificaciones adicionales, el algoritmo utiliza automáticamente la columna de texto y crea el modelo tanto en los datos estructurados como en el texto no estructurado.
Plantillas de ejemplo de Oracle Machine Learning for SQL
Figura 10-4 Plantillas de ejemplo de Oracle Machine Learning for SQL
- OML4SQL Detección de anomalías: utilice este bloc de notas para detectar incidencias inusuales o raras. Oracle Machine Learning admite la detección de anomalías para identificar registros raros o inusuales (clientes, transacciones, etc.) en los datos mediante el algoritmo de aprendizaje semi supervisado One-Class Support Vector Machine. Este bloc de notas crea un modelo 1Class-SVM y, a continuación, lo utiliza para marcar registros inusuales o sospechosos. Toda la metodología de aprendizaje automático se ejecuta dentro de Oracle Autonomous Database.
- OML4SQL Reglas de asociación: utilice este bloc de notas para aplicar la técnica de aprendizaje automático de reglas de asociación, también conocida como análisis de cesta de mercado, para detectar elementos coincidentes, estados que provocan fallos o eventos no evidentes. Este bloc de notas crea modelos de reglas de asociación con el algoritmo A Priori con los datos
SH.SALES
del esquemaSH
. Todos los cálculos se realizan dentro de Oracle Autonomous Database. - OML4SQL Importancia de atributo - Identificar factores clave: utilice este bloc de notas para identificar factores clave, también conocidos como atributos, predictores y variables que tienen mayor influencia en un atributo de destino. Este bloc de notas crea un modelo de importancia de atributo, que utiliza el algoritmo Longitud mínima de descripción, con los datos del esquema
SH
. Todas las funcionalidades se ejecutan dentro de Oracle Autonomous Database. - Clasificación OML4SQL: predicción de clientes objetivo: utilice este bloc de notas para predecir los clientes que tienen más probabilidades de ser respondedores positivos a un programa de fidelización de tarjeta afinidad. Este bloc de notas crea y aplica modelos de árbol de decisión de clasificación mediante los datos de esquema
SH
. Todo el procesamiento se produce dentro de Oracle Autonomous Database. - OML4SQL Agrupación en clusters - Identificación de segmentos de clientes: utilice este bloc de notas para identificar clusters naturales de clientes. Oracle Machine Learning soporta la agrupación en clusters mediante varios algoritmos, incluidos k-Means, O-Cluster y maximización de expectativas. Este bloc de notas utiliza el juego de datos CUSTOMERS del esquema
SH
mediante el algoritmo k-Means de aprendizaje no supervisado. La exploración, preparación y aprendizaje automático de datos se ejecuta dentro de Oracle Autonomous Database. - OML4SQL Limpieza de datos - Eliminación de duplicados: utilice este bloc de notas para eliminar registros duplicados mediante Oracle SQL. El bloc de notas utiliza el juego de datos de valor de tiempo de vida del seguro de cliente que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro. El juego de datos
CUSTOMER_INSURANCE_LTV_SQL
tiene valores duplicados generados por el bloc de notas de ruido OML4SQL.Note:
Primero debe ejecutar el bloc de notas de ruido OML4SQL antes de ejecutar el bloc de notas de limpieza de datos OML4SQL. - OML4SQL Limpieza de datos: datos que faltan: utilice esta plantilla para sustituir los valores que faltan mediante Oracle SQL y el paquete DBMS_DATA_MINING_TRANSFORM. En el juego de datos
CUSTOMER_INSURANCE_LTV_SQL
faltan valores generados artificialmente por el bloc de notas de ruido OML4SQL. Primero debe ejecutar el bloc de notas de ruido OML4SQL antes de ejecutar el bloc de notas de limpieza de datos OML4SQL.Note:
Al crear o aplicar un modelo mediante algoritmos de Oracle Machine Learning en la base de datos, esta operación puede no ser necesaria por separado si está activada la preparación automática de datos. La preparación automática de datos sustituye automáticamente los valores que faltan de los atributos numéricos por los valores medios y los que faltan de los atributos categóricos por el modo. - OML4SQL Eliminación de valores atípicos de limpieza de datos: utilice este bloc de notas para eliminar valores atípicos mediante Oracle SQL y el paquete DBMS_DATA_MINING_TRANSFORM. El bloc de notas utiliza el juego de datos de valor de tiempo de vida del seguro de cliente, que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro. En el juego de datos
CUSTOMER_INSURANCE_LTV
, se centra en valores numéricos y elimina registros con valores en el 5% superior e inferior. - OML4SQL Data Cleaning Recode Synonymous Values: utilice este bloc de notas para volver a codificar el valor sinónimo de una columna mediante Oracle SQL. El bloc de notas utiliza el juego de datos de valor de tiempo de vida del seguro de cliente, que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro. El juego de datos
CUSTOMER_INSURANCE_LTV_SQL
ha recodificado los valores generados por el bloc de notas de ruido OML4SQL. Primero debe ejecutar el Notebook OML4SQL Noise antes de ejecutar el Notebook OML4SQL Data Cleaning - Recode Synonymous Values. - OML4SQL Asignación numérica de transformación de datos: utilice este bloc de notas para binar columnas numéricas mediante Oracle SQL y el paquete DBMS_DATA_MINING_TRANSFORM. En este bloc de notas se muestra cómo binar una columna numérica y visualizar la distribución.
- OML4SQL Categórica de transformación de datos: utilice este bloc de notas para convertir una variable categórica en una variable numérica mediante Oracle SQL. El bloc de notas muestra cómo convertir una variable categórica con cada nivel/valor distinto codificado en un entero y cómo crear una variable de indicador basada en un predicado simple.
- OML4SQL Normalización y escala de transformación de datos: utilice este bloc de notas para normalizar y escalar datos mediante Oracle SQL y el paquete DBMS_DATA_MINING_TRANSFORM. El bloc de notas muestra cómo normalizar datos mediante la puntuación z (media y desviación estándar), el escalado mínimo máximo y el escalado de logs. Al crear o aplicar un modelo mediante algoritmos de Oracle Machine Learning en la base de datos, la preparación automática de datos normaliza los datos automáticamente, según sea necesario, mediante algoritmos específicos.
- OML4SQL Reducción de dimensionalidad - Factorización de matriz no negativa: utilice este bloc de notas para realizar la reducción de dimensionalidad mediante el algoritmo de factorización de matriz no negativa en la base de datos. En este bloc de notas se muestra cómo convertir una tabla con muchas columnas en un juego de funciones reducido. La factorización de matriz no negativa produce coeficientes no negativos.
- OML4SQL Reducción de dimensionalidad - Descomposición de valor singular: utilice este bloc de notas para realizar la reducción de dimensionalidad mediante el algoritmo de descomposición de valor singular (SVD) en la base de datos.
- OML4SQL: exportación de modelos serializados: utilice este bloc de notas para exportar modelos serializados a Oracle Cloud Object Storage. Este bloc de notas crea modelos de clasificación y regresión de Oracle Machine Learning y exporta los modelos en formato serializado para que se puedan puntuar mediante la API de REST de servicios de Oracle Machine Learning (OML). Los servicios de OML proporcionan puntos finales de API de REST alojados en Oracle Autonomous Database. Estos puntos finales permiten almacenar modelos de Oracle Machine Learning junto con sus metadatos y crear puntos finales de puntuación para el modelo. La API de REST para servicios OML soporta modelos de Oracle Machine Learning y modelos de formato ONNX, y permite la funcionalidad de texto cognitivo.
- OML4SQL Agregación y hora de ingeniería de funciones: utilice este bloc de notas para generar funciones agregadas y también extraer funciones de fecha y hora mediante Oracle SQL. El bloc de notas también muestra cómo extraer funciones de fecha y hora del campo
TIME_ID
. - OML4SQL Basado en algoritmo de selección de funciones: utilice este bloc de notas para realizar la selección de funciones mediante algoritmos supervisados en la base de datos. El bloc de notas primero crea un modelo forestal aleatorio para predecir si el cliente comprará un seguro y, a continuación, utiliza los valores de Importancia de función para la selección de funciones. A continuación, crea un modelo de árbol de decisiones para la misma tarea de clasificación y obtiene nodos divididos. Para los nodos de división superior con mayor soporte, se seleccionan las funciones asociadas a esos nodos.
- OML4SQL Importancia de atributo no supervisado de selección de funciones: utilice este bloc de notas para realizar la selección de funciones mediante el algoritmo no supervisado de maximización de expectativas (EM) en la base de datos. Este bloc de notas ilustra el uso de la función
CREATE_MODEL
, que aprovecha la tabla de valores en contraste con la funciónCREATE_MODEL2
utilizada en otros blocs de notas. - OML4SQL Selección de funciones mediante estadísticas de resumen: utilice este bloc de notas para realizar la selección de funciones mediante estadísticas de resumen con Oracle SQL. El juego de datos
CUSTOMER_INSURANCE_LTV_SQL
tiene valores nulos generados por OML4SQL Notebook de ruido artificialmente. Primero debe ejecutar el bloc de notas de ruido OML4SQL antes de ejecutar la selección de funciones OML4SQL mediante estadísticas de resumen. - OML4SQL Ruido: utilice este bloc de notas para sustituir los valores normales por valores nulos y para agregar filas duplicadas. En este bloc de notas, se prepara el juego de datos utilizado por los blocs de notas de preparación de datos, en particular para la limpieza de datos y la selección de funciones. Utiliza el juego de datos de valor de tiempo de vida del seguro de cliente que contiene información financiera del cliente, valor de tiempo de vida y si el cliente compró o no un seguro.
Note:
Ejecute el bloc de notas de ruido OML4SQL antes que los blocs de notas de preparación de datos. - OML4SQL Modelo particionado: utilice este bloc de notas para crear modelos particionados. Los modelos particionados logran una precisión potencialmente mejor a través de varios modelos dirigidos. El bloc de notas crea un modelo de SVM para predecir el número de años que un cliente reside en su residencia, pero dividido en el género del cliente. A continuación, el modelo se utiliza para predecir el destino en primer lugar y, a continuación, para predecir el destino con detalles de predicción.
- OML4SQL Minería de texto: utilice este bloc de notas para crear modelos mediante la capacidad de minería de texto. Oracle Machine Learning maneja datos estructurados y datos de texto no estructurados. Al utilizar Oracle Text, los algoritmos de la base de datos de Oracle Machine Learning extraen automáticamente funciones predictivas de la columna de texto.
Este bloc de notas crea un modelo de SVM para predecir que los clientes probablemente respondan positivamente a un programa de fidelización de Affinity Card. Los datos incluyen una columna de texto que contiene comentarios generados por el usuario. Con algunas especificaciones adicionales, el algoritmo utiliza automáticamente la columna de texto y crea el modelo tanto en los datos estructurados como en el texto no estructurado.
- OML4SQL Regresión: utilice este bloc de notas para predecir valores numéricos. Esta plantilla utiliza algoritmos de regresión múltiple, como modelos lineales generalizados (GLM).
- OML4SQL Función estadística: utilice este bloc de notas para las funciones estadísticas descriptivas y comparativas. La plantilla de bloc de notas utiliza datos de esquema
SH
. - OML4SQL Serie temporal: utilice este bloc de notas para crear modelos de serie temporal en los datos de serie temporal para la previsión. Este bloc de notas se basa en el algoritmo de suavizado exponencial. El ejemplo de previsión de ventas de este bloc de notas se basa en los datos de
SH.SALES
. Todos los cálculos se realizan dentro de Oracle Autonomous Database.
Tema principal: Uso de plantillas de ejemplo