Creación y uso de modelos predictivos de Oracle Analytics

En los modelos predictivos de Oracle Analytics se usan varios algoritmos embebidos de Oracle Machine Learning para realizar la minería de sus juegos de datos, realizar la predicción de un valor de destino o identificar clases de registros. Utilice el editor de flujos de datos para crear, entrenar y aplicar modelos predictivos a los datos.

Temas:

¿Qué son los modelos predictivos de Oracle Analytics?

Un modelo predictivo de Oracle Analytics aplica un algoritmo específico a un juego de datos para predecir valores o clases, o para identificar grupos en los datos.

También puede usar los modelos de Machine Learning de Oracle para realizar predicciones de los datos.

Oracle Analytics incluye algoritmos para ayudarle a entrenar modelos predictivos para diferentes fines. Algunos ejemplos de algoritmos son los árboles de clasificación y regresión (CART), la regresión logística y k-means.

Utilice el editor de flujos de datos para entrenar un modelo en un juego de datos de entrenamiento por primera vez. Una vez que se ha entrenado el modelo predictivo, aplíquelo a los juegos de datos que desea predecir.

Puede poner un modelo entrenado a disposición de otros usuarios para que puedan aplicarlo en sus datos para predecir valores. En algunos casos, determinados usuarios entrenan los modelos y otros usuarios aplican los modelos.

Nota:

Si no está seguro de qué debe buscar en los datos, puede empezar usando Explain, que utiliza el Machine Learning para identificar tendencias y patrones. A continuación, puede utilizar el editor de flujos de datos para crear y entrenar modelos predictivos con los que detallar las tendencias y los patrones que ha encontrado Explain.

Utilice el editor de flujos de datos para entrenar un modelo.

Primero, debe crear un flujo de datos y agregar el juego de datos que desea utilizar para entrenar el modelo. Este juego de datos de entrenamiento contiene los datos que desea predecir (por ejemplo, un valor como las ventas o la edad, o una variable como un bucket de riesgos de crédito).
Si es necesario, puede utilizar el editor de flujos de datos para editar el juego de datos mediante la adición de columnas, la selección de columnas, la unión, etc.
Una vez que haya confirmado que estos son los datos en los que desea entrenar el modelo, agregue un paso de entrenamiento al flujo de datos y seleccione un algoritmo de clasificación (binaria o múltiple), regresión o cluster para entrenar un modelo. A continuación, asigne un nombre al modelo resultante, guarde el flujo de datos y ejecútelo para entrenar y crear el modelo.
Examine las propiedades de los objetos de Machine Learning para determinar la calidad del modelo. Si es necesario, puede iterar el proceso de entrenamiento hasta que el modelo alcance el nivel de calidad que desea.

Utilice el modelo terminado para puntuar datos, desconocidos o sin etiqueta, a fin de generar un juego de datos en un flujo de datos o para agregar la visualización de una predicción a un libro de trabajo.

Ejemplo

Suponga que desea crear y entrenar un modelo de clasificación múltiple para predecir qué pacientes tienen un alto riesgo de desarrollar una enfermedad cardiaca.

Proporcione un juego de datos de entrenamiento que contenga atributos de los pacientes individuales como la edad, el género y si han experimentado dolor torácico, y métricas como la presión arterial, los niveles de azúcar en sangre en ayunas, el colesterol y la frecuencia cardíaca máxima. El juego de datos de entrenamiento también contiene una columna denominada "Probabilidad" a la que se asigna uno de los siguientes valores: ausente, menos probable, probable, muy probable o presente.
Seleccione el algoritmo CART (árbol de decisión), que ignora las columnas redundantes que no agregan valor para la predicción, e identifica y utiliza solo las columnas que son útiles para predecir el destino. Al agregar el algoritmo al flujo de datos, seleccione la columna Probabilidad para entrenar el modelo. El algoritmo utiliza el Machine Learning para seleccionar las columnas de parámetro que necesita para realizar y generar las predicciones y los juegos de datos relacionados.
Inspeccione los resultados y ajuste el modelo de entrenamiento; a continuación, aplique el modelo a un juego de datos mayor para predecir qué pacientes tienen una probabilidad alta de tener o desarrollar una enfermedad cardiaca.

¿Cómo puedo seleccionar un algoritmo de modelo predictivo?

Oracle Analytics proporciona algoritmos para todas sus necesidades de modelado de Machine Learning: predicción numérica, clasificador múltiple, clasificador binario y agrupación en clusters.

La funcionalidad de Machine Learning de Oracle ha sido diseñada para los analistas de datos avanzados que tienen una idea de lo que desean buscar en sus datos, están familiarizados con la práctica de análisis predictivos y comprenden las diferencias entre los algoritmos.

Nota:

Si utiliza datos cuyo origen es Oracle Autonomous AI Lakehouse, puede utilizar la capacidad AutoML para entrenar de forma rápida y sencilla su propio modelo predictivo sin necesidad de habilidades en Machine Learning. Consulte Entrenamiento de un modelo predictivo con AutoML en Autonomous Data Warehouse.

Normalmente, los usuarios desean crear varios modelos de predicción, compararlos y seleccionar el que sea más probable que pueda producir resultados que satisfagan sus criterios y requisitos. Estos criterios pueden variar. Por ejemplo, a veces los usuarios seleccionan modelos que tienen una mejor precisión global, a veces seleccionan modelos que tienen el menor número de errores del tipo I (falso positivo) y el tipo II (falso negativo), y a veces seleccionan modelos que devuelven resultados con más rapidez y con un nivel aceptable de precisión aunque los resultados no sean ideales.

Oracle Analytics contiene varios algoritmos de Machine Learning para cada tipo de predicción o clasificación. Con estos algoritmos, los usuarios pueden crear más de un modelo, utilizar diferentes parámetros ajustados o utilizar juegos de datos de entrenamiento de entrada y, posteriormente, seleccionar el mejor modelo. El usuario puede seleccionar el mejor modelo comparando y ponderando los modelos en relación con sus propios criterios. Para determinar el mejor modelo, los usuarios pueden aplicar el modelo y visualizar los resultados de los cálculos para determinar la precisión, o bien abrir y explorar los juegos de datos relacionados con los que Oracle Analytics ha utilizado el modelo para generar la salida.

Consulte la siguiente tabla para obtener más información sobre los algoritmos proporcionados:

Nombre	Tipo	Categoría	Función	Descripción
CART	Clasificación Regresión	Clasificador binario Clasificador múltiple Numérico	-	Utiliza árboles de decisión para predecir tanto valores discretos como continuos. Se utiliza con juegos de datos grandes.
Regresión lineal de red elástica	Regresión	Numérico	ElasticNet	Modelo de regresión avanzado. Proporciona información adicional (regularización), realiza una selección de variables y realiza combinaciones lineales. Penalizaciones de los métodos de regresión Lazo y Resalto. Se utiliza con un gran número de atributos para evitar la colinealidad (por la cual varios atributos están perfectamente correlacionados) y el sobreajuste.
Jerárquico	Agrupación en clusters	Agrupación en clusters	AgglomerativeClustering	Crea una jerarquía de agrupación en clusters de abajo arriba (cada observación es su propio cluster y posteriormente se fusiona) o de arriba abajo (todas las observaciones empiezan como un cluster) y utilizando métricas de distancia. Se utiliza cuando el juego de datos no es grande y no se conoce el número de clusters de antemano.
K-Means	Agrupación en clusters	Agrupación en clusters	k-means	Particiona los registros de forma iterativa en k clusters de modo que cada observación pertenece al cluster con la media más cercana. Se utiliza para la agrupación en clusters de columnas de métrica y con una expectación definida del número de clusters necesarios. Funciona bien con juegos de datos grandes. Los resultados son diferentes con cada ejecución.
Regresión lineal	Regresión	Numérico	Mínimos cuadrados ordinarios Resalto Lazo	Enfoque lineal para una relación de modelado entre la variable de destino y otros atributos del juego de datos. Se utiliza para predecir valores numéricos cuando los atributos no están perfectamente correlacionados.
Regresión logística	Regresión	Clasificador binario	LogisticRegressionCV	Se utiliza para predecir el valor de una variable categóricamente dependiente. La variable dependiente es una variable binaria que contiene datos codificados en 1 o 0.
Naive Bayes	Clasificación	Clasificador binario Clasificador múltiple	GaussianNB	Clasificación probabilística basada en el teorema de Bayes que asume que no hay ninguna dependencia entre las funciones. Se utiliza cuando hay un gran número de dimensiones de entrada.
Red neuronal	Clasificación	Clasificador binario Clasificador múltiple	MLPClassifier	Algoritmo de clasificación iterativo que aprende comparando el resultado de su clasificación con el valor real y lo devuelve a la red para modificar el algoritmo para iteraciones posteriores. Se utiliza para el análisis de texto.
Bosque aleatorio	Clasificación	Clasificador binario Clasificador múltiple Numérico	-	Método de aprendizaje de conjunto que crea varios árboles de decisión y da como resultado el valor que representa de forma colectiva todos los árboles de decisión. Se utiliza para predecir variables numéricas y categóricas.
SVM	Clasificación	Clasificador binario Clasificador múltiple	LinearSVC, SVC	Clasifica registros asignándolos en el espacio y creando hiperplanos que pueden utilizarse para la clasificación. Los nuevos registros (datos de puntuación) se asignan en el espacio y se predice que pertenecen a una categoría en función del lado del hiperplano en el que caen.

Entrenamiento de un modelo predictivo mediante AutoML en Oracle Autonomous AI Lakehouse

Al utilizar datos de Oracle Autonomous AI Lakehouse, puede utilizar su capacidad AutoML para recomendar y entrenar un modelo predictivo. AutoML analiza los datos, calcula el mejor algoritmo que se puede utilizar y registra un modelo de predicción en Oracle Analytics para que pueda realizar predicciones sobre sus datos.

El uso de AutoML significa que Oracle Autonomous AI Lakehouse se encarga de todo el trabajo duro para que usted pueda desplegar un modelo predictivo sin necesidad de habilidades en Machine Learning o en inteligencia artificial. El modelo de predicción generado se guarda en el área Modelos de la página Machine Learning. Para realizar una predicción de los datos basada en el nuevo modelo, cree un flujo de datos y utilice el paso Aplicar modelo.

Antes de empezar:

Cree un juego de datos basado en los datos de Oracle Autonomous AI Lakehouse sobre los que desea realizar predicciones. Por ejemplo, podría tener datos sobre el abandono de empleados, incluido un campo denominado ATTRITION que indique con 'Yes' o 'No' el abandono.
Asegúrese de que el usuario de base de datos especificado en la conexión de Oracle Analytics a Oracle Autonomous AI Lakehouse tiene el rol OML_Developer y de que no es un superusuario 'admin'. De lo contario, fallará el flujo de datos cuando intente guardarlo o ejecutarlo.

En la página de inicio, haga clic en Crear y, a continuación, en Flujo de datos.
En Agregar juego de datos, seleccione el juego de datos según la instancia de Oracle Autonomous AI Lakehouse que contiene los datos que se van a analizar.
Haga clic en Agregar paso y, a continuación, haga clic en AutoML.
Para el Destino, haga clic en Seleccionar una columna y seleccione una columna de datos que contenga el valor que intenta predecir.
Por ejemplo, para predecir el abandono de empleados, podría seleccionar un campo denominado ATTRITION indicando con 'TRUE' o 'FALSE' si los empleado han dejado la organización o no.

.png
Acepte el Tipo de tarea y la Métrica de clasificación del modelo que recomienda Oracle Analytics o seleccione un algoritmo diferente.
Haga clic en Guardar modelo y especifique el nombre del modelo de predicción generado.
Haga clic en Guardar y especifique un nombre para el flujo de datos.
Haga clic en Ejecutar para analizar los datos y generar un modelo predictivo.
En su página de inicio, haga clic en Navegar y, a continuación, en Machine Learning. A continuación, haga clic con el botón derecho en el modelo generado y seleccione Inspeccionar.

Puede buscar el modelo que genera Oracle Analytics en la página Machine Learning del separador Modelos. Inspeccione el modelo para evaluar su calidad. Consulte Evaluación de la calidad de un modelo predictivo. También puede hacer referencia a juegos de datos relacionados que se generan para modelos generados por AutoML. Consulte ¿Qué son los juegos de datos relacionados de un modelo predictivo?.

Creación y entrenamiento de un modelo de predicción

Los analistas de datos avanzados crean y entrenan modelos predictivos que pueden utilizar para desplegar algoritmos de Oracle Machine Learning para realizar una minería de juegos de datos, predecir un valor de destino o identificar clases de registros. Utilice el editor de flujos de datos para crear y entrenar modelos predictivos y aplicarlos a los datos.

Sprint de LiveLabs

La obtención de un modelo preciso es un proceso iterativo en el que el analista de datos avanzado puede probar diferentes modelos, comparar sus resultados y ajustar los parámetros basándose en un enfoque de ensayo y error. El analista de datos puede utilizar el modelo predictivo preciso terminado para predecir tendencias en otros juegos de datos o agregar el modelo a libros de trabajo.

Nota:

Oracle Analytics proporciona algoritmos de predicción numérica, clasificación múltiple, clasificación binaria y agrupación en clusters.

En su página de inicio, haga clic en Crear y, a continuación, seleccione Flujo de datos.
Seleccione el juego de datos que desea utilizar para entrenar el modelo. Haga clic en Agregar.
En el editor de flujos de datos, haga clic en Agregar paso (+).
Después de agregar un juego de datos, puede utilizar todas las columnas del juego de datos para crear el modelo o seleccionar solo las columnas relevantes. La selección de las columnas relevantes requiere una comprensión del juego de datos. Ignore las columnas que sepa que no van a influir en el comportamiento del resultado o que contengan información redundante. Puede seleccionar solo las columnas relevantes agregado el paso Seleccionar columnas. Si no está seguro de cuáles son las columnas relevantes, utilice todas las columnas.
Seleccione uno de los pasos para entrenar modelos, como Entrenar predicción numérica o Entrenar agrupación en clusters.
Seleccione un algoritmo y haga clic en Aceptar.
Si está trabajando con un modelo supervisado, como la predicción o la clasificación, haga clic en Destino y seleccione la columna que intenta predecir. Por ejemplo, si está creando un modelo para predecir los ingresos de una persona, seleccione la columna Ingresos.
Si está trabajando con un modelo no supervisado, como la agrupación en clusters, no es necesaria ninguna columna de destino.
Cambie la configuración por defecto del modelo para ajustar y mejorar la precisión del resultado previsto. El modelo con el que trabaja determina estos valores.
Haga clic en el paso Guardar modelo y proporcione un nombre y una descripción.
Haga clic en Guardar, introduzca un nombre y una descripción del flujo de datos y haga clic en Aceptar para guardar el flujo de datos.
Haga clic en Ejecutar flujo de datos para crear el modelo predictivo basado en el juego de datos de entrada y la configuración del modelo que ha proporcionado.

Pasos de flujo de datos para entrenar modelos de Machine Learning

Oracle Analytics le permite entrenar modelos de Machine Learning mediante pasos en flujos de datos. Cuando haya entrenado un modelo de Machine Learning, podrá aplicarlo a sus datos mediante el paso Aplicar modelo.

Nombre del paso	Descripción
AutoML (requiere Oracle Autonomous AI Lakehouse)	Utilice la capacidad AutoML de Oracle Autonomous AI Lakehouse para recomendar y entrenar un modelo predictivo propio. El paso AutoML analiza los datos, calcula el mejor algoritmo que se puede utilizar y registra un modelo de predicción en Oracle Analytics.
Entrenar clasificador binario	Entrenar un modelo de Machine Learning para clasificar los datos en una de dos categorías predefinidas.
Entrenar agrupación en clusters	Entrenar un modelo de Machine Learning para separar los grupos con rasgos similares y asignarlos a clusters.
Entrenar multiclasificador	Entrenar un modelo de Machine Learning para clasificar los datos en tres o más categorías predefinidas.
Entregar predicción numérica	Entrenar un modelo de Machine Learning para predecir un valor numérico basado en valores de datos conocidos.

Inspección de un modelo predictivo

Una vez que se ha creado el modelo predictivo y se ha ejecutado el flujo de datos, puede revisar la información sobre el modelo para determinar su precisión. Utilice esta información para ajustar los valores del modelo de forma iterativa para mejorar su precisión y predecir mejores resultados.

Temas:

Visualización de los detalles de un modelo predictivo

La información detallada de un modelo predictivo le ayuda a entender el modelo y a determinar si es adecuado para la predicción de los datos. Los detalles del modelo incluyen la clase, el algoritmo, las columnas de entrada y las columnas de salida del modelo.

En la página de inicio, haga clic en Navegador y, a continuación, en Machine Learning.
Haga clic en el icono de menú de un modelo de entrenamiento y seleccione Inspeccionar.
Haga clic en Detalles para ver la información del modelo.

Evaluación de la calidad de un modelo predictivo

Vea la información que le ayuda a conocer la calidad de un modelo predictivo. Por ejemplo, puede revisar las métricas de precisión, la precisión, la recuperación, el valor F1, la tasa de falsos positivos, etc. del modelo.

Oracle Analytics proporciona métricas similares independientemente del algoritmo utilizado para crear el modelo, lo cual hace que la comparación entre diferentes modelos sea sencilla. Durante el proceso de creación del modelo, el juego de datos de entrada de divide en dos partes para entrenar y probar el modelo según el parámetro Entrenar porcentaje de partición. El modelo utiliza la parte de prueba del juego de datos para probar la precisión del modelo que se crea.

Basándose en sus conclusiones en el separador Calidad, es posible que deba ajustar los parámetros de modelo y volver a entrenarlo.

En la página de inicio, haga clic en Navegador y, a continuación, en Machine Learning.
Haga clic en el icono de menú de un modelo de entrenamiento y seleccione Inspeccionar.
Haga clic en el separador Calidad para revisar las métricas de calidad del modelo y evaluar el modelo. Por ejemplo, revise la puntuación de Precisión de modelo.

.png

Consejo: Haga clic en Más para revisar los detalles de las vistas generadas para el modelo.

¿Qué son los juegos de datos relacionados de un modelo predictivo?

Al ejecutar el flujo de datos para crear el modelo de entrenamiento de un modelo predictivo de Oracle Analytics, Oracle Analytics crea un juego de juegos de datos relacionados. Puede abrir y crear proyectos en estos juegos de datos para obtener más información sobre la precisión del modelo.

Sprint de LiveLabs

En función del algoritmo que haya seleccionado para el modelo, los juegos de datos relacionados contienen detalles sobre el modelo como las reglas de predicción, las métricas de precisión, la matriz de confusión y los inductores clave para la predicción. Puede usar esta información para ajustar el modelo y obtener mejores resultados y usar los juegos de datos relacionados para comparar los modelos y decidir qué modelo es el más preciso.

Por ejemplo, puede abrir el juego de datos Inductores para detectar las columnas que tengan una importante influencia positiva o negativa en el modelo. Al examinar esas columnas, descubre que algunas columnas no se consideran variables de modelo porque no son entradas realistas o son demasiados granulares para la previsión. Usted usa el editor de flujo de datos para abrir el modelo y, en función de la información detectada, elimina las columnas irrelevantes o demasiado granulares y vuelve a generar el modelo. Comprueba los separadores Calidad y Resultados y verifica si ha mejorado la precisión del modelo. Siga este proceso hasta que esté satisfecho con la precisión del modelo y esté listo para puntuar un nuevo juego de datos.

Los algoritmos diferentes generan juegos de datos relacionados similares. Los distintos nombres de columnas y parámetros pueden cambiar en el juego de datos en función del tipo de algoritmo, pero la funcionalidad del juego de datos sigue igual. Por ejemplo, los nombres de columnas de un juego de datos de estadísticas puede cambiar de Regresión lineal a Regresión logística, pero el juego de datos de estadísticas contiene métricas de precisión del modelo.

Juegos de datos relacionados para modelos de AutoML

Cuando entrena un modelo predictivo utilizando AutoML, Oracle Analytics crea juegos de datos adicionales que contienen información útil sobre el modelo. El número de juegos de datos creados depende del algoritmo del modelo. Por ejemplo, para los modelos Naive Bayes, Oracle Analytics crea un juego de datos que proporciona información sobre las probabilidades condicionales. Para un árbol de decisión, el juego de datos proporciona información sobre las estadísticas del árbol de decisión. Al inspeccionar un modelo generado por AutoML mediante el algoritmo de modelo lineal generalizado (GLM), aparecen entradas con el prefijo GLM* para los juegos de datos específicos del modelo que contienen información de metadatos sobre el modelo.
A continuación se muestra la descripción de GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png
.png

Juegos de datos relacionados

Nota:

Oracle Analytics agrega el nombre de salida del flujo de datos al tipo de juego de datos relacionado. Por ejemplo, para un modelo CART, si la salida del flujo de datos se denomina cart_model2, el juego de datos se denomina cart_model2_CART.

CART

Oracle Analytics crea una tabla para el juego de datos relacionado CART (Árbol de clasificación y regresión), que contiene columnas que representan las condiciones y los criterios de las condiciones en el árbol de decisión, una predicción para cada grupo y la confianza de predicción. Utilice la visualización del diagrama de árbol para visualizar este árbol de decisión.

El juego de datos CART se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmo
Numérico	CART para predicción numérica
Clasificación binaria	CART
Clasificación múltiple	CART

Informe de clasificación

Oracle Analytics crea una tabla para el juego de datos relacionado Informe de clasificación. Por ejemplo, si la columna de destino puede tener dos valores distintos, Sí o No, este juego de datos muestra métricas de precisión como F1, Precisión, Volver a llamar y Soporte (número de filas del juego de datos de formación con este valor) para cada valor distinto de la columna de destino.

El juego de datos Clasificación se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmos
Clasificación binaria	Naive Bayes Red neuronal Máquina de vector soporte
Clasificación múltiple	Naive Bayes Red neuronal Máquina de vector soporte

Modelo

Algoritmos

Clasificación binaria

Naive Bayes

Red neuronal

Máquina de vector soporte

Clasificación múltiple

Naive Bayes

Red neuronal

Máquina de vector soporte

Matriz de confusión

Oracle Analytics crea una tabla dinámica para el juego de datos relacionado Matriz de confusión, que también se denomina matriz de error. Cada fila representa una instancia de una clase prevista y cada columna representa una instancia en una clase real. En esta tabla se indica el número de falsos positivos, falsos negativos, verdaderos positivos y verdaderos negativos, que se usan para calcular las métricas de Precisión, Volver a llamar y F1.

El juego de datos Matriz de confusión se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmos
Clasificación binaria	Regresión logística CART (Árbol de decisión) Naive Bayes Red neuronal Bosque aleatorio Máquina de vector soporte
Clasificación múltiple	CART (Árbol de decisión) Naive Bayes Red neuronal Bosque aleatorio Máquina de vector soporte

Modelo

Algoritmos

Clasificación binaria

Regresión logística

CART (Árbol de decisión)

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Clasificación múltiple

CART (Árbol de decisión)

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Inductores

Oracle Analytics crea una tabla para el juego de datos relacionado Controladores, que contiene información sobre las columnas que determinan los valores de la columna de destino. Las regresiones lineales se usan para identificar estas columnas. A cada columna se le asignan valores de coeficiente y correlación. El valor de coeficiente describe la ponderación de la columna que se usa para determinar el valor de la columna de destino. El valor de correlación indica la dirección de la relación entre la columna de destino y la columna dependiente. Por ejemplo, si el valor de la columna de destino aumenta o disminuye en función de la columna dependiente.

El juego de datos Controladores se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmos
Numérico	Regresión lineal Regresión lineal de red elástica
Clasificación binaria	Regresión logística Máquina de vector soporte
Clasificación múltiple	Máquina de vector soporte

Modelo

Algoritmos

Numérico

Regresión lineal

Regresión lineal de red elástica

Clasificación binaria

Regresión logística

Máquina de vector soporte

Clasificación múltiple

Máquina de vector soporte

Hitmap

Oracle Analytics crea una tabla para el juego de datos relacionado Hitmap, que contiene información sobre los nodos hoja del árbol de decisión. Cada fila de la tabla representa un nodo de hoja y contiene información que describe lo que representa un nodo de hoja, como el tamaño del segmento, la confianza y el número de filas esperado. Por ejemplo, número esperado de predicciones correctas = Tamaño de segmento * Confianza.

El juego de datos Hitmap se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmo
Numérico	CART para predicción numérica

Residuales

Oracle Analytics crea una tabla para el juego de datos relacionado Residuales, que contiene información sobre la calidad de las predicciones residuales. Un valor residual es la diferencia entre el valor medido y el valor previsto de un modelo de regresión. Este juego de datos contiene un valor de suma agregado de la diferencia absoluta entre los valores reales y previstos para todas las columnas del juego de datos.

El juego de datos Residuales se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmos
Numéricos	Regresión lineal Regresión lineal de red elástica CART para predicción numérica
Clasificación binaria	CART (Árbol de decisión)
Clasificación múltiple	CART (Árbol de decisión)

Modelo

Algoritmos

Numéricos

Regresión lineal

Regresión lineal de red elástica

CART para predicción numérica

Clasificación binaria

CART (Árbol de decisión)

Clasificación múltiple

CART (Árbol de decisión)

Estadísticas

Oracle Analytics crea una tabla para el juego de datos relacionado Estadísticas. Las métricas de este juego de datos dependen del algoritmo usado para generarlo. Observe esta lista de métricas basada en un algoritmo:

Regresión lineal, CART para predicción numérica, Regresión lineal de red elástica. Estos algoritmos contienen Raíz cuadrada, Raíz cuadrada ajustada, Error de promedio absoluto (MAE), Error de raíz cuadrada media (MSE), Error absoluto relativo (RAE), Error al cuadrado relativo (RSE), Error de raíz cuadrada media (RMSE).
CART (Árboles de regresión y clasificación), Clasificación Naive Bayes, Red neural, Máquina de vector soporte (SVM), Bosque aleatorio, Regresión lineal. Estos algoritmos contienen Precisión, Total, F1.

Este juego de datos se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmo
Numérico	Regresión lineal Regresión lineal de red elástica CART para predicción numérica
Clasificación binaria	Regresión logística CART (Árbol de decisión) Naive Bayes Red neuronal Bosque aleatorio Máquina de vector soporte
Clasificación múltiple	Naive Bayes Red neuronal Bosque aleatorio Máquina de vector soporte

Modelo

Algoritmo

Numérico

Regresión lineal

Regresión lineal de red elástica

CART para predicción numérica

Clasificación binaria

Regresión logística

CART (Árbol de decisión)

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Clasificación múltiple

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Resumen

Oracle Analytics crea una tabla para el juego de datos relacionado Resumen, que contiene información como el nombre del destino y el nombre del modelo.

El juego de datos Resumen se crea al seleccionar estas combinaciones de modelo y algoritmo.

Modelo	Algoritmos
Clasificación binaria	Naive Bayes Red neuronal Máquina de vector soporte
Clasificación múltiple	Naive Bayes Red neuronal Máquina de vector soporte

Modelo

Algoritmos

Clasificación binaria

Naive Bayes

Red neuronal

Máquina de vector soporte

Clasificación múltiple

Naive Bayes

Red neuronal

Máquina de vector soporte

Búsqueda de los juegos de datos relacionados de un modelo predictivo

Los juegos de datos relacionados se generan cuando se entrena un modelo predictivo.

En función del algoritmo, los juegos de datos relacionados contienen detalles sobre el modelo, como: las reglas de predicción, las métricas de precisión, la matriz de confusión, los inductores clave para la predicción, etc. Estos parámetros le ayudan a comprender las reglas que utiliza el modelo para determinar las predicciones y las clasificaciones.

En la página de inicio, haga clic en Navegador y, a continuación, en Machine Learning.
Haga clic en el icono de menú de un modelo de entrenamiento y seleccione Inspeccionar.
Haga clic en el separador Relacionado para acceder a los juegos de datos relacionados del modelo.
Haga doble clic en un juego de datos relacionado para verlo o utilizarlo en un libro de trabajo.

Adición de un modelo predictivo a un libro de trabajo

Cuando se crea un escenario en un libro de trabajo, se debe aplicar un modelo predictivo al juego de datos del libro de trabajo para revelar las tendencias y los patrones para cuya búsqueda se diseñó el modelo.

Nota:

No puede aplicar un modelo de Machine Learning de Oracle a los datos de un libro de trabajo.

Una vez agregado el modelo al flujo de trabajo y asignadas las entradas del modelo a las columnas del juego de datos, el panel Datos contiene los objetos del modelo, que puede arrastrar y soltar en el lienzo. El Machine Learning genera los valores del modelo basándose en las columnas de datos correspondientes de la visualización.

En la página de inicio, haga clic en Crear y, a continuación, en Libro de trabajo.
Seleccione el juego de datos que desea utilizar para crear el libro de trabajo y haga clic en Agregar a libro de trabajo.
En el panel Datos, haga clic en Agregar y seleccione Crear escenario.
En el cuadro de diálogo Crear escenario: Seleccionar modelo, seleccione un modelo y haga clic en Aceptar.
Solo puede aplicar un modelo predictivo. No puede aplicar un modelo de Machine Learning de Oracle.

Si cada entrada de modelo no coincide con un elemento de datos, se mostrará el cuadro de diálogo Asignar datos al modelo.
Si aparece el cuadro de diálogo Asignar datos al modelo, en el campo Juego de datos, seleccione el juego de datos que se va a utilizar con el modelo.
Haga coincidir la entrada del modelo con los elementos de datos según sea necesario. Haga clic en Listo.
El escenario se muestra como un juego de datos en el panel Elementos de datos.
Arrastre y suelte elementos desde el juego de datos y el modelo en el lienzo Visualizar.
Para ajustar el escenario, haga clic con el botón derecho en el panel Elementos de datos y seleccione Editar escenario.
Cambie el juego de datos y actualice la asignación de entrada de modelo y elementos de datos según sea necesario.
Haga clic en Guardar para guardar el libro de trabajo.