Creación y uso de modelos predictivos de Oracle Analytics

En los modelos predictivos de Oracle Analytics se usan varios algoritmos embebidos de Oracle Machine Learning para realizar la minería de sus juegos de datos, realizar la predicción de un valor de destino o identificar clases de registros. Utilice el editor de flujos de datos para crear, entrenar y aplicar modelos predictivos a los datos.

¿Qué son los modelos predictivos de Oracle Analytics?

Un modelo predictivo de Oracle Analytics aplica un algoritmo específico a un juego de datos para predecir valores o clases, o para identificar grupos en los datos.

También puede usar los modelos de aprendizaje automático de Oracle para realizar predicciones de los datos.

Oracle Analytics incluye algoritmos para ayudarle a entrenar modelos predictivos para diferentes fines. Algunos ejemplos de algoritmos son los árboles de clasificación y regresión (CART), la regresión logística y k-means.

Utilice el editor de flujos de datos para entrenar un modelo en un juego de datos de entrenamiento por primera vez. Una vez que se ha entrenado el modelo predictivo, aplíquelo a los juegos de datos que desea predecir.

Puede poner un modelo entrenado a disposición de otros usuarios para que puedan aplicarlo en sus datos para predecir valores. En algunos casos, determinados usuarios entrenan los modelos y otros usuarios aplican los modelos.

Nota:

Si no está seguro de qué debe buscar en los datos, puede empezar usando Explain, que utiliza el aprendizaje automático para identificar tendencias y patrones. A continuación, puede utilizar el editor de flujos de datos para crear y entrenar modelos predictivos con los que detallar las tendencias y los patrones que ha encontrado Explain.
Utilice el editor de flujos de datos para entrenar un modelo.
  • Primero, debe crear un flujo de datos y agregar el juego de datos que desea utilizar para entrenar el modelo. Este juego de datos de entrenamiento contiene los datos que desea predecir (por ejemplo, un valor como las ventas o la edad, o una variable como un cubo de riesgos de crédito).
  • Si es necesario, puede utilizar el editor de flujos de datos para editar el juego de datos mediante la adición de columnas, la selección de columnas, la unión, etc.
  • Una vez que haya confirmado que estos son los datos en los que desea entrenar el modelo, agregue un paso de entrenamiento al flujo de datos y seleccione un algoritmo de clasificación (binaria o múltiple), regresión o cluster para entrenar un modelo. A continuación, asigne un nombre al modelo resultante, guarde el flujo de datos y ejecútelo para entrenar y crear el modelo.
  • Examine las propiedades de los objetos de aprendizaje automático para determinar la calidad del modelo. Si es necesario, puede iterar el proceso de entrenamiento hasta que el modelo alcance el nivel de calidad que desea.

Utilice el modelo terminado para puntuar datos, desconocidos o sin etiqueta, a fin de generar un juego de datos en un flujo de datos o para agregar la visualización de una predicción a un libro de trabajo.

Ejemplo

Suponga que desea crear y entrenar un modelo de clasificación múltiple para predecir qué pacientes tienen un alto riesgo de desarrollar una enfermedad cardiaca.

  1. Proporcione un juego de datos de entrenamiento que contenga atributos de los pacientes individuales como la edad, el género y si han experimentado dolor torácico, y métricas como la presión arterial, los niveles de azúcar en sangre en ayunas, el colesterol y la frecuencia cardíaca máxima. El juego de datos de entrenamiento también contiene una columna denominada "Probabilidad" a la que se asigna uno de los siguientes valores: ausente, menos probable, probable, muy probable o presente.
  2. Seleccione el algoritmo CART (árbol de decisión), que ignora las columnas redundantes que no agregan valor para la predicción, e identifica y utiliza solo las columnas que son útiles para predecir el destino. Al agregar el algoritmo al flujo de datos, seleccione la columna Probabilidad para entrenar el modelo. El algoritmo utiliza el aprendizaje automático para seleccionar las columnas de parámetro que necesita para realizar y generar las predicciones y los juegos de datos relacionados.
  3. Inspeccione los resultados y ajuste el modelo de entrenamiento; a continuación, aplique el modelo a un juego de datos mayor para predecir qué pacientes tienen una probabilidad alta de tener o desarrollar una enfermedad cardiaca.

¿Cómo puedo seleccionar un algoritmo de modelo predictivo?

Oracle Analytics proporciona algoritmos para todas sus necesidades de modelado de aprendizaje automático: predicción numérica, clasificador múltiple, clasificador binario y agrupación en clusters.

La funcionalidad de aprendizaje automático de Oracle ha sido diseñada para los analistas de datos avanzados que tienen una idea de lo que desean buscar en sus datos, están familiarizados con la práctica de análisis predictivos y comprenden las diferencias entre los algoritmos.

Nota:

Si está usando los datos de Oracle Autonomous Data Warehouse, puede usar la función AutoML para entrenar un modelo predictivo de forma rápida y sencilla, sin necesitar conocimientos de aprendizaje automático. Consulte Entrenamiento de un modelo predictivo con AutoML en Autonomous Data Warehouse.

Normalmente, los usuarios desean crear varios modelos de predicción, compararlos y seleccionar el que sea más probable que pueda producir resultados que satisfagan sus criterios y requisitos. Estos criterios pueden variar. Por ejemplo, a veces los usuarios seleccionan modelos que tienen una mejor precisión global, a veces seleccionan modelos que tienen el menor número de errores del tipo I (falso positivo) y el tipo II (falso negativo), y a veces seleccionan modelos que devuelven resultados con más rapidez y con un nivel aceptable de precisión aunque los resultados no sean ideales.

Oracle Analytics contiene varios algoritmos de aprendizaje automático para cada tipo de predicción o clasificación. Con estos algoritmos, los usuarios pueden crear más de un modelo, utilizar diferentes parámetros ajustados o utilizar juegos de datos de entrenamiento de entrada y, posteriormente, seleccionar el mejor modelo. El usuario puede seleccionar el mejor modelo comparando y ponderando los modelos en relación con sus propios criterios. Para determinar el mejor modelo, los usuarios pueden aplicar el modelo y visualizar los resultados de los cálculos para determinar la precisión, o bien abrir y explorar los juegos de datos relacionados con los que Oracle Analytics ha utilizado el modelo para generar la salida.

Consulte la siguiente tabla para obtener más información sobre los algoritmos proporcionados:

Nombre Tipo Categoría Función Descripción
CART

Clasificación

Regresión

Clasificador binario

Clasificador múltiple

Numérico

- Utiliza árboles de decisión para predecir tanto valores discretos como continuos.

Se utiliza con juegos de datos grandes.

Regresión lineal de red elástica Regresión Numérico ElasticNet Modelo de regresión avanzado. Proporciona información adicional (regularización), realiza una selección de variables y realiza combinaciones lineales. Penalizaciones de los métodos de regresión Lazo y Resalto.

Se utiliza con un gran número de atributos para evitar la colinealidad (por la cual varios atributos están perfectamente correlacionados) y el sobreajuste.

Jerárquico Agrupación en clusters Agrupación en clusters AgglomerativeClustering Crea una jerarquía de agrupación en clusters de abajo arriba (cada observación es su propio cluster y posteriormente se fusiona) o de arriba abajo (todas las observaciones empiezan como un cluster) y utilizando métricas de distancia.

Se utiliza cuando el juego de datos no es grande y no se conoce el número de clusters de antemano.

K-Means Agrupación en clusters Agrupación en clusters k-means Particiona los registros de forma iterativa en k clusters de modo que cada observación pertenece al cluster con la media más cercana.

Se utiliza para la agrupación en clusters de columnas de métrica y con una expectación definida del número de clusters necesarios. Funciona bien con juegos de datos grandes. Los resultados son diferentes con cada ejecución.

Regresión lineal Regresión Numérico Mínimos cuadrados ordinarios

Resalto

Lazo

Enfoque lineal para una relación de modelado entre la variable de destino y otros atributos del juego de datos.

Se utiliza para predecir valores numéricos cuando los atributos no están perfectamente correlacionados.

Regresión logística Regresión Clasificador binario LogisticRegressionCV Se utiliza para predecir el valor de una variable categóricamente dependiente. La variable dependiente es una variable binaria que contiene datos codificados en 1 o 0.
Naive Bayes Clasificación

Clasificador binario

Clasificador múltiple

GaussianNB Clasificación probabilística basada en el teorema de Bayes que asume que no hay ninguna dependencia entre las funciones.

Se utiliza cuando hay un gran número de dimensiones de entrada.

Red neuronal Clasificación

Clasificador binario

Clasificador múltiple

MLPClassifier Algoritmo de clasificación iterativo que aprende comparando el resultado de su clasificación con el valor real y lo devuelve a la red para modificar el algoritmo para iteraciones posteriores.

Se utiliza para el análisis de texto.

Bosque aleatorio Clasificación

Clasificador binario

Clasificador múltiple

Numérico

- Método de aprendizaje de conjunto que crea varios árboles de decisión y da como resultado el valor que representa de forma colectiva todos los árboles de decisión.

Se utiliza para predecir variables numéricas y categóricas.

SVM Clasificación

Clasificador binario

Clasificador múltiple

LinearSVC, SVC Clasifica registros asignándolos en el espacio y creando hiperplanos que pueden utilizarse para la clasificación. Los nuevos registros (datos de puntuación) se asignan en el espacio y se predice que pertenecen a una categoría en función del lado del hiperplano en el que caen.

Entrenamiento de un modelo predictivo mediante AutoML en Oracle Autonomous Data Warehouse

Al utilizar datos de Oracle Autonomous Data Warehouse, puede utilizar su capacidad AutoML para recomendar y entrenar un modelo predictivo. AutoML analiza los datos, calcula el mejor algoritmo que se puede utilizar y registra un modelo de predicción en Oracle Analytics para que pueda realizar predicciones sobre sus datos.

El uso de AutoML significa que Oracle Autonomous Data Warehouse se encarga de todo el trabajo duro para que usted pueda desplegar un modelo predictivo sin necesidad de habilidades en aprendizaje automático o en inteligencia artificial. El modelo de predicción generado se guarda en el área Modelos de la página Aprendizaje automático. Para realizar una predicción de los datos basada en el nuevo modelo, cree un flujo de datos y utilice el paso Aplicar modelo.
Antes de empezar:
  • Cree un juego de datos basado en los datos de Oracle Autonomous Data Warehouse sobre los que desea realizar predicciones. Por ejemplo, podría tener datos sobre el abandono de empleados, incluido un campo denominado ATTRITION que indique con 'Yes' o 'No' el abandono.
  • Asegúrese de que el usuario de base de datos especificado en la conexión de Oracle Analytics a Oracle Autonomous Data Warehouse tiene el rol OML_Developer y de que no es un superusuario 'admin'. De lo contario, fallará el flujo de datos cuando intente guardarlo o ejecutarlo.
  1. En la página inicial, haga clic en Crear y, a continuación, en Flujo de datos.
  2. En Agregar juego de datos, seleccione el juego de datos según la instancia de Oracle Autonomous Data Warehouse que contiene los datos que se van a analizar.
  3. Haga clic en Agregar paso y, a continuación, haga clic en AutoML.
  4. Para el Destino, haga clic en Seleccionar una columna y seleccione una columna de datos que contenga el valor que intenta predecir.
    Por ejemplo, para predecir el abandono de empleados, podría seleccionar un campo denominado ATTRITION indicando con 'TRUE' o 'FALSE' si los empleado han dejado la organización o no.

  5. Acepte el Tipo de tarea y la Métrica de clasificación del modelo que recomienda Oracle Analytics o seleccione un algoritmo diferente.
  6. Haga clic en Guardar modelo y especifique el nombre del modelo de predicción generado.
  7. Haga clic en Guardar y especifique un nombre para el flujo de datos.
  8. Haga clic en Ejecutar para analizar los datos y generar un modelo predictivo.
  9. En la página de inicio, haga clic en Navegar y, continuación, haga clic en Aprendizaje automático. A continuación, haga clic con el botón derecho en el modelo generado y seleccione Inspeccionar.
Puede buscar el modelo que genera Oracle Analytics en la página Aprendizaje automático del separador Modelos. Inspeccione el modelo para evaluar su calidad. Consulte Evaluación de la calidad de un modelo predictivo. También puede hacer referencia a juegos de datos relacionados que se generan para modelos generados por AutoML. Consulte ¿Qué son los juegos de datos relacionados de un modelo predictivo?.

Creación y entrenamiento de un modelo de predicción

Según el problema que se deba resolver, el analista de datos avanzado selecciona el algoritmo adecuado para entrenar un modelo predictivo y, a continuación, evalúa los resultados del modelo.

Icono de tutorial Sprint de LiveLabs

La obtención de un modelo preciso es un proceso iterativo en el que el analista de datos avanzado puede probar diferentes modelos, comparar sus resultados y ajustar los parámetros basándose en un enfoque de ensayo y error. El analista de datos puede utilizar el modelo predictivo preciso terminado para predecir tendencias en otros juegos de datos o agregar el modelo a libros de trabajo.

Nota:

Si utiliza datos cuyo origen es Oracle Autonomous Data Warehouse, puede utilizar la capacidad AutoML para entrenar de forma rápida y sencilla su propio modelo predictivo sin requerir habilidades en aprendizaje automático. Consulte Entrenamiento de un modelo predictivo mediante AutoML en Autonomous Data Warehouse.

Oracle Analytics proporciona algoritmos de predicción numérica, clasificación múltiple, clasificación binaria y agrupación en clusters.

  1. En la página inicial, haga clic en Crear y, a continuación, seleccione Flujo de datos.
  2. Seleccione el juego de datos que desea utilizar para entrenar el modelo. Haga clic en Agregar.
  3. En el editor de flujos de datos, haga clic en Agregar paso (+).
    Después de agregar un juego de datos, puede utilizar todas las columnas del juego de datos para crear el modelo o seleccionar solo las columnas relevantes. La selección de las columnas relevantes requiere una comprensión del juego de datos. Ignore las columnas que sepa que no van a influir en el comportamiento del resultado o que contengan información redundante. Puede seleccionar solo las columnas relevantes agregado el paso Seleccionar columnas. Si no está seguro de cuáles son las columnas relevantes, utilice todas las columnas.
  4. Seleccione uno de los pasos para entrenar modelos, como Entrenar predicción numérica o Entrenar agrupación en clusters.
  5. Seleccione un algoritmo y haga clic en Aceptar.
  6. Si está trabajando con un modelo supervisado, como la predicción o la clasificación, haga clic en Destino y seleccione la columna que intenta predecir. Por ejemplo, si está creando un modelo para predecir los ingresos de una persona, seleccione la columna Ingresos.
    Si está trabajando con un modelo no supervisado, como la agrupación en clusters, no es necesaria ninguna columna de destino.
  7. Cambie la configuración por defecto del modelo para ajustar y mejorar la precisión del resultado previsto. El modelo con el que trabaja determina estos valores.
  8. Haga clic en el paso Guardar modelo y proporcione un nombre y una descripción.
  9. Haga clic en Guardar, introduzca un nombre y una descripción del flujo de datos y haga clic en Aceptar para guardar el flujo de datos.
  10. Haga clic en Ejecutar flujo de datos para crear el modelo predictivo basado en el juego de datos de entrada y la configuración del modelo que ha proporcionado.

Pasos de flujo de datos para entrenar modelos de aprendizaje automático

Oracle Analytics le permite entrenar modelos de aprendizaje automático mediante pasos en flujos de datos. Cuando haya entrenado un modelo de aprendizaje automático, podrá aplicarlo a sus datos mediante el paso Aplicar modelo.

Nombre del paso Descripción
AutoML (requiere Oracle Autonomous Data Warehouse) Use la función AutoML de Oracle Autonomous Data para recomendar y entrenar un modelo predictivo para usted. El paso AutoML analiza los datos, calcula el mejor algoritmo que se puede utilizar y registra un modelo de predicción en Oracle Analytics.
Entrenar clasificador binario

Entrenar un modelo de aprendizaje automático para clasificar los datos en una de dos categorías predefinidas.

Entrenar agrupación en clusters Entrenar un modelo de aprendizaje automático para separar los grupos con rasgos similares y asignarlos a clusters.
Entrenar multiclasificador Entrenar un modelo de aprendizaje automático para clasificar los datos en tres o más categorías predefinidas.
Entregar predicción numérica Entrenar un modelo de aprendizaje automático para predecir un valor numérico basado en valores de datos conocidos.

Inspección de un modelo predictivo

Una vez que se ha creado el modelo predictivo y se ha ejecutado el flujo de datos, puede revisar la información sobre el modelo para determinar su precisión. Utilice esta información para ajustar los valores del modelo de forma iterativa para mejorar su precisión y predecir mejores resultados.

Visualización de los detalles de un modelo predictivo

La información detallada de un modelo predictivo le ayuda a entender el modelo y a determinar si es adecuado para la predicción de los datos. Los detalles del modelo incluyen la clase, el algoritmo, las columnas de entrada y las columnas de salida del modelo.

  1. En la página inicial, haga clic en Navegador y, a continuación, en Aprendizaje automático.
  2. Haga clic en el icono de menú de un modelo de entrenamiento y seleccione Inspeccionar.
  3. Haga clic en Detalles para ver la información del modelo.

Evaluación de la calidad de un modelo predictivo

Vea la información que le ayuda a conocer la calidad de un modelo predictivo. Por ejemplo, puede revisar las métricas de precisión, la precisión, la recuperación, el valor F1, la tasa de falsos positivos, etc. del modelo.

Oracle Analytics proporciona métricas similares independientemente del algoritmo utilizado para crear el modelo, lo cual hace que la comparación entre diferentes modelos sea sencilla. Durante el proceso de creación del modelo, el juego de datos de entrada de divide en dos partes para entrenar y probar el modelo según el parámetro Entrenar porcentaje de partición. El modelo utiliza la parte de prueba del juego de datos para probar la precisión del modelo que se crea.
Basándose en sus conclusiones en el separador Calidad, es posible que deba ajustar los parámetros de modelo y volver a entrenarlo.
  1. En la página inicial, haga clic en Navegador y, a continuación, en Aprendizaje automático.
  2. Haga clic en el icono de menú de un modelo de entrenamiento y seleccione Inspeccionar.
  3. Haga clic en el separador Calidad para revisar las métricas de calidad del modelo y evaluar el modelo. Por ejemplo, revise la puntuación de Precisión de modelo.

Consejo: Haga clic en Más para revisar los detalles de las vistas generadas para el modelo.

¿Qué son los juegos de datos relacionados de un modelo predictivo?

Al ejecutar el flujo de datos para crear el modelo de entrenamiento de un modelo predictivo de Oracle Analytics, Oracle Analytics crea un juego de juegos de datos relacionados. Puede abrir y crear proyectos en estos juegos de datos para obtener más información sobre la precisión del modelo.

En función del algoritmo que haya seleccionado para el modelo, los juegos de datos relacionados contienen detalles sobre el modelo como las reglas de predicción, las métricas de precisión, la matriz de confusión y los inductores clave para la predicción. Puede usar esta información para ajustar el modelo y obtener mejores resultados y usar los juegos de datos relacionados para comparar los modelos y decidir qué modelo es el más preciso.

Por ejemplo, puede abrir el juego de datos Inductores para detectar las columnas que tengan una importante influencia positiva o negativa en el modelo. Al examinar esas columnas, descubre que algunas columnas no se consideran variables de modelo porque no son entradas realistas o son demasiados granulares para la previsión. Usted usa el editor de flujo de datos para abrir el modelo y, en función de la información detectada, elimina las columnas irrelevantes o demasiado granulares y vuelve a generar el modelo. Comprueba los separadores Calidad y Resultados y verifica si ha mejorado la precisión del modelo. Siga este proceso hasta que esté satisfecho con la precisión del modelo y esté listo para puntuar un nuevo juego de datos.

Los algoritmos diferentes generan juegos de datos relacionados similares. Los distintos nombres de columnas y parámetros pueden cambiar en el juego de datos en función del tipo de algoritmo, pero la funcionalidad del juego de datos sigue igual. Por ejemplo, los nombres de columnas de un juego de datos de estadísticas puede cambiar de Regresión lineal a Regresión logística, pero el juego de datos de estadísticas contiene métricas de precisión del modelo.

Juegos de datos relacionados para modelos de AutoML

Cuando entrena un modelo predictivo utilizando AutoML, Oracle Analytics crea juegos de datos adicionales que contienen información útil sobre el modelo. El número de juegos de datos creados depende del algoritmo del modelo. Por ejemplo, para los modelos Naive Bayes, Oracle Analytics crea un juego de datos que proporciona información sobre las probabilidades condicionales. Para un árbol de decisión, el juego de datos proporciona información sobre las estadísticas del árbol de decisión. Al inspeccionar un modelo generado por AutoML mediante el algoritmo GLM, aparecen entradas (con el prefijo GLM*) para los juegos de datos específicos del modelo que contienen información de metadatos sobre el modelo.
A continuación se muestra la descripción de GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png
.png

Juegos de datos relacionados

CARTree

Este juego de datos es una representación tabular de CART (árbol de decisión), que se calcula para predecir los valores de columna de destino. Contiene columnas que representan las condiciones y los criterios de condiciones en el árbol de decisión, una predicción para cada grupo y la confianza de predicción. La visualización del diagrama de árbol incorporado se puede usar para visualizar este árbol de decisión.

Se obtiene el juego de datos CARTree al seleccionar estas combinaciones de modelos y algoritmos.

Modelo Algoritmo
Numérico CART para predicción numérica
Clasificación binaria CART (Árbol de decisión)
Clasificación múltiple CART (Árbol de decisión)

Informe de clasificación

Este juego de datos es una representación tabular de las métricas de precisión para cada valor distinto de la columna de destino. Por ejemplo, si la columna de destino puede tener dos valores distintos Sí y No, este juego de datos muestra métricas de precisión como F1, Precisión, Volver a llamar y Soporte (número de filas del juego de datos de formación con este valor) para cada valor distinto de la columna de destino.

Se obtiene el juego de datos Clasificación al seleccionar estas combinaciones de modelos y algoritmos.

Modelo Algoritmos
Clasificación binaria

Naive Bayes

Red neuronal

Máquina de vector soporte

Clasificación múltiple

Naive Bayes

Red neuronal

Máquina de vector soporte

Matriz de confusión

Este juego de datos, que también se denomina matriz de error, es un diseño de tabla dinámica. Cada fila representa una instancia de una clase prevista y cada columna representa una instancia en una clase real. En esta tabla se indica el número de falsos positivos, falsos negativos, verdaderos positivos y verdaderos negativos, que se usan para calcular las métricas de Precisión, Volver a llamar y F1.

Se obtiene el juego de datos Matriz de confusión al seleccionar estas combinaciones de modelo y algoritmo.

Modelo Algoritmos
Clasificación binaria

Regresión logística

CART (Árbol de decisión)

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Clasificación múltiple

CART (Árbol de decisión)

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Inductores

Este juego de datos proporciona información sobre las columnas que determinan los valores de la columna de destino. Las regresiones lineales se usan para identificar estas columnas. A cada columna se le asignan valores de coeficiente y correlación. El valor de coeficiente describe la ponderación de la columna que se usa para determinar el valor de la columna de destino. El valor de correlación indica la dirección de la relación entre la columna de destino y la columna dependiente. Por ejemplo, si el valor de la columna de destino aumenta o disminuye en función de la columna dependiente.

Se obtiene el juego de datos Inductores al seleccionar estas combinaciones de modelos y algoritmos.

Modelo Algoritmos
Numérico

Regresión lineal

Regresión lineal de red elástica

Clasificación binaria

Regresión logística

Máquina de vector soporte

Clasificación múltiple Máquina de vector soporte

Hitmap

Este juego de datos contiene información acerca de los nodos de hoja del árbol de decisión. Cada fila de la tabla representa un nodo de hoja y contiene información que describe lo que representa un nodo de hoja, como el tamaño del segmento, la confianza y el número de filas esperado. Por ejemplo, número esperado de predicciones correctas = Tamaño de segmento * Confianza.

Se obtiene el juego de datos Hitmap al seleccionar estas combinaciones de modelo y algoritmo.

Modelo Algoritmo
Numérico CART para predicción numérica

Residuales

Este juego de datos proporciona información sobre la calidad de las predicciones residuales. Un valor residual es la diferencia entre el valor medido y el valor previsto de un modelo de regresión. Este juego de datos contiene un valor de suma agregado de la diferencia absoluta entre los valores reales y previstos para todas las columnas del juego de datos.

Se obtiene el juego de datos Residuales al seleccionar estas combinaciones de modelo y algoritmo.

Modelo Algoritmos
Numéricos

Regresión lineal

Regresión lineal de red elástica

CART para predicción numérica

Clasificación binaria CART (Árbol de decisión)
Clasificación múltiple CART (Árbol de decisión)

Estadísticas

Las métricas de este juego de datos dependen del algoritmo usado para generarlo. Observe esta lista de métricas basada en un algoritmo:

  • Regresión lineal, CART para predicción numérica, Regresión lineal de red elástica. Estos algoritmos contienen Raíz cuadrada, Raíz cuadrada ajustada, Error de promedio absoluto (MAE), Error de raíz cuadrada media (MSE), Error absoluto relativo (RAE), Error al cuadrado relativo (RSE), Error de raíz cuadrada media (RMSE).
  • CART (Árboles de regresión y clasificación), Clasificación Naive Bayes, Red neural, Máquina de vector soporte (SVM), Bosque aleatorio, Regresión lineal. Estos algoritmos contienen Precisión, Total, F1.

Se obtiene este juego de datos al seleccionar estas combinaciones de modelo y algoritmo.

Modelo Algoritmo
Numérico

Regresión lineal

Regresión lineal de red elástica

CART para predicción numérica

Clasificación binaria

Regresión logística

CART (Árbol de decisión)

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Clasificación múltiple

Naive Bayes

Red neuronal

Bosque aleatorio

Máquina de vector soporte

Resumen

Este juego de datos contiene información como el nombre del destino y el nombre del modelo.

Se obtiene el juego de datos Resumen al seleccionar estas combinaciones de modelo y algoritmos.

Modelo Algoritmos
Clasificación binaria

Naive Bayes

Red neuronal

Máquina de vector soporte

Clasificación múltiple

Naive Bayes

Red neuronal

Máquina de vector soporte

Búsqueda de los juegos de datos relacionados de un modelo predictivo

Los juegos de datos relacionados se generan cuando se entrena un modelo predictivo.

En función del algoritmo, los juegos de datos relacionados contienen detalles sobre el modelo, como: las reglas de predicción, las métricas de precisión, la matriz de confusión, los inductores clave para la predicción, etc. Estos parámetros le ayudan a comprender las reglas que utiliza el modelo para determinar las predicciones y las clasificaciones.
  1. En la página inicial, haga clic en Navegador y, a continuación, en Aprendizaje automático.
  2. Haga clic en el icono de menú de un modelo de entrenamiento y seleccione Inspeccionar.
  3. Haga clic en el separador Relacionado para acceder a los juegos de datos relacionados del modelo.
  4. Haga doble clic en un juego de datos relacionado para verlo o utilizarlo en un libro de trabajo.

Adición de un modelo predictivo a un libro de trabajo

Cuando se crea un escenario en un libro de trabajo, se debe aplicar un modelo predictivo al juego de datos del libro de trabajo para revelar las tendencias y los patrones para cuya búsqueda se diseñó el modelo.

Nota:

No puede aplicar un modelo de aprendizaje automático de Oracle a los datos de un libro de trabajo.
Una vez agregado el modelo al flujo de trabajo y asignadas las entradas del modelo a las columnas del juego de datos, el panel de datos contiene los objetos del modelo, que puede arrastrar y soltar en el lienzo. El aprendizaje automático genera los valores del modelo basándose en las columnas de datos correspondientes de la visualización.
  1. En la página inicial, haga clic en Crear y, a continuación, en Libro de trabajo.
  2. Seleccione el juego de datos que desea utilizar para crear el libro de trabajo y haga clic en Agregar a libro de trabajo.
  3. En el panel Datos, haga clic en Agregar y seleccione Crear escenario.
  4. En el cuadro de diálogo Crear escenario: Seleccionar modelo, seleccione un modelo y haga clic en Aceptar.
    Solo puede aplicar un modelo predictivo. No puede aplicar un modelo de aprendizaje automático de Oracle.
    Si cada entrada de modelo no coincide con un elemento de datos, se mostrará el cuadro de diálogo Asignar datos al modelo.
  5. Si aparece el cuadro de diálogo Asignar datos al modelo, en el campo Juego de datos, seleccione el juego de datos que se va a utilizar con el modelo.
  6. Haga coincidir la entrada del modelo con los elementos de datos según sea necesario. Haga clic en Listo.
    El escenario se muestra como un juego de datos en el panel Elementos de datos.
  7. Arrastre y suelte elementos desde el juego de datos y el modelo en el lienzo Visualizar.
  8. Para ajustar el escenario, haga clic con el botón derecho en el panel Elementos de datos y seleccione Editar escenario.
  9. Cambie el juego de datos y actualice la asignación de entrada de modelo y elementos de datos según sea necesario.
  10. Haga clic en Guardar para guardar el libro de trabajo.