Uso de modelos de aprendizaje automático (ML)
Data Transforms soporta el uso del modelo de aprendizaje automático en un flujo de datos. Descubra cómo crear y utilizar modelos de Machine Learning (ML) en flujos de datos.
Temas
- Crear una entidad de datos de modelo de aprendizaje automático en el editor de flujos de datos
Para utilizar modelos de aprendizaje automático en transformaciones de datos, debe crear dos flujos de datos. Primero debe crear la entidad de datos del modelo de aprendizaje automático mediante el editor de flujos de datos y, a continuación, puede utilizar la entidad de datos de un flujo de datos para extraer datos de una conexión de origen y cargarlos en un servidor de destino. - Propiedades de entidad de datos de modelo de AA
El separador Propiedades del asistente Agregar entidad de datos proporciona opciones de minería de datos que puede utilizar para definir la entidad de datos de modelo de AA. - Uso del modelo de aprendizaje automático en un flujo de datos
Puede utilizar la función de base de datos Modelo de predicción para ejecutar algoritmos de modelo de aprendizaje automático en datos de origen y cargar la salida en una base de datos de destino.
Tema principal: Página Data Transforms
Creación de una entidad de datos de modelo de aprendizaje automático en el editor de Data Flow
Para utilizar modelos de aprendizaje automático en transformaciones de datos, debe crear dos flujos de datos. Primero debe crear la entidad de datos del modelo de aprendizaje automático mediante el editor de flujos de datos y, a continuación, puede utilizar la entidad de datos de un flujo de datos para extraer datos de una conexión de origen y cargarlos en un servidor de destino.
Para crear una entidad de datos de modelo de aprendizaje automático en el editor de Data Flow,
- Arrastre la entidad de datos en la que desea crear el modelo de aprendizaje automático al lienzo de diseño.
- Seleccione el componente y haga clic en el icono Agregar entidad de datos
presente en la esquina superior derecha del componente de destino.
- Aparece la página Agregar entidad de datos, que permite configurar los siguientes detalles del componente de destino:
Separador General
- En el cuadro de texto Nombre, introduzca el nombre de la entidad de datos recién creada.
- En la lista desplegable Tipo de entidad, seleccione Modelo de AA como tipo de entidad de datos.
Al seleccionar este tipo de entidad, la interfaz de usuario cambia de la siguiente manera:
- La lista desplegable Conexión solo muestra las conexiones de Oracle que ha creado.
- El asistente Agregar entidad de datos muestra el separador Propiedades, donde puede seleccionar el tipo de aprendizaje, la función, el algoritmo y configurar parámetros para definir el modelo de aprendizaje automático. Consulte Propiedades de entidad de datos de modelo de AA para obtener más información.
- En la lista desplegable Tipo de conexión, seleccione la conexión necesaria desde la que desea agregar la entidad de datos recién creada. En el caso de las entidades de datos del modelo de AA, la lista desplegable Tipo de conexión solo muestra Oracle como opción.
- La lista desplegable Conexión se rellena con las conexiones que ha creado con el tipo de conexión asociado. En la lista desplegable Conexión, seleccione el nombre del servidor en el que desea mantener la entidad de datos del modelo de AA.
- En la lista desplegable Esquema, todos los esquemas correspondientes a la conexión seleccionada se muestran en dos grupos.
- Nuevo esquema de base de datos (de los que no ha importado antes) y
- Esquema de base de datos existente (de las que ha importado anteriormente y que posiblemente sustituyan a las entidades de datos).
- En el cuadro de texto Etiquetas, introduzca la etiqueta que desee. Puede utilizar etiquetas para filtrar las entidades de datos que se muestran en la página Entidad de datos.
- Si desea marcar esta entidad de datos como un grupo de funciones, amplíe Opciones avanzadas y haga clic en la casilla de control Tratar como grupo de funciones.
- Haga clic en Siguiente.
Separador Propiedades
- Seleccione el tipo de aprendizaje, la función y el algoritmo que desea utilizar para crear esta entidad de datos. Para obtener más información sobre las opciones, consulte Propiedades de entidad de datos de modelo de AA.
- En función de las opciones seleccionadas, la sección Parámetros se rellena con la lista de parámetros que están marcados como "Importancia" y "Alta". Puede agregar otros parámetros necesarios mediante el icono
.
Debe especificar un valor para cada parámetro para que el flujo de datos se pueda ejecutar correctamente.
Separador Columnas
- Haga clic en el icono
Agregar columnas para agregar nuevas columnas a la entidad de datos recién creada.
Se agrega una nueva columna a la tabla mostrada.
- La tabla muestra las siguientes columnas:
- Nombre
- Tipo de datos: haga clic en la celda para configurar el tipo de datos necesario.
- Escala
- Longitud
- Acciones: haga clic en el icono de cruz para suprimir la columna creada.
- Para suprimir las columnas de forma masiva, seleccione las columnas y haga clic en el icono Suprimir
.
- Para buscar los detalles de columna necesarios, en el cuadro de texto Buscar, escriba el nombre de columna necesario y haga clic en Introducir. Se muestran los detalles de la columna obligatoria.
- Haga clic en Siguiente.
Separador Vista previa de entidad de datos
Muestra una vista previa de todas las columnas creadas y sus detalles configurados. Si la entidad de datos pertenece a una base de datos Oracle, también puede ver las estadísticas de la tabla. Consulte Visualización de Estadísticas de Entidades de Datos para obtener más información.
- Haga clic en Guardar para guardar la configuración y salir del asistente.
- Guarde y ejecute el flujos de datos.
Se crea la nueva entidad de datos. Se muestra en la página Entidades de datos.
Tema principal: Uso de modelos de Machine Learning (ML)
Propiedades de entidad de datos de modelo de AA
El separador Propiedades del asistente Agregar entidad de datos proporciona opciones de minería de datos que puede utilizar para definir la entidad de datos del modelo de aprendizaje automático.
En este tema se asume el conocimiento previo de conceptos de Oracle Machine Learning, como algoritmos y funciones de minería de datos. Para obtener más información, consulte la Guía de API de Oracle Machine Learning for SQL.
Tipo de aprendizaje | Función | Algoritmo |
---|---|---|
Supervisado | Clasificación | Árbol de Decisión |
Análisis de Semántica Explícito | ||
Modelos Lineales Generalizados | ||
Naive Bayes | ||
Bosque aleatorio | ||
Red neuronal | ||
Support Vector Machine | ||
Regresión | Modelos Lineales Generalizados | |
Red neuronal | ||
Support Vector Machine | ||
Serie Temporal | Alisado exponencial | |
Importancia de Atributos | Longitud mínima de descripción | |
No supervisado | Asociación | A priori |
Importancia de Atributos | Descomposición de matriz de CUR | |
detección de anomalías | Máquinas vectoriales de soporte de una clase | |
Clusters | Maximización Esperada | |
K-Means | ||
Agrupación en clusters de particiones ortogonales | ||
Extracción de Funciones | Análisis de Semántica Explícito | |
Factorización de Matriz No Negativa | ||
Descomposición de Valor Único |
Tema principal: Uso de modelos de Machine Learning (ML)
Uso del modelo de aprendizaje automático en un flujo de datos
Puede utilizar la función de base de datos Modelo de predicción para ejecutar algoritmos de modelo de aprendizaje automático en datos de origen y cargar la salida en una base de datos de destino.
Antes de utilizar un modelo de aprendizaje automático en un flujo de datos, debe crear el modelo de aprendizaje automático. Para obtener instrucciones sobre cómo crear un modelo de AA, consulte Creación de una entidad de datos de modelo de AA en el editor de Data Flow.
Para utilizar un modelo de AA en un flujo de datos:
- Siga las instrucciones de Creación de un flujo de datos para crear un nuevo flujo de datos.
- En el editor de Data Flow, arrastre las tablas que desea utilizar como origen en el flujo de datos y suéltelas en el lienzo de diseño.
- En la barra de herramientas Funciones de base de datos, haga clic en Aprendizaje automático y arrastre el componente de transformación Modelo de predicción para soltarlo en el lienzo de diseño.
- Haga clic en el componente de transformación Modelo de predicción para ver sus propiedades.
- En el separador General, especifique lo siguiente:
- Conexión: la lista desplegable muestra todas las conexiones de Oracle disponibles. Seleccione la conexión de Oracle que desea utilizar.
- Esquema: seleccione el esquema.
- Modelo de AA: la lista desplegable muestra todos los modelos de AA disponibles. Consulte Creación de una entidad de datos de modelo de aprendizaje automático en el editor de Data Flow para obtener instrucciones sobre cómo crear un modelo de aprendizaje automático.
- En el separador Asignación de columnas, asigne la columna de origen que desea embeber al atributo INPUT del operador. La única columna disponible en las asignaciones de columna es
prediction parameters
. Arrastre una columna de texto de las columnas disponibles a la columna Expresión. - Arrastre la tabla que desea utilizar como destino en el flujo de datos y suéltela en el lienzo de diseño.
- Guarde y ejecute el flujo de datos.
Data Transforms ejecutará el modelo de predicción en los datos de origen y escribirá la salida en la tabla de destino.
Tema principal: Uso de modelos de Machine Learning (ML)