1 Visión general de Oracle AI Data Platform y Workbench
En este capítulo, se proporciona información y procedimientos para que los nuevos usuarios comiencen a utilizar Oracle AI Data Platform Workbench.
¿Para qué se utiliza Oracle AI Data Platform Workbench?
Oracle AI Data Platform Workbench proporciona un entorno integrado para crear, orquestar y poner en funcionamiento datos y flujos de trabajo de IA.
- Optimiza la detección y gobernanza de datos: AI Data Platform Workbench proporciona un repositorio de metadatos centralizado (catálogo maestro) que mejora la capacidad de búsqueda y gobernanza de los datos estructurados y no estructurados.
- Habilitar la colaboración segura de datos: mediante el control de acceso basado en RBAC, AI Data Platform Workbench permite que diferentes equipos trabajen en conjuntos de datos compartidos al tiempo que mantienen políticas de seguridad estrictas.
- Acelere la preparación y el procesamiento de datos: con blocs de notas y orquestación de flujos de trabajo integrados, los usuarios pueden limpiar, transformar y enriquecer datos de manera eficiente.
- Soporte de análisis avanzados e IA/ML: AI Data Platform Workbench se integra con Apache Spark, lo que permite a los científicos y analistas de datos ejecutar cálculos complejos y entrenar modelos directamente dentro de su lago de datos.
- Garantice una integración perfecta entre orígenes de datos: AI Data Platform Workbench soporta catálogos externos de orígenes de datos de Autonomous Database (ADB), Object Storage (OS) y de terceros, lo que permite a los usuarios consultar y analizar datos sin duplicación.
Integración gestionada con código abierto
Oracle AI Data Platform Workbench aprovecha y amplía las tecnologías de código abierto para proporcionar una experiencia potente pero gestionada.
- Apache Spark: la capa de recursos informáticos de AI Data Platform Workbench cuenta con la tecnología de Spark, lo que permite el procesamiento de datos distribuido y escalable.
- Soporte de Delta Lake: AI Data Platform Workbench aprovecha Delta Lake para mejorar la fiabilidad de los datos, las transacciones ACID y la evolución del esquema.
- Compatibilidad de Iceberg y Hudi a través de Delta Uniform: a través de Delta Uniform, AI Data Platform Workbench amplía el soporte para Apache Iceberg y Apache Hudi, lo que permite la interoperabilidad en diferentes formatos de almacenamiento. Esto garantiza que los usuarios puedan adoptar una estrategia unificada de formato de tabla a la vez que mantienen una ejecución de consultas y una gobernanza de datos eficientes.
- Integración JDBC para herramientas de BI: AI Data Platform Workbench proporciona controladores JDBC, lo que permite una conectividad perfecta con herramientas de BI externas como Oracle Analytics Cloud (OAC) y plataformas de visualización de terceros.
Personas para usuarios de Oracle AI Data Platform
Oracle AI Data Platform atiende a una variedad de usuarios en diferentes roles dentro de una organización, cada uno con necesidades y requisitos únicos.
- Ingenieros de datos: los ingenieros de datos trabajan con pipelines de datos a gran escala, transformando los datos sin procesar en formatos utilizables para el análisis. Se basan en las sólidas capacidades de AI Data Platform para diseñar y gestionar flujos de trabajo de datos, ingerir datos de diversas fuentes y garantizar la calidad de los datos. Están altamente enfocados en automatizar procesos, optimizar recursos informáticos e integrar diferentes sistemas de datos sin problemas.
- Analistas de datos: los analistas de datos utilizan AI Data Platform para descubrir, analizar y generar estadísticas a partir de datos. Requieren una interfaz intuitiva y herramientas para consultar y analizar grandes conjuntos de datos. AI Data Platform les proporciona portátiles interactivos y una integración perfecta con herramientas de inteligencia empresarial (BI), lo que les ayuda a transformar los datos no procesados en estadísticas útiles para los responsables de la toma de decisiones.
- Científicos de datos: los científicos de datos aprovechan las capacidades de computación escalables de AI Data Platform para tareas de aprendizaje automático y análisis avanzados. Necesitan acceso a diversos conjuntos de datos, potentes herramientas de procesamiento y la capacidad de ejecutar modelos complejos. Los blocs de notas con tecnología Spark de AI Data Platform, la integración de IA/AA y el soporte para bibliotecas de código abierto permiten a los científicos de datos crear, probar y desplegar modelos dentro de la plataforma.
- Administradores de datos: estos usuarios se aseguran de que todos los datos se manejen de acuerdo con las regulaciones del sector y las políticas organizativas. Se centran en mantener la privacidad de los datos, auditar el acceso y supervisar el uso de los datos en toda la organización. AI Data Platform les ayuda a gestionar metadatos, aplicar controles de acceso basados en roles (RBAC) y garantizar una gobernanza adecuada a través de políticas de catalogación, seguimiento de linaje y seguridad.
Casos de uso comunes de Oracle AI Data Platform
Oracle AI Data Platform ofrece una variedad de casos de uso en todos los sectores y funciones empresariales.
Arquitectura del Medallón
- Implementar una arquitectura de medallón con capas de bronce, plata y oro.
- Utilice Delta Uniform e Iceberg para un almacenamiento de datos eficiente y la optimización de consultas.
- Permite el acceso sin copia a orígenes de datos externos para realizar análisis sin problemas.
ETL e ingeniería de datos
- Utilice flujos de trabajo y blocs de notas basados en Spark para procesar, transformar y enriquecer datos no procesados.
- Automatice los pipelines de datos con una orquestación de flujos de trabajo con poco código y sin código.
- Gestione el procesamiento por lotes a gran escala y la ingestión de datos en tiempo real.
Aprendizaje automático, IA y ciencia de datos
- Entrene y despliegue modelos de Machine Learning con blocs de notas basados en Spark.
- Habilite la transformación de datos y la ingeniería de funciones a gran escala.
- Proporcione entornos de ejecución gestionados para cargas de trabajo de Python y PySpark.
- Crea agentes de IA conversacional para ayudar a recuperar y desarrollar datos.
Catálogo y gobernanza de datos empresariales, uso compartido delta
- Gestión centralizada de metadatos para datos estructurados y no estructurados.
- Control de acceso basado en roles (RBAC) para garantizar el acceso a los datos y la colaboración.
- Integración con catálogos externos, incluidas Autonomous Database (ADB) y Object Storage.
- Oracle AI Data Platform admite el uso compartido Delta, lo que permite un uso compartido de datos seguro, en tiempo real y controlado a través de los límites de la organización.
Análisis, Business Intelligence e informes
- Conecte OCI Oracle Analytics Cloud (OAC) y herramientas de BI de terceros a través de JDBC como Tableau, Power BI.
Integración de datos híbridos y multinube
- Activar la ejecución de consultas federadas en varios servicios de OCI.
- Integración con bases de datos y almacenamiento en la nube de terceros para análisis híbridos.
- Mantenga la soberanía y el cumplimiento de los datos en varios entornos.