Servicio de ciencia de datos: Casos de uso de atención sanitaria
Oracle Cloud Infrastructure Data Science (OCI) Data Science es una plataforma sin servidor totalmente gestionada que permite a los equipos de ciencia de datos crear, entrenar y gestionar modelos de aprendizaje automático.
Data Science se integra con el resto de la pila de OCI, incluidos Oracle Functions, Data Flow, Autonomous Data Warehouse y Object Storage. Oracle Accelerated Data Science (ADS) Software Developer Kit (SDK) es una biblioteca Python que se incluye como parte del servicio Data Science, con muchas funciones y objetos que automatizan o simplifican los pasos del flujo de trabajo de ciencia de datos, incluidos la conexión a datos, la exploración y visualización de datos, el entrenamiento de un modelo con AutoML, la evaluación de modelos y la explicación de modelos. ADS también proporciona una interfaz sencilla para acceder al catálogo de modelos del servicio Data Science y otros servicios OCI, incluido el almacenamiento de objetos.
Arquitectura
Esta arquitectura flexible admite varios escenarios en redes de estado integradas basadas en el servicio Oracle Machine Learning, que combinan plataformas de Autonomous Data Warehouse y Data Science.
Además de Data Science y Autonomous Data Warehouse, esta arquitectura también utiliza Data Catalog, Oracle APEX Application Development y Oracle Analytics Cloud. También utiliza instancias informáticas de OCI para alojar aplicaciones que pueden transmitir dinámicamente datos de dispositivos portátiles a Autonomous Data Warehouse o a Object Storage. Esta arquitectura tiene múltiples propósitos, incluido el almacenamiento de datos importantes en un almacenamiento seguro, fiable y de recuperación rápida, y la creación y despliegue de aplicaciones y módulos de aprendizaje automático en cortos períodos de tiempo.
El siguiente diagrama ilustra esta arquitectura de referencia.

Descripción de la ilustración Architecture-datascience-use-cases.png
La arquitectura tiene los siguientes componentes:
- Región
Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones y las grandes distancias pueden separarlas (entre países e incluso continentes).
- Dominios de disponibilidad
Los dominios de disponibilidad son centros de datos independientes e independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten infraestructura, como alimentación o refrigeración, ni la red interna del dominio de disponibilidad. Por lo tanto, es improbable que un fallo en un dominio de disponibilidad afecte a los otros dominios de disponibilidad de la región.
- Dominios de errores
Un dominio de errores es una agrupación de hardware e infraestructura dentro de un dominio de disponibilidad. Cada dominio de disponibilidad tiene tres dominios de errores con alimentación y hardware independientes. Cuando distribuye recursos en varios dominios de errores, las aplicaciones pueden tolerar fallos del servidor físico, mantenimiento del sistema y fallos de alimentación dentro de un dominio de errores.
- Red virtual en la nube (VCN) y subredes
Una VCN es una red personalizable y definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes del centro de datos tradicionales, las VCN le proporcionan un control total de su entorno de red. Una VCN puede tener varios bloques CIDR no solapados que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes, que se pueden acotar a una región o a un dominio de disponibilidad. Cada subred consta de un rango de direcciones contiguas que no se solapan con las otras subredes de VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.
- Servicio de ciencia de datos
Una plataforma sin servidor y totalmente gestionada que permite a los equipos de ciencia de datos crear, formar y gestionar modelos de aprendizaje automático. Puede integrarse fácilmente con otros servicios de OCI como Autonomous Data Warehouse, Object Storage y mucho más.
- Autonomous Data Warehouse
Base de datos autónoma de Oracle que incluye Oracle Machine Learning. Los científicos de datos pueden crear, evaluar, puntuar y desplegar modelos de aprendizaje automático mediante las funciones de Oracle Machine Learning de la base de datos y la interfaz de bloc de notas relacionada. También puede utilizar Autonomous Transaction Processing.
- VM de aplicación
Una instancia informática de OCI con Oracle Linux instalada y lista para la instalación de herramientas y aplicaciones que necesitan acceso a la base de datos.
- Catálogo de datos
OCI Data Catalog es una solución de descubrimiento y gobernanza de datos de autoservicio totalmente gestionada para los datos de su empresa. Data Catalog proporciona un entorno único colaborativo para gestionar metadatos técnicos, de negocio y operativos.
- Oracle Analytics Cloud
Oracle Analytics Cloud ofrece a los analistas empresariales funciones de autoservicio modernas que funcionan con IA para la preparación de datos, la visualización, la generación de informes empresariales, los análisis aumentados y el procesamiento y la generación de lenguaje natural.
Oracle Analytics Cloud está integrado con Oracle Machine Learning. Esta integración permite a los analistas mostrar los modelos disponibles en la base de datos y utilizar esos modelos en los paneles de control y análisis de Oracle Analytics Cloud.
- APEX
Oracle APEX Application Development es una plataforma de desarrollo con poco código que permite crear aplicaciones empresariales seguras y escalables que puede desplegar en cualquier lugar. Se incluye con Autonomous Database y no requiere instalación. Los usuarios de APEX pueden acceder a modelos y resultados desde Oracle Machine Learning.
Recomendaciones
Los requisitos pueden ser diferentes de la arquitectura que se describe aquí. Utilice las siguientes recomendaciones como punto de partida.
- VCN
Al crear una VCN, determine el número de bloques CIDR necesarios y el tamaño de cada bloque según el número de recursos que planea asociar a subredes de la VCN. Utilice bloques CIDR que estén dentro del espacio de direcciones IP privadas estándar.
Seleccione bloques CIDR que no se superpongan con ninguna otra red (en Oracle Cloud Infrastructure, su centro de datos local u otro proveedor en la nube) a la que desee configurar conexiones privadas.
Después de crear una VCN, puede cambiar, agregar y eliminar sus bloques de CIDR.
Al diseñar las subredes, tenga en cuenta los requisitos de flujo de tráfico y seguridad. Conecte todos los recursos de un nivel o rol específico a la misma subred, que puede servir como límite de seguridad.
- Seguridad
Utilice Oracle Cloud Guard para supervisar y mantener la seguridad de los recursos en OCI de forma proactiva. Cloud Guard utiliza recetas de detector que puede definir para examinar los recursos con el fin de detectar puntos débiles en la seguridad y para supervisar los operadores y usuarios en busca de actividades de riesgo. Cuando se detecta cualquier configuración incorrecta o actividad insegura, Cloud Guard recomienda acciones correctivas y ayuda con esas acciones, en función de las recetas de los respondedores que puede definir.
Para los recursos que requieren máxima seguridad, Oracle recomienda utilizar zonas de seguridad. Una zona de seguridad es un compartimento asociado a una receta definida por Oracle de políticas de seguridad basadas en mejores prácticas. Por ejemplo, los recursos de una zona de seguridad no deben ser accesibles desde el Internet público y deben cifrarse mediante claves gestionadas por el cliente. Al crear y actualizar recursos en una zona de seguridad, OCI valida las operaciones con respecto a las políticas de la receta de zona de seguridad y deniega las operaciones que violan cualquiera de las políticas.
- Autonomous Data Warehouse
Cree un esquema independiente para uso exclusivo de científicos de datos. Otorgue al esquema acceso de solo lectura al esquema del almacén de datos principal. Esta disposición permite a los científicos de datos crear vistas locales de datos para la exploración, el análisis y la creación de modelos. Cuando sea necesario, los datos compartidos se pueden copiar en su propio esquema, donde se pueden modificar localmente.
- Máquinas Virtuales
Las máquinas virtuales se distribuyen en varios dominios de errores para ofrecer una alta disponibilidad. Recomendamos utilizar una unidad de máquina virtual flexible para la instancia informática; esto le permitirá aumentar o disminuir la capacidad de las máquinas virtuales en minutos.
- Object Storage
El almacenamiento de objetos ofrece durabilidad de datos fiable y rentable. Proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidos datos de base de datos, datos analíticos, imágenes, vídeos y mucho más. Recomendamos utilizar almacenamiento estándar para ingerir datos de orígenes externos, ya que las aplicaciones y los usuarios pueden acceder a ellos rápidamente. Puede crear una política de ciclo de vida para mover los datos del almacenamiento estándar al almacenamiento de archivos cuando ya no es necesario acceder a ellos con frecuencia.
Consideraciones
Tenga en cuenta los siguientes puntos al desplegar esta arquitectura de referencia.
- Seguridad
Utilice políticas para restringir quién puede acceder a los recursos de OCI que tiene su compañía y cómo pueden acceder a ellos.
- Disponibilidad de Aplicación
Los dominios de errores proporcionan la mejor resiliencia dentro de un único dominio de disponibilidad. Puede desplegar instancias informáticas que realizan las mismas tareas en varios dominios de errores. Este diseño elimina un único punto de fallo mediante la introducción de redundancia.
- Costo
Evalúe sus requisitos para seleccionar las unidades de computación adecuadas.
- Supervisión y alertas
Configure la supervisión y las alertas sobre el uso de CPU y memoria para los nodos de forma que pueda ampliar o reducir la unidad según sea necesario.
Desplegar
El código necesario para desplegar esta arquitectura de referencia está disponible en GitHub. Puede obtener el código en Oracle Cloud Infrastructure Resource Manager con un solo clic, crear la pila y desplegarla. También puede descargar el código de GitHub en su computadora, personalizar el código y desplegar la arquitectura mediante la CLI de Terraform.
- Desplegar mediante Oracle Cloud Infrastructure Resource Manager:
- Haga clic en
.
Si aún no ha iniciado sesión, introduzca las credenciales de arrendamiento y usuario.
- Revise y acepte las condiciones.
- Seleccione la región en la que desea desplegar la pila.
- Siga las indicaciones de la pantalla e instrucciones para crear la pila.
- Después de crear la pila, haga clic en Acciones de Terraform y seleccione Plan.
- Espere a que termine el trabajo y revise el plan.
Para realizar cambios, vuelva a la página Detalles de pila, haga clic en Editar pila y realice los cambios necesarios. A continuación, vuelva a ejecutar la acción Plan.
- Si no es necesario realizar más cambios, vuelva a la página Detalles de pila, haga clic en Acciones de Terraform y seleccione Aplicar.
- Haga clic en
- Realice el despliegue con el código de Terraform en GitHub:
- Vaya a GitHub.
- Clone o descargue el repositorio en su equipo local.
- Siga las instrucciones del documento
README
.