CloudWatch

La supervisión es un aspecto fundamental para mantener el estado, el rendimiento y la disponibilidad de los despliegues de Oracle AI Database@AWS. Amazon CloudWatch proporciona un servicio de observabilidad totalmente gestionado que le permite recopilar, analizar y actuar sobre los datos operativos en tiempo real.

Con Oracle AI Database@AWS, las métricas clave de rendimiento e infraestructura se publican automáticamente en CloudWatch en el espacio de nombres de AWS/ODB. Estas métricas son el uso de CPU, el consumo de memoria, el uso de almacenamiento, las sesiones activas y el rendimiento de E/S en los clusters de VM de Exadata, las bases de datos de contenedores de Exadata y las bases de datos de IA autónomas.

Descubra cómo supervisar los recursos de Oracle AI Database@AWS mediante el AWS CloudWatch.

Dimensiones de Amazon CloudWatch para Oracle AI Database@AWS

En este tema se explica cómo filtrar las métricas de Oracle AI Database@AWS mediante las siguientes dimensiones.

Tabla 1-2 Dimensiones

Dimensión Filtros
cloudVmClusterId Identificador de un cluster de VM.
cloudExadataInfrastructureId Identificador de la infraestructura de Exadata.
collectionName Nombre de una colección.
deploymentType El tipo de infraestructura.
diskgroupName Un nombre de un grupo.
errorCode Un código de error.
errorSeverity Gravedad de un error.
filesystemName El nombre de un sistema de archivos.
hostName Nombre de la máquina host.
instanceName Nombre de una instancia de base de Datos.
instanceNumber Número de instancia de una instancia de base de datos.
ioType Tipo de operación de E/S.
jobId Identificador único para un trabajo.
managedDatabaseGroupId Identificador de un grupo de bases de datos gestionadas.
managedDatabaseId Identificador de una base de datos gestionada.
memoryPool Tipo de pool de memoria.
memoryType Tipo de memoria.
ociCloudVmClusterId Identificador de OCI de un cluster de VM.
ociCloudExadataInfrastructureId Identificador de OCI de la infraestructura de Exadata.
parseType Tipo de análisis.
resourceId Identificador de un recurso.
resourceName El nombre de un recurso.
resourceName_Database El nombre de una base datos.
resourceName_DbNode El nombre de un nodo de bases de datos.
resourceType Tipo de base de datos.
schemaName Nombre de un esquema.
status Estado de una base de datos.
tablespaceContents Contenido de un tablespace.
tablespaceName Nombre de un tablespace.
tablespaceType Contenido de un tablespace.
transactionStatus Estado de una transacción.
type Tipo de trabajo de DMS programado problemático.
waitClass Clase de evento de espera.

Métricas

Estos son los pasos para supervisar las métricas.

  • Para ver las métricas de cluster de VM de Exadata, debe obtener el nombre de cluster de VM de Exadata o el OCID asociado al cluster de VM de Exadata.

    Obtener el cluster de VM de Exadata o el OCID
    1. En el panel de control de Oracle AI Database@AWS, vaya a Clusters de VM de Exadata.
    2. En la lista Clusters de VM de Exadata, seleccione el enlace Nombre de cluster de VM que está utilizando.
    3. En la página Resumen, copie la información de Nombre de cluster, tal como se requerirá en la siguiente sección.Esta captura de pantalla muestra cómo supervisar las métricas del cluster de VM de Exadata.

    Visualización de métricas de cluster de VM de Exadata

    1. Desde la consola de AWS, vaya a CloudWatch.
    2. Seleccione la región del cluster de VM de Exadata.
    3. Expanda la sección Métricas y, a continuación, seleccione el enlace Todas las métricas.
    4. En la página Todas las métricas, seleccione ODB como espacio de nombres.
    5. Pegue la información del nombre de cluster que ha obtenido anteriormente en el campo Buscar cualquier métrica, dimensión, ID de recurso o ID de cuenta para iniciar la búsqueda. La página Métricas mostrará los resultados relacionados.
    6. Puede seleccionar dimensiones para ver las métricas respectivas como se muestra a continuación.Esta captura de pantalla muestra cómo supervisar las métricas del cluster de VM de Exadata.

    En el siguiente ejemplo se muestran las métricas de infraestructura para el nodo VM-q9rkl1 en el cluster de VM de Exadata demo-VM-cluster-03-1 en un marco de tiempo específico.Esta captura de pantalla muestra cómo supervisar las métricas del cluster de VM de Exadata.

    Tabla 1-3 Métricas

    Métrica Descripción Unidades
    ASMDiskgroupUtilization Porcentaje de espacio utilizable usado en un Grupo de discos El espacio utilizable es el espacio disponible para crecer. El grupo de discos DATA almacena nuestros archivos de base de datos Oracle. El Grupo de Discos RECO contiene archivos de base de Datos para la Recuperación, como archivos y logs de flashback. Porcentaje
    CpuUtilization Porcentaje de uso de CPU. Porcentaje
    LoadAverage La media de carga del sistema se mide en 5 minutos Entero
    MemoryUtilization Este es el porcentaje de memoria disponible para iniciar nuevas aplicaciones sin intercambio. Puede obtener la memoria disponible mediante el siguiente comando: cat /proc/meminfo Porcentaje
    NodeStatus Indica si se puede acceder al host. Entero
    OcpusAllocated Este es el número de OCPU asignadas. Entero
    SwapUtilization Esto indica el porcentaje de utilización del espacio total de intercambio. Porcentaje

    Métricas de base de datos de contenedores de Exadata

    Estos son los pasos para supervisar las métricas de base de datos de contenedores de Exadata.

    Para ver las métricas de datos de contenedores de Exadata, debe obtener el nombre de base de datos de contenedores de Exadata o el OCID asociado a la base de datos de contenedores de Exadata.

    Obtener el nombre de la base de datos de contenedores de Exadata o el prefijo de SID de Oracle
    1. En el panel de control de Oracle AI Database@AWS, seleccione Clusters de VM de Exadata.
    2. En la lista Clusters de VM de Exadata, seleccione el cluster de VM de Exadata que esté utilizando.
    3. Seleccione el botón Gestionar en OCI, que le dirigirá a la página Clusters de VM de Exadata.
    4. Haga clic en Bases de datos y, a continuación, seleccione la base de datos que está utilizando.
    5. Seleccione el separador Información de base de datos y, a continuación, seleccione el botón Copiar para obtener la información de OCID, ya que será necesaria en la siguiente sección. También puede copiar la información del prefijo de SID de Oracle.En esta captura de pantalla se muestra cómo obtener los detalles de la base de datos de contenedores de Exadata.
    Visualización de las métricas de base de datos de contenedores de Exadata
    1. En la consola de AWS, seleccione CloudWatch.
    2. Seleccione la región del cluster de VM de Exadata.
    3. Expanda la sección Métricas y, a continuación, seleccione el enlace Todas las métricas.
    4. En la página Todas las métricas, seleccione ODB como Espacio de nombres.
    5. Pegue la información del OCID o del prefijo de SID de Oracle que ha obtenido anteriormente en el campo Buscar cualquier métrica, dimensión, ID de recurso o ID de cuenta para iniciar la búsqueda. La página Métricas mostrará los resultados relacionados.Esta captura de pantalla muestra cómo ver las métricas de la base de datos de contenedores de Exadata.
    6. Puede seleccionar dimensiones para ver las métricas respectivas como se muestra a continuación.

    Tabla 1-4 Métricas para clusters de VM de Exadata

    Métrica Descripción Unidades
    BlockChanges Este es el número medio de bloques cambiados por segundo. Cambios por segundo
    CpuUtilization Utilización de CPU expresada como porcentaje, agregada en todos los grupos de consumidores. El porcentaje de utilización se refiere al número de CPU que puede utilizar la base de datos, que es dos veces el número de OCPU. Porcentaje
    CurrentLogons Número de conexiones correctas durante el intervalo seleccionado. Recuento
    ExecuteCount Número de llamadas de usuario y recursivas que han ejecutado sentencias SQL durante el intervalo seleccionado. Recuento
    ParseCount Número de análisis ligeros o pesados durante el intervalo seleccionado. Recuento
    StorageAllocated Cantidad total de espacio de almacenamiento asignado a la base de datos en el momento de la recopilación. GB
    StorageAllocatedByTablespace Cantidad total de espacio de almacenamiento asignado al tablespace en el momento de la recopilación. En el caso de la base de datos de contenedores, esta métrica proporciona tablespaces de contenedor raíz. GB
    StorageUsed Cantidad total de espacio de almacenamiento utilizado por la base de datos en el momento de la recopilación. GB
    StorageUsedByTablespace Cantidad total de espacio de almacenamiento utilizado por el tablespace en el momento de la recopilación. En el caso de la base de datos de contenedores, esta métrica proporciona tablespaces de contenedor raíz. GB
    StorageUtilization Porcentaje de la capacidad de almacenamiento aprovisionada actualmente en uso. Representa el espacio total asignado para todos los tablespaces. Porcentaje
    StorageUtilizationByTablespace Indica el porcentaje de espacio de almacenamiento utilizado por el tablespace en el momento de la recopilación. En el caso de la base de datos de contenedores, esta métrica proporciona tablespaces de contenedor raíz. Porcentaje
    TransactionCount Número combinado de confirmaciones y rollbacks de usuario durante el intervalo seleccionado. Recuento
    UserCalls Número combinado de llamadas de conexión, análisis y ejecución durante el intervalo seleccionado.. Recuento

    Métricas de base de datos conectable

    Navegue a la consola de OCI y, a continuación, active la gestión de bases de datos (diagnóstico y gestión) para ver las métricas. Para obtener más información, consulte Activación de Database Management para una base de datos conectable.

  • Métricas de base de datos de IA autónoma

    Estos son los pasos para supervisar las métricas de la base de datos de IA autónoma.

    Obtener el nombre de la base de datos de IA autónoma o el OCID
    1. En el panel de control de Oracle AI Database@AWS, seleccione clusters de VM autónomos.
    2. En la lista Cluster de VM autónomo, seleccione el enlace Nombre de cluster de VM autónomo que está utilizando.
    3. Seleccione el botón Gestionar en OCI, que le dirigirá a la consola de OCI.
    4. En la consola de OCI, seleccione Oracle Autonomous AI Database Service on Dedicated Infrastructure y, a continuación, seleccione Bases de datos de IA autónomas que esté utilizando.
    5. En el separador Información de base de datos de IA autónoma, copie el nombre de base de datos o la información del OCID, ya que será necesaria en la siguiente sección.En esta captura de pantalla se muestra cómo ver las métricas de Autonomous AI Database.
    Visualización de las métricas de base de datos de IA autónoma
    1. En la consola de AWS, seleccione CloudWatch.
    2. Seleccione la región del cluster de VM autónomo.
    3. Expanda la sección Métricas y, a continuación, seleccione el enlace Todas las métricas.
    4. En la página Todas las métricas, seleccione ODB como Espacio de nombres.
    5. Pegue la información de OCID o nombre de base de datos que ha obtenido anteriormente en el campo Buscar cualquier métrica, dimensión, ID de recurso o ID de cuenta para iniciar la búsqueda. La página Métricas mostrará los resultados relacionados.
    6. Puede seleccionar dimensiones para ver las métricas respectivas como se muestra a continuación.En esta captura de pantalla se muestra cómo ver las métricas de Autonomous AI Database.

    En el siguiente ejemplo, se muestran las métricas relacionadas con las transacciones en Autonomous AI Database.En esta captura de pantalla se muestra cómo ver las métricas de Autonomous AI Database.

    Tabla 1-5 Métricas para

    Métrica Descripción Unidades
    BlockChanges Número medio de bloques cambiados por segundo. (Estadística: Media, Intervalo: 1 minuto) Cambios por segundo
    CPUTimeSeconds Ratio medio de acumulación de tiempo de CPU por sesiones de primer plano en la instancia de base de datos durante un intervalo de tiempo. Componente de tiempo de CPU de la media de sesiones activas. (Estadística: Media, Intervalo: 1 minuto) Segundos por segundo
    CpuUtilization Utilización de CPU expresada como porcentaje, agregada en todos los grupos de consumidores. El porcentaje de utilización se refiere al número de CPU que puede utilizar la base de datos, que es dos veces el número de OCPU. (Estadística: Media, Intervalo: 1 minuto) Porcentaje
    CurrentLogons Número de conexiones correctas durante el intervalo seleccionado. (Estadísticas: Sum, Intervalo: 1 minuto) Recuento
    DBTimeSeconds Ratio medio de acumulación de tiempo de base de datos (CPU + Espera) por sesiones de primer plano en la instancia de base de datos durante un intervalo de tiempo. También se conoce como la media de sesiones activas. (Estadística: Media, Intervalo: 1 minuto) Segundos por segundo
    ExecuteCount Número de llamadas de usuario y recursivas que han ejecutado sentencias SQL durante el intervalo seleccionado. (Estadística: Suma, Intervalo: 1 minuto) Recuento
    IOPS Número medio de operaciones de entrada-salida por segundo. (Estadística: Media, Intervalo: 1 minuto) Operaciones por segundo
    IOThroughputMB Rendimiento medio en MB por segundo. (Estadística: Media, Intervalo: 1 minuto) MB por segundo
    LogicalBlocksRead Número medio de bloques leídos desde el SGA/la memoria (caché del buffer) por segundo. (Estadística: Media, Intervalo: 1 minuto) Lecturas por Segundo
    EcpusAllocated Número real de ECPU asignadas por el servicio durante el intervalo de tiempo seleccionado. (Estadística: Recuento, Intervalo: 1 minuto) Entero
    ParseCount Número de análisis ligeros o pesados durante el intervalo seleccionado. (Estadística: Suma, Intervalo: 1 minuto) Recuento
    ParsesByType Número de análisis ligeros o pesados por segundo. (Estadística: Media, Intervalo: 1 minuto) Análisis por segundo
    RedoSizeMB Cantidad media de redo generados en MB por segundo. (Estadística: Media, Intervalo: 1 minuto) MB por segundo
    Sessions Número de sesiones de la base de datos. (Estadística: Media, Intervalo: 1 minuto) Recuento
    StorageAllocated Cantidad máxima de espacio asignada por tablespace durante el intervalo. Para las bases de datos de contenedores, esta métrica proporciona datos para los tablespaces de contenedor raíz. (Estadística: Máximo, Intervalo: 30 minutos) GB
    StorageAllocatedByTablespace Cantidad máxima de espacio asignada por tablespace durante el intervalo. Para las bases de datos de contenedores, esta métrica proporciona datos para los tablespaces de contenedor raíz. (Estadística: Máximo, Intervalo: 30 minutos) GB
    StorageUsed Cantidad máxima de espacio utilizada durante el intervalo. (Estadística: Máximo, Intervalo: 30 minutos) GB
    StorageUsedByTablespace La cantidad máxima de espacio usada por tablespace durante el intervalo. Para las bases de datos de contenedores, esta métrica proporciona datos para los tablespaces de contenedor raíz. (Estadística: Máximo, Intervalo: 30 minutos) GB
    StorageUtilization Porcentaje de la capacidad de almacenamiento aprovisionada actualmente en uso. Representa el espacio total asignado para todos los tablespaces. (Estadística: Media, Intervalo: 30 minutos) Porcentaje
    StorageUtilizationByTablespace Porcentaje del espacio utilizado por tablespace. Para las bases de datos de contenedores, esta métrica proporciona datos para los tablespaces de contenedor raíz. (Estadística: Media, Intervalo: 30 minutos) Porcentaje
    TransactionCount Número combinado de confirmaciones y rollbacks de usuario durante el intervalo seleccionado. (Estadística: Suma, Intervalo: 1 minuto) Recuento
    TransactionsByStatus Número de transacciones confirmadas o a las que se ha realizado rollback por segundo. (Estadística: Media, Intervalo: 1 minuto) Transacciones por Segundo
    UserCalls Número combinado de llamadas de conexión, análisis y ejecución durante el intervalo seleccionado. (Estadística: Suma, Intervalo: 1 minuto) Recuento

    Métricas de base de datos conectable

    Para obtener observabilidad adicional basada en OCI, puede activar Database Management (diagnóstico y gestión) en la consola de OCI. Para obtener más información, consulte Activación de Database Management para una base de datos conectable.

Creación de paneles de control en CloudWatch

Los paneles de control de Amazon CloudWatch le ofrecen una forma unificada y flexible de supervisar los recursos, las aplicaciones y los servicios de AWS en tiempo real. Puede reunir métricas, logs y alarmas clave de varias regiones y cuentas en una sola vista, lo que le ayudará a obtener estadísticas más rápidas y a mejorar la visibilidad operativa. Con widgets como gráficos de líneas, paneles numéricos e indicadores, puede realizar fácilmente un seguimiento del estado del sistema, detectar tendencias de rendimiento y supervisar la utilización de recursos. Puede diseñar paneles de control adaptados a sus flujos de trabajo, correlacionar datos entre servicios y actuar rápidamente sobre los problemas, lo que convierte a los paneles de control de CloudWatch en una herramienta clave para garantizar una alta disponibilidad y operaciones fluidas en cualquier entorno en la nube.

Puede crear paneles de control desde la consola CloudWatch o mediante programación mediante la API PutDashboard (mediante CLI o SDK). La API toma una cadena JSON que describe el diseño y los widgets del panel de control. Incluso puede reutilizar el JSON desde un panel de control existente para crear uno nuevo. Para obtener más información, consulte PutDashboard en la referencia de API CloudWatch.

Crear un panel de control desde la consola de AWS

  1. En la consola de AWS, seleccione CloudWatch.
  2. En el menú de la izquierda, seleccione Paneles de control y, a continuación, seleccione el botón Crear panel de control.
  3. Introduzca un nombre de panel de control en el campo y, a continuación, seleccione el botón Crear panel de control.
  4. En la página Agregar widget, seleccione el tipo de widget.
    1. Gráfico (área apilada/línea): seleccione Configurar y, a continuación, seleccione una o más métricas en el cuadro de diálogo Agregar gráfico de métricas. Seleccione el widget Crear.
      1. Si una métrica no aparece en la lista (por ejemplo, si no hay datos de los últimos 14 días), puede agregarla manualmente. Para obtener más información, consulte Métricas de gráficos manualmente en un panel de control CloudWatch.
  5. Seleccione Agregar widget y repita el paso 4 para agregar más widgets. Puede agregar tantas métricas como desee.
  6. Para cualquier gráfico, haga clic en el icono info para ver las descripciones de las métricas.
  7. Haga clic en la opción Guardar panel de control para guardar los cambios.

Por ejemplo, se crea un panel de control personalizado mediante las métricas de dos máquinas virtuales en un cluster de VM de Exadata. Este panel de control muestra un análisis comparativo de métricas como uso de CPU, uso de SWAP, uso de memoria y promedio de carga para las dos máquinas virtuales del cluster.Esta sección muestra el botón Acciones.

CloudWatch Alarma

En este tema se explica cómo configurar alarmas para supervisar las métricas que le notificarán o ajustarán automáticamente los recursos supervisados cuando se supere un umbral.

Una alarma de métrica supervisa una única métrica CloudWatch o el resultado de una expresión matemática basada en métricas CloudWatch. Dispara una o más acciones cuando la métrica o expresión supervisada infringe un umbral especificado en un número definido de períodos de evaluación. Estas acciones incluyen el envío de notificaciones a través de Amazon Simple Notification Service (SNS), la ejecución de acciones de escala automática o EC2 de Amazon o la creación de OpsItems o incidentes en AWS Systems Manager.

En el siguiente ejemplo, creará un tema de Amazon SNS para activar las notificaciones por correo electrónico y mensaje de texto. Cree un tema denominado AutonomousMonitor y suscríbase a la dirección de correo electrónico del trabajo para recibir notificaciones. Este tema de SNS también se utilizará más adelante al configurar alarmas CloudWatch.

  1. Cree un tema de Amazon SNS ejecutando el siguiente comando:
    aws sns create-topic --name <Name of the SNS topic>
  2. Suscríbase al tema y, a continuación, especifique el protocolo de correo electrónico y la dirección de correo electrónico para el punto final de notificación ejecutando el siguiente comando:
    aws sns subscribe --topic-arn <ARN of the SNS topic created> --protocol email --notification-endpoint <Email ID>
  3. Confirme la suscripción antes de que la dirección de correo electrónico pueda comenzar a recibir mensajes.
    1. Compruebe el correo electrónico y seleccione Confirmar suscripción en el correo electrónico que recibe de Amazon SNS.
    2. Amazon SNS abre automáticamente su navegador web y muestra una confirmación de suscripción con su ID de suscripción.
    En esta captura de pantalla se muestra un ejemplo de confirmación de suscripción con el ID de suscripción.
  4. Compruebe el estado de la suscripción. Se devolverá 1 si el estado es Confirmado.
    aws sns get-topic-attributes \
    
      --topic-arn < ARN of the topic > \
    
      --query 'Attributes.SubscriptionsConfirmed' \
    
      --output text
  5. Ahora puede crear una alarma CloudWatch en cualquiera de los widgets del panel de control. Recopile las métricas de los tres espacios de nombres: AWS/ODB. Puede utilizar la siguiente consulta para identificar las métricas disponibles en cada espacio de nombres:
    aws cloudwatch list-metrics --namespace "AWS/ODB"
  6. Seleccione cualquier métrica y utilice el siguiente código para crear una alarma CloudWatch. Asegúrese de especificar el espacio de nombres, las dimensiones y el nombre de métrica correctos. En el ejemplo siguiente se muestra cómo crear una alarma para un uso elevado de CPU cuando una base de datos supera el 60 %.
    aws cloudwatch put-metric-alarm \
    
      --alarm-name cpu_monitor_ATP \
    
      --alarm-description "Alarm when CPU exceeds 60% for ATP PDBTESTARNAB" \
    
      --metric-name CpuUtilization \
    
      --namespace AWS/ODB \
    
      --statistic Average \
    
      --period 60 \
    
      --threshold 60 \
    
      --comparison-operator GreaterThanThreshold \
    
      --dimensions Name=ociCloudAutonomousVmClusterId,Value=ocid1.cloudautonomousvmcluster.oc1.iad.anuwcljtbpyurlyac4bbp52ehggvqadbtsjeqwuiqcgah4i6mndr6swd6u2a \
    
                   Name=deploymentType,Value=Dedicated \
    
                   Name=resourceId,Value=ocid1.autonomousdatabase.oc1.iad.anuwcljtbpyurlyai6xy7kik3wdj4sz273wjg2kolfbkse6ons7v2dcte76q \
    
                   Name=cloudExadataInfrastructureId,Value=exa_e913o1khws \
    
                   Name=cloudAutonomousVmClusterId,Value=avmc_xgzshl9ela \
    
                   Name=displayName,Value="CPU Utilization" \
    
                   Name=resourceName,Value=PDBTESTARNAB \
    
                   Name=region,Value=iad \
    
                   Name=autonomousDBType,Value=ATP \
    
                   Name=ociCloudExadataInfrastructureId,Value=ocid1.cloudexadatainfrastructure.oc1.iad.anuwcljtbpyurlyazqzf3ggqwaydvu32l34izfzm4a4vnsay7b67iaedza6a \
    
      --evaluation-periods 2 \
    
      --alarm-actions arn:aws:sns:us-east-1:182399700237:AutonomousMonitor
    En esta captura de pantalla se muestra un ejemplo de la carga de trabajo que supera el uso de CPU hasta el 100 %.
  7. En la siguiente captura de pantalla se muestra el correo electrónico que recibirá.Esta captura de pantalla muestra un ejemplo del correo electrónico que recibirá.