Nota:
- Este tutorial requiere acceso a Oracle Cloud. Para registrarse para obtener una cuenta gratuita, consulte Introducción al nivel gratuito de Oracle Cloud Infrastructure.
- Utiliza valores de ejemplo para las credenciales, el arrendamiento y los compartimentos de Oracle Cloud Infrastructure. Al finalizar el laboratorio, sustituya estos valores por otros específicos de su entorno en la nube.
Gestionar el uso de discos de VM mediante la supervisión de pila
Introducción
Una de las principales responsabilidades de un administrador de la nube es gestionar y supervisar los recursos desplegados en los entornos de organización. Para todo tipo de cargas de trabajo, es necesario supervisar el estado de los recursos y los cambios de vez en cuando y garantizar que todas las cargas de trabajo estén en verde, en buen estado y en ejecución.
En las instancias informáticas, el almacenamiento desempeña un papel fundamental en términos de estabilidad de la aplicación, ejecución y almacenamiento de los datos de la aplicación, usuarios en archivos de base de datos, etc. Es importante que un administrador controle y gestione el almacenamiento de cada volumen o disco asociado a la instancia informática para mitigar los bloqueos de la aplicación, el tiempo de inactividad y la pérdida de datos de los usuarios y las organizaciones.
El control de pila es uno de los servicios ofrecidos para controlar las instancias informáticas en Oracle Cloud Infrastructure (OCI) en Observability and Management para la infraestructura desplegada en el arrendamiento de OCI. Stack Monitoring no solo permite el almacenamiento de cada disco, sino también de los sistemas de archivos creados en cada volumen asociado a las instancias informáticas. Además del almacenamiento, la supervisión de pila proporciona métricas sobre disponibilidad, CPU, memoria y actividad en disco + paginación de las instancias informáticas.
Funciones de supervisión de pila
La supervisión de pila proporciona las herramientas necesarias para alertar e identificar rápidamente problemas, como que un sistema de archivos se quede sin espacio en disco o con un uso elevado de la CPU. El control de pilas proporciona una mayor visibilidad del estado y el estado de disponibilidad de las instancias informáticas. También proporciona un panel de control de vista compilada de todos los recursos que se están supervisando. Con la supervisión de pila, puede:
- Identifique rápidamente problemas de rendimiento como la sobreutilización de sistemas de archivos de memoria, CPU o discos mediante los gráficos y tablas.
- Revise fácilmente el uso del sistema de archivos en todos los puntos de montaje mediante tablas. Proporciona una vista detallada de cualquier alarma abierta para los recursos que se están supervisando.
- Obtenga acceso rápido a información crítica, como la versión del sistema operativo, un resumen de las alarmas abiertas por gravedad y detalles sobre la fecha y la hora del último cambio de estado para el host.
- Ver todas las dimensiones y valores de una métrica determinada de las tablas de control de pila. Esta información es útil para revisar el uso del sistema de archivos en GB para todos los sistemas de archivos de un host sin necesidad de iniciar sesión en el host.
- Comprender la actividad del disco para un indicador de cuán ocupado está un host. Disk Activity Summary informa el número de operaciones de lectura, escritura y total por segundo para todos los discos de un host.
Objetivo
Descubra cómo gestionar el uso del disco de máquina virtual mediante la supervisión de pila.
Requisitos
-
Cree o designe un compartimento para utilizarlo:
Puede crear un nuevo compartimento o utilizar uno existente para instalar y configurar el servicio de supervisión de pila. Para obtener información sobre compartimentos, consulte Gestión de compartimentos.
Al designar un compartimento de supervisión, asegúrese de utilizar el mismo compartimento para sus agentes, así como los recursos nativos de OCI (por ejemplo, bases de datos, instancias informáticas). Si los recursos están en diferentes compartimentos, mueva los recursos al mismo compartimento de los agentes de supervisión de pila.
-
Cree un grupo dinámico de todos los agentes de gestión:
Para interactuar con los puntos finales de servicio de OCI, debe crear explícitamente un grupo dinámico para permitir que los agentes de gestión se comuniquen con el servicio de agente de gestión (MACS). Para crear un grupo dinámico, realice los siguientes pasos:
-
En Identidad y seguridad, vaya a Identidad y haga clic en Grupos dinámicos.
-
Haga clic en Crear grupo dinámico.
-
En el cuadro de diálogo Crear grupo dinámico, introduzca un nombre para el grupo dinámico, una descripción y las reglas de coincidencia y, a continuación, haga clic en Crear grupo dinámico.
Por ejemplo, cree un grupo dinámico denominado "Demo_DyanmicGroup_For_MonitoringAgent" con los siguientes detalles en RULE 1:
ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
-
-
Cree una política en el grupo dinámico:
Debe crear las siguientes políticas para permitir que los agentes de gestión interactúen con el servicio de agente de gestión y que los agentes de gestión puedan cargar datos.
-
Política 1:
ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent >TO USE METRICS IN COMPARTMENT <compartment_name> where target.metrics.namespace = 'oracle_appmgmt'
Descripción: permita al agente cargar métricas en Telemetry en el espacio de nombres 'oracle_appmgmt'. Aquí, Management_Agent_Dynamic_Group es un grupo dinámico de agentes de gestión en un compartimento.
-
Política 2:
ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent> TO {STACK_MONITORING_DISCOVERY_JOB_RESULT_SUBMIT} IN COMPARTMENT <compartment_name>
`Descripción: permita al agente cargar datos en el servicio de detección. Aquí, Management_Agent_Dynamic_Group es un grupo dinámico de agentes de gestión en un compartimento.
Nota: Puede omitir los requisitos previos 4 y 5 si tiene privilegios de administrador en el arrendamiento. Los siguientes pasos se deben seguir si el administrador desea crear usuarios para gestionar solo la supervisión de pila específicamente.
-
-
Cree usuarios y grupos:
Como práctica recomendada, cree usuarios y grupos independientes para gestionar las operaciones relacionadas con la supervisión de pila. Sin embargo, el grupo de administradores y sus usuarios tendrán los privilegios necesarios por defecto. Los usuarios y los grupos de control de pila se crean mediante el servicio Identity and Access Management (IAM) de Oracle Cloud Infrastructure. Para obtener información sobre la creación y la gestión de usuarios y grupos mediante el servicio Identity and Access Management (IAM), consulte Gestión de usuarios y Gestión de grupos. Cree los siguientes grupos de usuarios necesarios para la supervisión de pila.
Grupo Descripción StackMonitoringAdminGrp Grupo para usuarios que realizan operaciones relacionadas con administradores/operadores. -
Crear políticas necesarias:
Las políticas de control de pila se crean mediante las políticas de Identity and Access Management (IAM). En este tutorial se proporcionan ejemplos específicos para configurar su arrendamiento con el fin de aprovechar la supervisión de pila. Para obtener información general sobre las políticas de OCI, consulte Introducción a las políticas.
Creación de políticas para operaciones administrativas
A continuación se muestra la lista de políticas que se van a definir para permitir a los usuarios que pueden realizar operaciones de administración, es decir, los usuarios que pertenecen al grupo
StackMonitoringAdminGrp
.-
Política 1:
ALLOW GROUP StackMonitoringAdminGrp TO MANAGE stack-monitoring-family IN COMPARTMENT <compartment_name>
Descripción: permita a los usuarios del grupo
StackMonitoringAdminGrp
realizar operaciones de administración en un compartimento. -
Política 2:
ALLOW GROUP StackMonitoringAdminGrp TO {MGMT_AGENT_DEPLOY_PLUGIN_CREATE, MGMT_AGENT_INSPECT, MGMT_AGENT_READ} IN COMPARTMENT <compartment_name>
Descripción: permita a los usuarios del grupo
StackMonitoringAdminGrp
mostrar/le a los agentes y desplegar el plugin de agente de gestión de supervisión de pila durante la detección de recursos cuando el agente de gestión no tenga el plugin todavía en el ámbito del compartimento. -
Política 3:
ALLOW GROUP StackMonitoringAdminGrp TO READ metrics IN COMPARTMENT <compartment_name>
Descripción: permita a los usuarios del grupo
StackMonitoringAdminGrp
leer métricas en un compartimento. -
Política 4:
ALLOW GROUP StackMonitoringAdminGrp to READ instances IN COMPARTMENT<compartment_name>
Descripción: permita a los usuarios del grupo
StackMonitoringAdminGrp
leer instancias de un compartimento. -
Política 5:
ALLOW GROUP StackMonitoringAdminGrp to MANAGE external-database-family IN COMPARTMENT <compartment_name>
Descripción: permita a los usuarios del grupo
StackMonitoringAdminGrp
gestionar bases de datos externas en un compartimento. -
Política 6:
ALLOW GROUP StackMonitoringAdminGrp to MANAGE alarms IN COMPARTMENT<compartment_name>
Descripción: permita a los usuarios del grupo
StackMonitoringAdminGrp
gestionar alarmas en un compartimento. -
Política 7:
ALLOW GROUP StackMonitoringAdminGrp to USE ons-topics IN COMPARTMENT <compartment_name>
Descripción: permita a los usuarios de
StackMonitoringAdminGrp
mostrar, crear, actualizar, suprimir y mover suscripciones para temas del arrendamiento.
-
Tarea 1: Instalación de agentes de gestión
Debe instalar el plugin del agente de gestión, ya que es necesario para utilizar el servicio de supervisión de pila.
-
Conéctese a la consola de Oracle Cloud, en el menú de navegación, haga clic en Recursos informáticos y, a continuación, haga clic en Instancias.
-
Haga clic en la instancia en la que esté interesado.
-
Haga clic en el separador Oracle Cloud Agent. Aparecerá la lista de plugins.
-
Alterne el conmutador Activado para el plugin de Management Agent.
Una vez activado el agente, tardará entre 10 y 15 minutos en cambiar al estado de ejecución.
Tarea 2: Verificación del ID del agente de supervisión
-
Conéctese a la consola de Oracle Cloud, en el menú de navegación, haga clic en Observación y gestión.
-
Seleccione Servicio del agente de gestión.
-
Seleccione el compartimento en la lista desplegable Compartimento y verá la lista de agentes, que están activados para sus respectivas instancias informáticas.
-
Seleccione el agente para la instancia informática asociada para la que desea activar la supervisión de pila y observe el "ID de agente" de la supervisión para el uso futuro.
Tarea 3: Ejecución del trabajo Detección de supervisión de pila
El paso final es ejecutar el trabajo de detección promoviendo instancias informáticas de OCI. Puede supervisar una instancia informática de forma más exhaustiva y obtener estadísticas sobre los recursos que está utilizando. Para este paso, debe abrir un shell en la nube en el portal de OCI.
-
Haga clic en OCI Cloud Shell desde la página inicial y se muestra la siguiente ventana. Además, también puede realizar el paso en un dispositivo con la CLI de OCI instalada.
-
Verifique la versión de la CLI de OCI mediante el comando
oci –version
. Los comandos de supervisión de pila se ejecutarán en la CLI de OCI 3.XX o superior. -
Cree un archivo JSON denominado
parameters.json
en el shell en la nube en cualquier directorio. Copie el JSON proporcionado a continuación y sustituya "", " ", " " por sus respectivos parámetros. Los detalles de los parámetros que se van a cambiar se proporcionan en la tabla "Parámetros de entrada de JSON": { "discoveryType": "ADD", "discoveryClient": "host-discovery", "compartmentId": "<Compartment-ID>", "discoveryDetails": { "agentId": "<Agent-ID>", "resourceType": "HOST", "resourceName": "<HostName or IP Address>", "properties": { "propertiesMap": {} } } }
Parámetros de entrada JSON
Campo de entrada Descripción compartmentId OCID de compartimento donde reside la instancia informática. agentId OCID del agente de gestión que supervisa el recurso. resourceName Nombre de dominio totalmente cualificado (FQDN) del host en la supervisión de pila. -
Después de guardar el archivo JSON anterior, ejecute el siguiente comando sustituyendo el parámetro
<path_to_JSON_file>
por la ruta de acceso real del archivo JSON que se creó en el paso anterior. Puede utilizar el comandopwd
para obtener la ruta de acceso al archivo JSON.oci stack-monitoring discovery-job create --compartment-id "your-compartment-id" --from-json file://< path_to_JSON_file>
-
El proceso puede tardar entre 5 y 10 minutos en completarse y, una vez que refresque el portal de OCI, podrá ver la supervisión de pila activada y el panel de control completo en la página Supervisión de pila. Después de la promoción, el tipo de recurso de la instancia informática es un host.
-
Compruebe el estado del trabajo de promoción en Detección de recursos para verificar que se han detectado los recursos correctamente.
-
En el panel de control de supervisión de pila, seleccione el bloque de recursos y verá una lista de instancias informáticas y hosts para los que ha activado la supervisión.
-
Seleccione el host deseado de la lista y se le presentará la vista detallada de las métricas y tablas mostradas para ese host concreto.
La información y las métricas del host se muestran como gráficos y tablas en la página de detalles del recurso.
Puede elegir el sistema de archivos utilizado (GB) y el uso del sistema de archivos (%) para obtener información más específica sobre el almacenamiento presente en el host. La vista de tabla proporciona todas las métricas en un estilo/formato de tabla.
Una vez que seleccione la información específica de las instancias, se mostrará tanto en porcentaje como en almacenamiento en GB. Cada uno de los sistemas de archivos presentados en la máquina host se representará con los puntos de montaje en formato de tabla.
Tarea 4: Activar alarmas
-
Una vez que las métricas se muestren en la página Detalles de recursos de los hosts, para obtener una alerta para métricas específicas, vaya a Observabilidad y gestión, Supervisión, Estado de alarma.
-
Haga clic en Crear alarma y, a continuación, escriba el nombre y la gravedad de la alarma. Seleccione el compartimento de host, el espacio de nombres "oracle appmgmt, el host de grupo de recursos y puede seleccionar el nombre de métrica en la lista desplegable.
-
Según el requisito, seleccione la métrica Filesystem Used (Sistema de archivos) o Filesystem Utilization (Uso del sistema de archivos), el período de intervalo y la estadística.
-
Después de seleccionar las métricas, seleccione la dimensión de métrica.
• Para especificar un host específico, seleccione "agentHostName" y, a continuación, elija el valor de dimensión para el host en el menú desplegable.
• A continuación, haga clic en Dimensión adicional, seleccione "fileSystemName" y, a continuación, elija el valor de dimensión para el punto de montaje para el que desea disparar una alerta en la lista.
-
En la regla de disparador de sección, defina la condición para poner la alarma en estado de activación. Por ejemplo, para agentHostName - "XXXX" y "fileSystemName" - "/Dev" con estadísticas - "media". Si el almacenamiento del sistema de archivos alcanza más del 90%, active una alerta "storage full".
-
Seleccione el servicio de destino - Notificación y el tema en el que ha especificado la dirección de correo electrónico que desea recibir alertas para esta alarma específica en la sección Definir notificaciones de alarma. Para obtener más información sobre la notificación y la creación del tema, haga clic aquí.
-
Además, también puede seleccionar el formato de mensaje para obtener un mejor formato de alerta. Active la casilla de control Repetir notificación si desea recibir alertas continuas para las mismas métricas.
-
Guarde la alarma.
-
Una vez que la regla definida coincida con la métrica, se disparará la alarma y, a continuación, se muestra la captura de pantalla de ejemplo de una alarma de métrica:
Puede utilizar las métricas avanzadas que proporcionan las capacidades de control y alarmas de pila de OCI para supervisar la infraestructura informática, especialmente en el sector del almacenamiento. También puede explorar más funciones de supervisión de pila para diferentes servicios.
Enlaces relacionados
Agradecimientos
- Autores: Akarsha I K (arquitecto de nube), Maninder Flora (arquitecto de nube)
Más recursos de aprendizaje
Explore otros laboratorios en docs.oracle.com/learn o acceda a más contenido de aprendizaje gratuito en el canal YouTube de Oracle Learning. Además, visite education.oracle.com/learning-explorer para convertirse en un explorador de Oracle Learning.
Para obtener documentación sobre los productos, visite Oracle Help Center.
Manage VM disk utilization using Stack Monitoring
F75078-01
December 2022
Copyright © 2022, Oracle and/or its affiliates.