Solución de problemas de Management Agent Service

En esta sección se tratan algunos problemas y resoluciones típicos relacionados con el servicio de agentes de gestión, como la instalación y la desinstalación con agentes de gestión y gateways de gestión.

Temas:

Solucionar problemas de instalación y configuración de agentes de gestión

Los usuarios pueden encontrar varios errores durante el proceso de configuración e instalación de Oracle Management Agent. A continuación se muestran las causas y las acciones recomendadas para algunos errores comunes.

Solución de problemas: desinstale el agente y elimine el archivo de servicio antes de instalar el nuevo agente.

Causa: Ya hay un agente instalado en el host. Un proceso de desinstalación anterior no ha eliminado correctamente el archivo de servicio del agente.

Acción:
  • Ejecute rpm -e oracle.mgmt_agent para desinstalar el agente. Si el comando se ejecuta correctamente, intente instalar el nuevo agente. Si el comando no funciona, pruebe la siguiente acción recomendada.
  • Ejecute ls /opt/oracle/mgmt_agent para comprobar si tiene elementos residuales de la instalación del agente anterior. Si lo encuentra, suprímalo ejecutando: rm -rf /opt/oracle/mgmt_agent.
  • Compruebe si ya tiene un archivo de servicio de agente en la siguiente ubicación según la versión de Linux:
    • Para OL7 (si utiliza systemd): /etc/systemd/system/mgmt_agent.service
    • Para OL6 (si utiliza init): /etc/init/mgmt_agent.conf.

      Si encuentra que tiene este archivo de servicio, elimínelo ejecutando: rm -rf /etc/init/mgmt_agent.conf y vuelva a intentar instalar el nuevo agente.

Solución de problemas: Java no es una JVM de 64 bits. Defina la ruta de una JVM de 64 bits en la variable de entorno JAVA_HOME o No se ha encontrado Java. Defina la ruta preferida en JAVA_HOME.

Causa: la variable de entorno JAVA_HOME no está definida o no apunta a una ubicación de JDK de 64 bits.

Acción: defina la variable de entorno JAVA_HOME en la versión de JDK correcta y vuelva a intentar instalar el agente. Actualmente, solo está soportado el JDK de 64 bits.

Solución de problemas: fallo en la instalación del agente con el mensaje: useradd: No se puede obtener un GID único (no hay más GID disponibles)

Causa: El script de instalación no puede agregar un usuario y un grupo durante el proceso de instalación del agente de gestión porque los ID de grupo disponibles en el sistema Linux ya están en uso.

Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent) 
useradd: Can't get unique GID (no more available GIDs) 
useradd: can't create group 
Agent installation failed, please check log file

Acción: Consulte al administrador del sistema antes de continuar con lo siguiente:

  1. Edite el archivo /etc/login.defs. Necesita privilegios sudo para editar el archivo.

    Busque las siguientes entradas:
    SYS_GID_MIN               nnnn
    SYS_GID_MAX               mmmm
    SYS_UID_MIN               pppp
    SYS_UID_MAX               qqqq
    Donde nnnn y pppp son el valor mínimo y mmmm y qqqq son el valor máximo.

    Si en el archivo no existen las entradas anteriores, agréguelas.

  2. Actualice el valor de la entrada SYS_GID_MAX según la recomendación del administrador del sistema y guarde el archivo.

  3. Elimine la instalación del agente con fallos ejecutando: sudo rpm -e oracle.mgmt_agent.

  4. Cierre de sesión del shell seguido de inicio de sesión.

  5. Vuelva a intentar realizar la instalación del agente.

Solución de problemas: useradd: no se puede crear el directorio /usr/share/mgmt_agent

Durante la instalación de Management Agent, el usuario mgmt_agent se crea con la ubicación del directorio raíz por defecto en /usr/share/mgmt_agent.

Causa: No hay suficientes permisos de archivo en /usr/share o el sistema de archivos es de solo lectura.

Acciones posibles:

  • Defina permisos de archivo para proporcionar al usuario mgmt_agent acceso a la ubicación del directorio raíz del usuario por defecto: /usr/share.

  • Defina una ubicación de directorio raíz diferente mediante la variable de entorno USER_HOME_DIR_ROOT si desea utilizar una ubicación diferente.

    Defina la variable de entorno USER_HOME_DIR_ROOT con la ruta que prefiere utilizar como directorio raíz para el usuario mgmt_agent y asegúrese de que el usuario del agente de gestión tiene los permisos de archivo correctos en ese directorio preferido.

Solución de problemas: Windows: el sistema no ha encontrado la ruta de acceso especificada. Fallo de instalación del agente.

NIVEL DE ERROR=9009

Causa posible: las variables de entorno no se han definido correctamente debido a espacios en el nombre de directorio/carpeta.

Los entornos de Windows permiten utilizar espacios dentro de un nombre de directorio/carpeta que provoca un problema con la instalación del agente de gestión, ya que Windows agrega comillas al nombre automáticamente. Por ejemplo, hay un directorio/carpeta denominado: Program Files. En este caso, Windows inserta comillas automáticamente, ya que hay un espacio dentro del nombre de la carpeta y ahora dirá: "Program Files".

Las comillas adicionales pueden causar un problema, ya que el instalador del agente de gestión no permite comillas para variables de entorno como JAVA_HOME y AGENT_INSTALL_BASEDIR.

Nota

El instalador del agente de gestión no acepta los siguientes caracteres especiales en la ruta: [, ^^, ", ', & o ].

Acción:

La forma recomendada de configurar variables de entorno en Windows es mediante Configuración avanzada del sistema.
  • En la barra de tareas de Windows, haga clic con el botón derecho en el icono Windows y seleccione Sistema.
  • En la ventana Configuración, en Configuración relacionada, haga clic en Configuración avanzada del sistema.

    Configuración avanzada de Windows

  • En el separador Opciones avanzadas, haga clic en Variables de entorno.

    Variables de entorno de Windows

  • Haga clic en Nuevo para crear una nueva variable de entorno. Haga clic en Editar para modificar una variable de entorno existente.
  • Después de crear o modificar la variable de entorno, haga clic en Aplicar y, a continuación, en Aceptar para que el cambio surta efecto.
    Nota

    La interfaz gráfica de usuario para crear variables de entorno puede variar ligeramente, según la versión de Windows.

Solución de problemas: el estado de Management Agent es "No disponible" en la consola después de la instalación inicial

Causa posible 1: registro de hora del sistema incorrecto

Acción: Verifique la hora del sistema del host del agente y, a continuación, puede corregir la hora si es necesario.

Causa posible 2: si utiliza el archivo de respuesta input.rsp para Management Agent, debe definir las etiquetas para el compartimento Management Agent.

Si las etiquetas no están definidas, puede que aparezca un error como este:

Attempts:
<--> Endpoint:       management-agent.us-ashburn-1.oci.oraclecloud.com
     opc-request-id: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXJ8
     StartTime:      2024-09-18 03:45:12,662 GMT
     Status:         400 Bad Request
     Headers:        Strict-Transport-Security=max-age=31536000; includeSubDomains;
                     Connection=close
                     Content-Length=63
                     opc-request-id=XXXXXXXXXXXXXXXXXXXXXXXX..................B25ADA8E
                     Date=Wed, 18 Sep 2024 03:45:12 GMT
                     Content-Type=application/json
     ErrorBody:      
{
  "code" : "InvalidParameter",
  "message" : "Invalid tags"
}

Acción: para definir las etiquetas específicas para el entorno, en el archivo de respuesta input.rsp, agregue los siguientes parámetros y especifique los pares clave-valor para el entorno. Para obtener más información, consulte Creación de un archivo de respuesta.

DefinedTags = [{"namespace1":{"<key1>":"<value1>"}},
      {"namespace2":{"<key2>":"<value2>"}}]

Solución de problemas: después de la configuración, Management Agent no está visible en la consola ni a través de la API

Causa posible: si después de configurar el agente de gestión o el agente de gateway de gestión el agente no se muestra en la consola de Oracle Cloud o a través de la API, puede que no se configuren las políticas correctas para el usuario o el grupo de usuarios.

Acción: verifique que el usuario o el grupo de usuarios tiene las políticas necesarias configuradas para el agente de gestión o el agente de gateway. Para configurar políticas, consulte Creación de políticas para grupos de usuarios.

Solución de problemas: las métricas de Prometheus o Kubernetes supervisadas mediante Management Agent no están disponibles

Causas posibles: Management Agent no necesita políticas o grupos dinámicos para sus propias métricas, sino para las métricas de Prometheus y Kubernetes. El usuario debe definir un grupo dinámico y una política que permita a los agentes de ese grupo dinámico publicar métricas en OCI Monitoring. Si las métricas no se muestran en el compartimento o en el espacio de nombres de OCI Monitoring, puede comprobar las políticas y el grupo dinámico.
  • a) Faltan políticas

    Acción: Verifique que las políticas se agreguen a Management Agent como se describe en las instrucciones de configuración. Para obtener detalles, consulte Configuración de Oracle Cloud Infrastructure para el servicio del agente de gestión.

    Si faltan las políticas, agréguelas como se describe en Configuración de Oracle Cloud Infrastructure para Management Agent Service.

  • (b) Errores tipográficos en las políticas

    Acción: Revise la sintaxis de políticas para detectar errores comparándolos con los ejemplos de políticas. Para obtener detalles, consulte Configuración de Oracle Cloud Infrastructure para el servicio del agente de gestión.

    Por ejemplo, asegúrese de que la definición de grupo dinámico esté definida correctamente según la siguiente sintaxis con los caracteres de comillas simples correctos alrededor del ID de compartimento y el tipo de recurso managementagent:

    ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
  • (c) ID de compartimento incorrecto en la definición de grupo dinámico

    Acción: Verifique que el ID de compartimento de clave de instalación es el mismo que el ID de compartimento especificado en la definición de grupo dinámico del agente. Por defecto, el agente se crea en el compartimento de la clave de instalación.

Solución de problemas: el agente se ejecuta en OutOfMemoryException

Causa posible: el agente puede quedarse sin memoria de pila si no se ha ajustado correctamente para soportar la carga que se le ha asignado.

Acción: actualice la configuración de memoria de pila para el agente de gestión.

La configuración lista para usar para la pila máxima del agente es:
  • 128 MB para Management Agent como plugin de OCA.
  • 512 MB para el agente de gestión independiente. (El descargado de la consola del agente de gestión).
El usuario puede actualizar y asignar más pila al agente realizando lo siguiente:
  • Abrir archivo: agent_inst/config/java.options.
  • Edite el archivo anterior. Actualice la configuración de pila modificando la siguiente línea: -Xmx512m

    Por ejemplo: la línea anterior define la pila máxima para el agente en 512 MB.

    Para cambiar la pila a 800 MB, actualice la línea anterior para que sea: -Xmx800m

  • Guarde el archivo y reinicie el agente para que se apliquen los cambios.

Solución de problemas: OCI Management Agent no se inicia en un host de Windows

Causa posible: si el agente se inicia y falla con el siguiente error, puede deberse a un fallo en la actualización automática del agente de gestión. Es posible que vea los siguientes errores.

C:\Oracle\mgmt_agent\agent_inst\log>NET START mgmt_agent
The Oracle Management Agent service is starting...................
The Oracle Management Agent service could not be started.

A service specific error occurred: 1.

More help is available by typing NET HELPMSG 3547.

En este archivo log, C:\Oracle\mgmt_agent\agent_inst\log\mgmt_agent.log puede ver el siguiente error.

[SysExecutor.0 (PrometheusEmitter.Agent-discovery)-131] INFO - DiscoveryItemTask PrometheusEmitter.Agent-discovery - autoPromote
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Cleaning up old files...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - On windows, skipping file owner check
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Starting agent upgrade from version [231002.2039] to version [231002.2040]...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Inserted RequestSigner associated with request SigningRequester[get([])] for signingKey:SigningKey[xxxxxxxxxxxx]
[SysExecutor.1 (ManagedAgent upgradechecker)-133] INFO - Package Stream size:99003892
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully unzipped agent upgrade package at: 
C:\Oracle\mgmt_agent\zip\unpack
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully copied C:\Oracle\mgmt_agent\agent_inst\bin\agentUpgrader.bat to 
C:\Oracle\mgmt_agent\agent_inst\bin\tmpAgentUpgrader.bat
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully deleted previous wrapper backup file:
C:\Oracle\mgmt_agent\agent_inst\config\wrapper.conf.backedUpForUpgrade
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Backed up wrapper.conf to attempt agent upgrade
[SysExecutor.1 (ManagedAgentupgrade checker)-133] INFO - Built macros for processing wrapper.conf as:{%SERVICE_TYPE%=mgmt_agent,%JAVA_HOME%=c:\Program 
Files\Java\jre-1.8,%EMSTATE%=C:\Oracle\mgmt_agent\agent_inst, %CORE_JAR%=agent-upgrader-1.0.3235.jar,%VERSION%=231002.2039, 
%ORACLE_HOME%=C:\Oracle\mgmt_agent\231002.2039}
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Processed wrapper.conf.template to point it to agent upgrader
[SysExecutor.1(ManagedAgent upgrade checker)-133] INFO - Exiting for wrapper to spin up the agent upgrader...

Acción: para solucionar el problema:

  1. Detenga Management Agent en el host de Windows y, a continuación, introduzca los siguientes comandos:
    NET STOP mgmt_agent
    cd C:\Oracle\mgmt_agent\agent_inst\config
    Backup wrapper.conf
    Rename wrapper.conf.backedUpForUpgrade to wrapper.conf
  2. Inicia Management Agent Service.
  3. Actualice Management Agent; consulte Windows Manual Upgrade.

Ahora, después de la actualización, el agente se muestra como activo en Observability & Management.

Solución de problemas: el cambio de versión automático de Management Agent no funciona u omitió algunos agentes

Causa posible: si el cambio de versión automático de OCI Management Agent no funciona para algunos de los agentes de gestión, es posible que el cambio de versión automático de Management Agent haya dejado de funcionar porque algunos de los archivos o directorios eran propiedad de propietarios no válidos en el sistema de archivos del agente.

Por ejemplo, si algunos de los archivos o directorios de la siguiente ubicación no tenían los permisos correctos, la actualización automática del agente no funcionó: /opt/oracle/mgmt_agent/agent_inst.

En este archivo log, puede encontrar el siguiente error: /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log

ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/db00_cred.json,
/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.backup]
(ManagedAgent upgrade checker)-32] WARN - Files with invalid owners were found, skipping auto-upgrade

Acción: en el host del agente de gestión, confirme en el sistema de archivos del agente que todos los archivos y directorios son propiedad del propietario mgmt_agent y del grupo mgmt_agent:mgmt_agent para que se pueda completar la actualización automática del agente de gestión.

Solución de problemas: la dirección IP se muestra en la columna de host cuando Management Agent está instalado en el host de Windows

Problema: Management Agent está instalado en un host de Windows y la consola de Management Agent muestra la dirección IP del host de Windows en la consola de Oracle Cloud en lugar de mostrar el nombre de dominio completo o el nombre de host de Windows.

Acción:
  1. Inicie sesión en el host de Windows y abra el panel de control.
  2. Seleccione Sistema y seguridad y, a continuación, seleccione Sistema.
  3. Vaya a la sección Configuración de nombre de equipo, dominio y grupo de trabajo y, a continuación, haga clic en Cambiar configuración.

    Se muestra la ventana Propiedades del sistema.

  4. Si no está seleccionado, haga clic en Nombre de la computadora.
  5. Vaya al siguiente mensaje: Para cambiar el nombre de esta computadora o su dominio o grupo de trabajo, haga clic en Cambiar.
  6. Seleccione Cambiar, se muestra una ventana Cambios de dominio/nombre de equipo.

    Por ejemplo, si el FQDN del host de Windows es: FOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.com, introduzca el nombre de host de Windows cortoFOOBAR004 en el cuadro de texto Nombre de equipo.

  7. Seleccione Más, se muestra la ventana Sufijo de DNS y NetBIOS Nombre de equipo.
  8. En el cuadro de texto Sufijo de DNS principal de este equipo, introduzca el nombre de DNS del host de Windows.

    Por ejemplo: subnet1ab2regsu.exampletenantreg1.abcvcn.com

  9. Seleccione Aceptar o Aplicar y, a continuación, cierre todas las ventanas abiertas.
  10. Reinicie el host de Windows.
  11. Desinstale el agente de gestión existente ejecutando el script uninstaller.bat desde el terminal de Windows.
  12. Ahora vuelva a instalar Management Agent en la máquina de Windows.

La instalación del agente de gestión se debe realizar correctamente y, en la página Agente, el FQDN del host de Windows se mostrará en la columna de host.

Solución de problemas: la instalación de Management Agent falla en SELinux al utilizar un volumen externo

El servicio de agente no se inicia después de ejecutar la instalación, lo que da como resultado un agente que no funciona y que muestra los siguientes mensajes:
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
Para confirmar, compruebe los logs del gestor de servicios para ver los detalles del error.
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Además, compruebe los logs de auditoría.
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc:  denied  { read open } for  pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0           tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0

Todos los mensajes de error anteriores indican que SELinux no permite ejecutar comandos en la carpeta seleccionada.

Acción: póngase en contacto con el administrador del sistema y cree las políticas necesarias que permitan instalar y ejecutar Management Agent.

Solución de problemas: falla la instalación de Management Agent en Red Hat Enterprise Linux 9.x

La instalación de Management Agent falla y puede aparecer el siguiente mensaje de error: mgmt_agent service creation failed. Reason: Detected Linux .

Además, los mensajes del log de fallos de instalación pueden confirmar el error e indicar que los intentos de configuración utilizan un gestor de servicios incorrecto para instalar el agente.

Causa: Red Hat ha eliminado el paquete chkconfig de la distribución Red Hat Enterprise Linux (RHEL) 9. Para obtener más información, consulte la base de conocimientos de Red Hat.

Acción:

Verificar el problema
  1. Confirme que el entorno utiliza Red Hat Enterprise Linux 9.x ejecutando el siguiente comando:
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. Los siguientes mensajes resaltan el problema de que el sistema operativo/familia no se identificó correctamente mediante las reglas presentes en la secuencia de comandos de Agentcore y la instalación intentará configurar el servicio de agente mediante init.d y no systemctl en RHEL 9x.
    $ rpm -ivh oracle.mgmt_agent.231118.1208.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous agent service exists
    Checking if OS has systemd or initd
    Checking available disk space for agent install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the agent will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_agent-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_agent' daemon
    mgmt_agent service creation failed. Reason: Detected Linux:
    Installing the mgmt_agent daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_agent': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_agent-231118.1208-1.x86_64) scriptlet failed, exit status 1
  3. Verifique que falta el paquete chkconfig, como se describe en el siguiente artículo de la base de conocimientos de Red Hat.

Solución 1: instale el paquete chkconfig

  1. Instale el paquete que falta ejecutando el siguiente comando:
    $ dnf install chkconfig
  2. Compruebe que el paquete existe en el entorno ejecutando el siguiente comando:
    $ rpm -qa | grep chkconfig
  3. Vuelva a instalar Management Agent.

Solución 2: sin instalar el paquete chkconfig

Nota

Esta es una solución alternativa. Utilice esta solución solo si no se puede instalar el paquete chkconfig. La solución recomendada es instalar el paquete chkconfig.

Si la instalación del paquete chkconfig no es una opción como se describe en la sección anterior de la solución 1, complete los siguientes pasos como solución alternativa para instalar el software del agente de gestión.

Use los siguientes comandos para:
  1. Cambie a un shell raíz.
  2. Defina la variable de entorno DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Instale el software Management Agent.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Solución de problemas: Fallo al instalar el agente de gestión en Linux; se esperaba que el valor RUN_AGENT_AS_USER fuera raíz

Si instala el agente y aparece el siguiente error, debe cambiar los permisos para el usuario que instala el agente.

rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpm
Preparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is root
Current user group is rootroot is not the default user, checking if required environment variables are set
RUN_AGENT_AS_USER=mgmt_agent contains an unexpected value
Expected RUN_AGENT_AS_USER value to be root, exiting
error: %pre(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
error: oracle.mgmt_agent-240229.1733-1.x86_64: install failed

Solución:

  1. Defina la variable de entorno RUN_AGENT_AS_USER en root agregando lo siguiente a la configuración de entorno:
    export RUN_AGENT_AS_USER=root
    export AGENT_USER_GROUP=<OS_primary_group_of_selected_OS_user>
  2. Instale el agente con el siguiente comando:
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

    Para obtener más información, consulte Uso de un usuario del sistema operativo no predeterminado para instalar el agente de gestión.

Resolución de problemas: no se pudo acceder al script mediante una ruta absoluta. Permisos insuficientes

Si encuentra el siguiente error, puede cambiar los permisos para solucionar este problema.

Copying files to destination dir (/opt/oracle/mgmt_agent)Initializing software from templateChecking if JavaScript engine is available to useCreating mgmt_agent daemonmgmt_agent service creation failed. Reason: Failed to access the script using an
        absolute path. Insufficient permissions may prevent the user "mgmt_agent" from traversing
        one of the folders. Please check the following permissions

Solución: puede configurar el directorio /opt/oralce con 755 permisos para permitir el acceso al instalador del agente.

Solución de problemas: fallo del intento de registro en la nube con el estado HTTP 407, credenciales incorrectas de Gateway Server

Si instala Management Agent y CloudRegistrationStep falla con el siguiente error HTTP Status 407 , puede ser el resultado de credenciales GatewayServerUser o GatewayServerPassword incorrectas.

CloudRegistrationStep: The registration attempt failed with HTTP Status 407
Additional details are available in the configure logs at /opt/oracle/mgmt_agent/configure-logs 

Solución: genere una nueva clave de respuesta con la GatewayServerUser y la GatewayServerPassword correctas y, a continuación, para verificar los detalles correctos de Gateway Server, vuelva a intentar instalar el agente.

Solución de problemas: la instalación del agente falla JAVA_HOME no se ha definido abortando la instalación del agente

Al instalar el agente, si se produce el siguiente error, no se ha encontrado la ubicación del directorio raíz de java durante la instalación.
rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpmPreparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is rootCurrent user group is rootroot is not the default user, checking if required environment variables are set
Checking agent version
Updating / installing...
1:oracle.mgmt_agent-240229.xxxx-1################################# [100%]
Failed to get unit file state for mgmt_agent.service: No such file or directory
Executing install
JavaHome is not set aborting agent install
warning:%post(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1

Acción:

  1. En el archivo de respuesta, defina el parámetro JAVA_HOME agregando lo siguiente:
    export JAVA_HOME=path/to/jdk/directory
  2. Instale el agente ejecutando el siguiente comando.
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

Solución de problemas: no se han podido ver el espacio de nombres y las métricas de Prometheus en el servicio OCI Monitoring

En la consola de OCI, si las políticas necesarias están configuradas correctamente y el espacio de nombres de Prometheus y las métricas no están visibles desde OCI Monitoring en el explorador de métricas, puede que necesite confirmar que el usuario del sistema operativo mgmt_agent tiene permisos de lectura para el archivo .properties.

Posible causa: el usuario del sistema operativo mgmt_agent no tiene permisos para leer el archivo .properties. Este archivo puede ser propiedad de un usuario root del sistema operativo con 600 permisos.
agent_inst/discovery/PrometheusEmitter/compute_exporter.properties 
Acción: para resolver el problema:
  1. Confirme que el archivo  .properties de agent_inst/discovery/PrometheusEmitter es propiedad del usuario del sistema operativo mgmt_agent y que el usuario del sistema operativo mgmt_agent tiene permisos de lectura en este archivo.
  2. Reinicie OCI Management Agent.

Solución de problemas: indicador proporcionado pero no definido

Error: si ve el siguiente error: indicador proporcionado pero no definido: -trusted-certs-dir

Acción: para resolver el problema, puede actualizar OCA a la última versión mediante los siguientes comandos.
$ sudo -u oracle-cloud-agent /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent -cli -trusted-certs-dir=/tmp/trustedcerts
flag provided but not defined: -trusted-certs-dir
Usage of /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent:
  -agent-config string
        agent config yml file
  -cli
        run the monitoring in cli mode
  -debug
        enable debug logging
  -dev
        enable dev runs
  -force-redeploy
        force redeploy image
  -metadata-config string
        metadata config json file
  -oci-config string
        oci config file
  -staging
        enable staging endpoint
  -upgrade-native-agent
        invoke native agent upgrade

Solución de problemas: la adición de credenciales SSH falla con un error: carácter no entrecomillado no válido

Causa posible: al agregar credenciales de origen a un agente, si ve el siguiente error de carácter no entre comillas no válido, significa que el archivo JSON no tiene el formato correcto. Por ejemplo, si la clave SSH se muestra como varias líneas, esto podría provocar que la clave SSH no se reconozca y este error de carácter no entrecomillado no válido. Por ejemplo:

[root@host ociagent]# cat 2nd.json | sudo -u mgmt_agent
      /opt/oracle/mgmt_agent/agent_inst/bin/credential_mgmt.sh -o upsertCredentials -s
      logancom.fasterxml.jackson.databind.JsonMappingException: Illegal unquoted character ((CTRL-CHAR,
      code 10)): has to be escaped using backslash to be included in string valueat [Source: (BufferedInputStream); line: 7, column: 70] (through reference chain:
      oracle.polaris.core.source.metadata.impl.creds.CredentialFormat["properties"]->java.lang.Object[][1]->oracle.polaris.core.source.metadata.impl.creds.CredentialFormat$Property["value"])at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:402)at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:361)at
Solución: hay dos formas de solucionarlo:
  • Agregue el carácter especial \n antes de cada línea de la clave. Por ejemplo:
    {"source":"host.myvm.example.com", 
    "name":"OSCreds", 
    "type":"SSHKeyCreds", 
    "description":"SSH keys for a user", 
    "properties":[
    {"name":"SSHUserName","value":"username"},               
    {"name":"SSHPrivateKey","value":"-----BEGIN RSA PRIVATE KEY-----\n<private-key-value>
    \n-----END RSA PRIVATE KEY-----"},
    {"name":"SSHPublicKey","value":"-----BEGIN PUBLIC KEY-----\n<public-key-value>
    \n<public-key-value>
    \n-----END PUBLIC KEY-----"]}
  • O agregue el valor clave completo en una sola línea.

Ahora, el formato de JSON es correcto y puede volver a intentar la operación para agregar las credenciales de origen.

Solución de problemas: error de ruta de certificado

Posible causa: si aparece el siguiente error al instalar el agente, es posible que tenga un componente de red que inyecte sus propios certificados. O bien, si encuentra el error al instalar el agente y si se conecta a través de un proxy, es posible que el proxy inyecte un certificado personalizado. Deberá consultar al administrador para obtener el certificado personalizado y, a continuación, seguir los pasos que se indican a continuación.

PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException 

Solución: para resolver estos problemas, puede realizar estos pasos:

  1. Proporcione certificados personalizados durante la instalación del agente, consulte Importar certificados o Actualizar certificados.
  2. En el archivo de clave de respuesta, agregue el parámetro importTrustedCertsDirectory, incluida la ruta. Para obtener información, consulte el siguiente ejemplo y consulte Configure a Response File.
importTrustedCertsDirectory=/tmp/crt

Solución de Problemas: No se ha podido instalar Oracle Management Agent en la instancia de Windows

Al instalar el agente en un host de Windows, si el JDK soportado no existe y hay un JDK que utiliza una versión de Java diferente, por ejemplo 1.8.0_51, la instalación del agente de gestión falla en el mismo host con el siguiente error:

C:\Users\abc\Downloads\Latest-agent> .\installer.bat 
C:\Users\abc\Downloads\Latest-agent\Windows-input.rsp
64 bit Windows OS found.
Checking pre-requisites

Checking if previous agent service exists
Checking if C:\Oracle\mgmt_agent\agent_inst directory exists
Checking Java version

"Agent only supports 64 bit and 32 bit JDK 8 (with a minimum upgrade version JDK 8u281). 
Please set your preferred path in JAVA_HOME"
Solución: para solucionar este problema:
  1. Descargue el JDK en un formato de archivo comprimido .zip.
  2. Extraiga el archivo JDK.zip en un directorio del host de Windows.
  3. Instale el agente y proporcione el JAVA_HOME que apunta al directorio.

Solución de problemas: al instalar el agente de gestión y ver los mensajes de timeout de la conexión de red

Posible causa: si ve mensajes con timeout de conexión de red. Por ejemplo:
http://Example.example.com:4480->https://management-agent.us-ashburn-1.oci.oraclecloud.com:443 : Connection timed out Read failed)
Entonces es probable que el agente de gestión no pueda acceder a los servicios de Oracle Cloud Infrastructure.

Solución:

Verifique las reglas de configuración de red y confirme que el agente de gestión puede conectarse a los servicios de OCI desde la máquina virtual que tiene instalado el agente de gestión. Si tiene una configuración de firewall o NAT, confirme que permite la comunicación saliente a través de las direcciones IP recomendadas por OCI. Para obtener más información, consulte Rangos de direcciones IP para los servicios desplegados en Oracle Cloud Infrastructure.

Solución de problemas: CloudRegistrationStep: el intento de registro ha fallado con el estado HTTP 401 (la información necesaria para completar la autenticación no se ha proporcionado o es incorrecta)

Causa: este problema puede producirse debido a una clave de respuesta no válida o incorrecta.

Acción: asegúrese de que tiene una clave válida. Para obtener más información, consulte Gestión de claves de instalación.

Resolución de problemas: "code": "NotAuthenticated","message": "La información necesaria para la autentificación no se proporcionó o no es correcta.

Causa: este problema puede producirse debido a una clave de respuesta caducada.

Acción: asegúrese de que tiene una clave válida. Para obtener más información, consulte Gestión de claves de instalación.

Solución de problemas de desinstalación de Management Agent

En este tema se tratan los problemas típicos y sus soluciones relacionados con la desinstalación de Oracle Management Agent.

Error:... especifica varios paquetes

Causa: el registro rpm tiene varios paquetes con ese nombre.

Acción: utilice el indicador --allmatches al ejecutar el comando rpm -e:
rpm -e oracle.mgmt_agent --allmatches

Error:... fallo del scriptlet con código de salida

Causa: El rpm no ha podido parar el agente en ejecución o no ha podido eliminar el archivo del servicio de agente del sistema.

Acción: Para resolverlo, intente eliminar el agente manualmente.
  • Compruebe si el agente se está ejecutando:

    Para OL7: systemctl status mgmt_agent

    Para OL6: /sbin/initctl status mgmt_agent

    Si ve que el agente se está ejecutando, párelo:

    Para OL7: systemctl stop mgmt_agent

    Para OL6: /sbin/initctl stop mgmt_agent

  • Elimine rpm ejecutando rpm -e oracle.mgmt_agent --noscripts. Este comando omitirá todos los scripts rpm e intentará eliminar el paquete de su registro.
  • Elimine todos los archivos de agente ejecutando rm -rf /opt/oracle/mgmt_agent. Ejecute también los siguientes comandos:

    Para OL7: rm -rf /etc/systemd/system/mgmt_agent.service

    Para OL6: rm -rf /etc/init/mgmt_agent.conf

Solución de problemas de cambio de versión de Management Agent

Al cambiar la versión de Oracle Management Agent, puede utilizar la siguiente lista para solucionar errores comunes.

Solución de problemas: la actualización automática está activada, pero el agente no actualiza automáticamente porque el propietario del archivo no es válido

Causa: puede configurar Management Agent para cambiar de versión automáticamente. La opción de cambio de versión automático está disponible en el nivel de arrendamiento, por lo que si selecciona la opción de cambio de versión automático en la consola de Oracle Cloud, todos los agentes de su arrendamiento de OCI se actualizarán automáticamente. Puede tardar hasta 24 horas después de que haya una nueva versión del agente disponible en Management Agent Cloud Service, en que el agente se actualice automáticamente.

Si la versión del agente no se actualiza después de esperar 24 horas, algunos problemas en el disco podrían estar impidiendo que el agente se actualice automáticamente.

La causa más común de este error es que los archivos son propiedad de un usuario del sistema operativo que es diferente del usuario que instaló Management Agent. El proceso de actualización se ejecuta como el mismo usuario del sistema operativo que el proceso en ejecución actual y no tiene la capacidad de cambiar a la raíz. Cualquier archivo del directorio mgmt_agent creado manualmente por el usuario puede interferir con la capacidad del agente para actualizar automáticamente.

Puede encontrar el archivo mgmt_agent.log en las siguientes ubicaciones:
  • Para el agente de gestión independiente:
    /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
  • Para el plugin de Management Agent en Oracle Cloud Agent (OCA) en instancias informáticas de OCI:
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log

    En el archivo mgmt_agent.log, puede ver el siguiente error que indica los archivos problemáticos:

    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.oldbackup]
    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] WARN  - Files with invalid owners were found, skippingauto-upgrade
Acción: puede utilizar la siguiente solución alternativa para este problema:
  1. El usuario debe cambiar la propiedad y el grupo de los archivos afectados a la cuenta de usuario que instaló originalmente Management Agent.
  2. Si se ha creado un archivo con el propietario incorrecto, puede suprimir el archivo o moverlo a otro directorio fuera del directorio del agente de gestión. Según la instalación, puede encontrar el directorio de Management Agent en una de las siguientes ubicaciones:
    • Para el agente de gestión autónomo: /opt/oracle/mgmt_agent/
    • Para el plugin de Management Agent para un agente de Oracle Cloud en una instancia informática de OCI: /var/lib/oracle-cloud-agent
    Nota

    Para evitar estos problemas, no cree manualmente ningún archivo en el directorio de Management Agent.

Solución de problemas de Management Agent en instancias informáticas

Los usuarios pueden encontrar varios errores durante el despliegue de Oracle Management Agent en instancias informáticas. A continuación se muestran las causas y las acciones recomendadas para algunos errores comunes.

Solución de problemas: el agente tiene el estado No disponible y los informes del archivo log del agente "Etiquetas no válidas"

La página Agentes de gestión muestra el agente en estado 'No disponible' y el archivo mgmt_agent.log (ubicado en el directorio <Agent_Inst>/logs) informa el siguiente mensaje:

ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s). Agregue un valor a cada una de las siguientes definiciones de etiqueta: \nGLOBAL.ComponentType, GLOBAL.ApplicationName,

Causa:

Este problema puede ocurrir cuando el compartimento necesita etiquetas obligatorias para cada recurso y la solicitud de creación de recurso no incluye las etiquetas, la solicitud de activación fallará con el mensaje:"Etiquetas no válidas: fallo al crear el recurso porque necesita valores de etiqueta" y el estado del agente se muestra como "No disponible".

Acción:

  • Agentes de Gestión

    Si tiene un agente de gestión independiente, se debe desinstalar.

    Si el agente de gestión se instaló mediante un archivo RPM o ZIP, se debe desinstalar y volver a instalar proporcionando un archivo de respuesta mediante el parámetro DefinedTags, como se describe en la sección Revisar parámetros de agente.

  • Management Agent en instancias informáticas
    Si el agente de gestión se activa mediante la consola de OCI mediante el plugin de OCA, no hay ningún archivo de respuesta porque no se utiliza para instancias informáticas. En este caso, haga lo siguiente:
    1. Conéctese a la instancia en la que se despliega Management Agent y sudo como usuario oracle-cloud-agent mediante el siguiente comando:
      sudo -u oracle-cloud-agent sh
    2. Cree un archivo agent.definedtags en la siguiente ubicación:/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/
    3. Agregue las etiquetas definidas necesarias para que el recurso se cree en el archivo agent.definedtags.

      Por ejemplo, si hay 2 espacios de nombres admin_namespace y finance_namespace

      y cada espacio de nombres utiliza 2 claves y 2 valores environment_type=non-prod, sensitivity=restricted, a continuación, puede utilizar lo siguiente:
      DefinedTags = [{"admin_namespace": {"environment_type": "non-prod",
          "sensitivity": "restricted"}, "finance_namespace": {"environment_type":
          "non-prod","sensitivity": "restricted"}}]
    4. Reinicie oracle-cloud-agent con el comando:
      sudo systemctl restart oracle-cloud-agent

Solución de problemas: fallo en la configuración del agente de gestión con fork/exec oracle.polaris.oca.main: permiso denegado

Los usuarios pueden encontrar este error que provoca un fallo al instalar o iniciar Management Agent.

El mensaje de error que se muestra en la vista Plugin de la instancia informática para el plugin de Management Agent es similar al siguiente:

workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]

Posible causa:

Este problema puede ocurrir cuando una instancia informática no permite operaciones de bifurcación/ejecución desde el directorio /tmp montando tmpfs con el indicador noexec.

Para confirmar esta posible causa, ejecute lo siguiente:
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)

La salida debe indicar tiene el indicador noexec.

Acción:

  1. Pare Oracle Cloud Agent.
     sudo systemctl stop oracle-cloud-agent
  2. Agregue la siguiente configuración al archivo: /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
    overrideTmpDir: true
  3. Inicie Oracle Cloud Agent.
    $ sudo systemctl start oracle-cloud-agent

Solución de problemas: fallo de autenticación del agente de gestión debido a un sesgo de reloj, una hora diferente en la instancia informática en comparación con la hora en el servidor

Causa: si hay un sesgo de reloj de más de 5 minutos entre la instancia informática en la que se ejecuta el agente y el servicio Oracle Cloud Infrastructure Identity, las solicitudes se rechazarán con HTTP 401.

Si encuentra los siguientes errores:

En la instancia informática de OCI, vaya al separador Oracle Cloud Agent, Management Agent muestra un error en la columna Message:

rpc error: code = Unavailable desc = connection error: desc = "transport: error while
      dialing: dial unix /var/lib/oracle-cloud-agent/tmp/plugin1825606937: connect: connection
      refused"

O en los logs puede encontrar el siguiente error:

2022-12-09 07:41:22,144 [SysExecutor.0 (Resource Principal Token Refresher)-47] WARN  - #-#  invocation access log [request-id-prefix: K9YBE4AY] #-#
Service: OCI
Method:  GET
Path:    /20200202/managementAgents/ocid1.managementagent.....rvf6i3ba/resourcePrincipalToken
Headers:opc-rpt-request-token=********************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        date=Fri, 09 Dec 2022 07:41:19 GMT         
        host=management-agent.ap-tokyo-1.oci.oraclecloud.com         
        Authorization=******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO         
        User-Agent=Jersey/2.34 (Apache HttpClient 4.5.13)Attempts:
<--> Endpoint:       management-agent.ap-tokyo-1.oci.oraclecloud.com     
     opc-request-id: K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO     
     StartTime:      2022-12-09 07:41:19,976 GMT     
     Status:         401 Unauthorized     
     Headers:        X-Content-Type-Options=nosniff                     
                     Content-Length=187                         
                     opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO/E4356B68C6C541BAD867E46760316D35/4118B130EE46A8E25F90DC91AB7F12D7                     
                     Date=Fri, 09 Dec 2022 07:41:21 GMT                     
                     Content-Type=application/json     
      ErrorBody:
{  
    "code" : "NotAuthenticated",  
    "message" : "Unable to authenticate the request for ocid1.managementagent.oc1.ap-tokyo-1.amaaaa...6frjnrbvqrvf6i3ba"}

Acción

Corrija el sesgo del reloj y reinicie. Si el agente ha estado caído durante días debido a este error, debe limpiar el archivo donotrestart antes de reiniciar el agente.

Además, Oracle recomienda configurar la fecha y hora del sistema operativo para la sincronización automática con servidores NTP a fin de evitar tiempo de inactividad en el futuro. Si se están ejecutando servicios adicionales en la máquina, se recomienda reiniciar la máquina después del cambio de hora para que los servicios se puedan restablecer con la nueva hora.

Para corregir la fecha y hora del sistema operativo en la que se está ejecutando el agente y, a continuación, reiniciar el agente, puede seguir estos pasos:

  1. Para parar el agente, ejecute el siguiente comando:
    sudo systemctl stop oracle-cloud-agent
  2. Corrija la fecha y la hora.
  3. Ejecute el siguiente comando para suprimir el archivo configure.donotrestart.
    sudo rm /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/configure.donotrestart
  4. Iniciar el agente.
    sudo systemctl start oracle-cloud-agent

Solución de problemas: servicio OCI Management Agent: agente no visible en la consola de OCI bajo Observability & Management

OCI Management Agent instalado correctamente en una instancia informática. El agente se ejecuta en el host. Sin embargo, el agente no aparece en la consola de Oracle Cloud si va al menú de navegación, selecciona Observability & Management, va a Management Agent y, a continuación, selecciona Agents.

Causa posible: los compartimentos de la instancia informática y la clave de instalación del agente son diferentes.

Acción:
  1. Pare y desinstale Management Agent en la instancia informática.
  2. Cree la clave de instalación de agente en el mismo compartimento de la instancia informática.
  3. Utilice esta nueva clave de instalación que acaba de crear e Instale el agente de gestión.
Ahora, Management Agent aparece como Activo en Observación y gestión, vaya a Management Agents y, a continuación, seleccione Agentes.

Solución de problemas de Management Gateways

En este tema se tratan problemas y soluciones comunes relacionados con los gateways de gestión.

Solución de problemas: eliminación de Management Gateway

Causa: en algunos casos, puede ser necesario eliminar una instalación de Management Gateway existente para volver a instalarla.

Acción:
  1. Compruebe si el gateway se está ejecutando.

    Para OL7: systemctl status mgmt_gateway

    Para OL6: /sbin/initctl status mgmt_gateway

    Si el gateway se está ejecutando, párelo:

    Para OL7: systemctl stop mgmt_gateway

    Para OL6: /sbin/initctl stop mgmt_gateway

  2. Elimine el RPM del gateway instalado con el siguiente comando: rpm -e oracle.mgmt_gateway --noscripts

  3. Elimine los archivos de Gateway restantes con el siguiente comando:

    rm -rf /opt/oracle/mgmt_agent

  4. Ejecute lo siguiente:

    Para OL7: rm -rf /etc/systemd/system/mgmt_gateway.service

    Para OL6: rm -rf /etc/init/mgmt_agent.conf

Solución de problemas: configuración de Management Gateway

Causa: en algunos casos, es posible que el nombre de host no se resuelva en el entorno de instalación, lo que puede provocar que la instalación falle y aparezca el siguiente mensaje de error:

Solución de problemas: "No se pudo resolver el nombre de host <hostname value> en el entorno de instalación. Resuelva el nombre de host o proporcione GatewayCertCommonName en el archivo de respuesta y vuelva a ejecutar la secuencia de comandos de configuración del gateway".

Acción:

  • Compruebe y resuelva el nombre de host del entorno para obtener el valor de nombre de doamin totalmente cualificado (FQDN) después de ejecutar el comando: hostname -f
  • Opcionalmente, un usuario puede proporcionar un nombre de dominio totalmente cualificado personalizado para la configuración del gateway mediante la introducción de la propiedad GatewayCertCommonName en el archivo de respuesta de entrada. Consulte Response File Parmaters
  • Vuelva a ejecutar el script de configuración de gateway.
    sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

Causa: en algunos casos, la instalación de Management Gateway puede fallar con el siguiente mensaje de error debido a la ausencia de políticas en OCI o a problemas de límite de recursos en el arrendamiento. Si aparece el siguiente error, siga los pasos que se indican a continuación.

Solución de problemas: "Fallo al iniciar Management Gateway porque no se han podido crear, inicializar o recuperar certificados en OCI. Compruebe los logs para obtener más detalles."

Acción:

  • Abra el archivo log en el directorio de instalación de Management Gateway, por ejemplo: /opt/oracle/mgmt_agent/plugins/GatewayProxy/statedir/log/mgmt_gateway.log
  • Si el archivo log contiene alguno de los siguientes códigos de error 404, seleccione una de las siguientes opciones para resolver el problema:
    2023-07-25 15:38:06.694/CEST [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "NotAuthorizedOrNotFound",  "message" : "Authorization failed or requested resource not found."}
    2023-07-25 15:38:06.696/CEST [pool-3-thread-1] ERROR com.oracle.mgmtagent.proxy.ProxyServer - Error while initializing and loading certificate bundlescom.oracle.mgmtagent.proxy.exception.CertificateFailureException: The response status is 404 after multiple retries at com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility.executeRequest(CertificateUtility.java:293) ~
  • Si el archivo log contiene alguno de los siguientes 400 códigos de error, revise las siguientes opciones para resolver el problema:
    2023-09-20 18:51:32.772/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateCreationUtil - Create Vault Service Url invoked https://kms.us-ashburn-1.oraclecloud.com/20180608/vaults
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Received response code 400
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Header name opc-request-id , value /5704D03441842D3818B824B2D6B2712E/1D1FED893474FDA900188E24F3DEE59B
    2023-09-20 18:51:33.401/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "LimitExceeded",  "message" : "The limit for this tenancy has been exceeded."}
    • Compruebe el límite del recurso Recuento de almacén por defecto para el servicio Key Management en la consola de OCI. Puede enviar una solicitud para aumentar los límites de recursos. Para obtener más información, consulte Gestión de claves y Gestión de almacenes.
    • Puede configurar certificados manualmente. Para obtener más información, consulte Realización de requisitos para desplegar Management Gateway y vaya a la sección Gestión manual de certificados.
      Nota

      Al crear los certificados Emitidos por CA interna , el perfil de certificado debe ser Servidor TLS o Cliente TLS y solo están soportados los algoritmos de firma RSA.
  • Si hay otros fallos relacionados con el almacén o las API del servicio de claves en los logs, puede emitir una solicitud y ponerse en contacto con el equipo oci_kms proporcionando el cuerpo de respuesta y opc-request-id.
  • Si hay otros fallos relacionados con las autoridades de certificación o las API del servicio de certificado en los logs, emita una solicitud y póngase en contacto con el equipo oci_certificates proporcionando el cuerpo de respuesta y opc-request-id.

Solución de problemas: falla la instalación de Management Gateway en Red Hat Enterprise Linux 9.x

La instalación de Management Gateway falla y puede aparecer el siguiente mensaje de error: mgmt_gateway service creation failed. Reason: Detected Linux.

Además, los mensajes del log de fallos de instalación pueden confirmar el error e indicar que los intentos de configuración utilizan un gestor de servicios incorrecto para instalar la puerta de enlace.

Causa: Red Hat ha eliminado el paquete chkconfig de la distribución Red Hat Enterprise Linux (RHEL) 9. Para obtener más información, consulte la base de conocimientos de Red Hat.

Acción:

Verificar el problema
  1. Confirme que el entorno utiliza Red Hat Enterprise Linux 9.x ejecutando el siguiente comando:
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. Los siguientes mensajes resaltan el problema de que el sistema operativo/familia no se identificó correctamente mediante las reglas presentes en la secuencia de comandos de Agentcore y la instalación intentará configurar el servicio de agente mediante init.d y no systemctl en RHEL 9x.
    $ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous gateway service exists
    Checking if OS has systemd or initd
    Checking available disk space for gateway install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_gateway-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_gateway' daemon
    mgmt_gateway service creation failed. Reason: Detected Linux:
    Installing the mgmt_gateway daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
  3. Verifique que falte el paquete chkconfig, como se describe en el siguiente artículo de la base de conocimientos de Red Hat.
Solución 1: instale el paquete chkconfig
  1. Instale el paquete que falta ejecutando el siguiente comando:
    $ dnf install chkconfig
  2. Compruebe que el paquete existe en el entorno ejecutando el siguiente comando:
    $ rpm -qa | grep chkconfig
  3. Vuelva a instalar Management Gateway.
Solución 2: sin instalar el paquete chkconfig
Nota

Esta es una solución alternativa. Utilice esta solución solo si no se puede instalar el paquete chkconfig. La solución recomendada es instalar el paquete chkconfig.

Si la instalación del paquete chkconfig no es una opción como se describe en la sección Solución 1 anterior, complete los siguientes pasos como solución alternativa para instalar el software de Management Gateway.

Use los siguientes comandos para:
  1. Cambie a un shell raíz.
  2. Defina la variable de entorno DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Instale el software de Management Gateway.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Solución de problemas: la instalación de Management Gateway falla con error: no se han podido crear certificados y el informe de logs de identidad: fallo de autenticación: DATE_OUTSIDE_CLOCK_SKEW

Motivo:

Fallo de autenticación del informe de logs de identidad: DATE_OUTSIDE_CLOCK_SKEW

# /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<PATH>/gateway_agent.rsp/opt/oracle/mgmt_agent/agent_inst/bin/setupAgent.sh
    opts=<PATH>/gateway_agent.rsp

Executing configure

Parsing input response file
Validating install key
Generating communication wallet
Generating security artifactsRegistering Management Gateway
Found service plugin(s):[GatewayProxy]

Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...Done.
GatewayProxy : Successfully deployed external plugin

Gateway setup completed and the gateway is running.
In the future gateway can be started by directly running: sudo systemctl start mgmt_gateway

Please make sure that you delete <PATH>/gateway_agent.rsp or store it in secure location.

Creating gateway system properties file
Creating properties fileCreating or validating certificates
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Failed to start Management Gateway as certificates could not be created, initialized or retrieved in OCI. Please check the logs for more details.
Management Gateway stopped

Acción:

En el host en el que está instalado Management Gateway, asegúrese de que la hora del host es correcta y, a continuación, instale Management Gateway.

Solución de problemas: al instalar o configurar Management Gateway, se ha producido un error de timeout

Si verifica que la consola de OCI muestra Management Gateway como activo, pero las métricas no se están rellenando.

Puede encontrar el siguiente error si el servicio sufre un timeout:

/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Starting gateway...
Gateway started successfully

Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...............Timed out.

Agent is unable to check if it deployed requested service plugin(s) successfully or not. 
Please check back later on the console.

Causa: un tiempo más largo del esperado para completar la tarea de configuración de Management Gateway puede provocar un problema de comunicación de red y provocar un timeout en Management Gateway.

Acción: para completar la configuración:
  1. Confirme que no haya problemas de comunicación de red.
  2. Verifique si se actualizaron los siguientes detalles de proxy en el archivo de respuesta para determinar si existe algún problema de proxy. Por ejemplo, confirme que se han actualizado los detalles de puerto y host de proxy correctos en el archivo de respuesta:

    ProxyHost = my.proxyhost.com

    ProxyPort = 80

  3. Pare Management Gateway con el siguiente comando:

    systemctl stop mgmt_gateway

  4. Vuelva a ejecutar la configuración de Management Gateway con el siguiente comando:

    /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

  5. La configuración de Management Gateway ahora debe completarse correctamente y las métricas deben rellenarse.

Recopilar logs del agente de gestión

Si necesita presentar un ticket de soporte para contratar a los Servicios de Soporte Oracle, es útil recopilar los logs del Agente de Gestión y asociar los logs al Ticket de Soporte. La ubicación del log depende de cómo esté instalado y activado Management Agent.

Buscar la ubicación del log

Puede .zip o .tar manualmente todos los archivos log en una de las siguientes ubicaciones:

  • Si ha activado el plugin de Management Agent mediante Oracle Cloud Agent (OCA), puede encontrar los logs en esta ubicación:
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log
  • Si ha instalado Management Agent mediante un gráfico de timbres .rpm, zip, o una imagen de contenedor, la ubicación de log por defecto es:
    /opt/oracle/mgmt_agent/agent_inst/log
Nota

Si ha instalado el agente en Windows, las ubicaciones de los logs dependen de dónde estén instalados los agentes. Las ubicaciones de log normalmente se encuentran en el directorio de instalación en la siguiente ubicación: agent_inst/log

Crear un paquete de diagnóstico

Puede .zip o .tar manualmente todos los archivos log en las ubicaciones mencionadas anteriormente o puede generar un paquete de diagnóstico.

El agente debe estar en ejecución y en buen estado para generar el paquete de diagnóstico. Si falla la generación del archivo de diagnóstico, ejecute manualmente .zip o .tar para todos los archivos log mencionados anteriormente.

Nota

Debe crear estos archivos .zip o .tar como usuario del sistema operativo del agente de gestión en /tmp o algún otro directorio fuera del directorio de instalación del agente.

Para generar un paquete de diagnóstico:

  • Para un plugin de Management Agent que utilice Oracle Cloud Agent (OCA), utilice el siguiente comando:
    $ sudo -u oracle-cloud-agent /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/bin/generateDiagnosticBundle.sh
  • Para un agente de gestión que se instaló mediante una imagen descargada, como un gráfico de timbres .rpm, .zip, o desde una imagen de contenedor, puede utilizar el siguiente comando:
    $ sudo -u mgmt_agent /opt/oracle/mgmt_agent/agent_inst/bin/generateDiagnosticBundle.sh