Solución de problemas de Management Agent Service

En esta sección se tratan algunos problemas y resoluciones típicos relacionados con el servicio de agentes de gestión, como la instalación y la desinstalación con agentes de gestión y gateways de gestión.

Temas:

Solucionar problemas de instalación y configuración de agentes de gestión

Los usuarios pueden encontrar varios errores durante el proceso de configuración e instalación de Oracle Management Agent. A continuación se muestran las causas y las acciones recomendadas para algunos errores comunes.

Desinstale el agente y elimine el archivo de servicio antes de instalar el nuevo agente.

Causa: Ya hay un agente instalado en el host. Un proceso de desinstalación anterior no ha eliminado correctamente el archivo de servicio del agente.

Acción:
  • Ejecute rpm -e oracle.mgmt_agent para desinstalar el agente. Si el comando se ejecuta correctamente, intente instalar el nuevo agente. Si el comando no funciona, pruebe la siguiente acción recomendada.
  • Ejecute ls /opt/oracle/mgmt_agent para comprobar si tiene elementos residuales de la instalación del agente anterior. Si lo encuentra, suprímalo ejecutando: rm -rf /opt/oracle/mgmt_agent.
  • Compruebe si ya tiene un archivo de servicio de agente en la siguiente ubicación según la versión de Linux:
    • Para OL7 (si utiliza systemd): /etc/systemd/system/mgmt_agent.service
    • Para OL6 (si utiliza init): /etc/init/mgmt_agent.conf.

      Si encuentra que tiene este archivo de servicio, elimínelo ejecutando: rm -rf /etc/init/mgmt_agent.conf y vuelva a intentar instalar el nuevo agente.

Java no es una JVM de 64 bits. Defina la ruta de una JVM de 64 bits en la variable de entorno JAVA_HOME o No se ha encontrado Java. Defina la ruta preferida en JAVA_HOME.

Causa: la variable de entorno JAVA_HOME no está definida o no apunta a una ubicación de JDK de 64 bits.

Acción: defina la variable de entorno JAVA_HOME en la versión de JDK correcta y vuelva a intentar instalar el agente. Actualmente, solo está soportado el JDK de 64 bits.

Fallo en la instalación del agente con el mensaje: useradd: No se puede obtener un GID único (no hay más GID disponibles)

Causa: El script de instalación no puede agregar un usuario y un grupo durante el proceso de instalación del agente de gestión porque los ID de grupo disponibles en el sistema Linux ya están en uso.

Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent) 
useradd: Can't get unique GID (no more available GIDs) 
useradd: can't create group 
Agent installation failed, please check log file

Acción: Consulte al administrador del sistema antes de continuar con lo siguiente:

  1. Edite el archivo /etc/login.defs. Necesita privilegios sudo para editar el archivo.

    Busque las siguientes entradas:
    SYS_GID_MIN               nnnn
    SYS_GID_MAX               mmmm
    SYS_UID_MIN               pppp
    SYS_UID_MAX               qqqq
    Donde nnnn y pppp son el valor mínimo y mmmm y qqqq son el valor máximo.

    Si las entradas anteriores no existen en el archivo, agréguelas.

  2. Actualice el valor de la entrada SYS_GID_MAX según la recomendación del administrador del sistema y guarde el archivo.

  3. Elimine la instalación del agente con fallos ejecutando: sudo rpm -e oracle.mgmt_agent.

  4. Cierre de sesión del shell seguido de inicio de sesión.

  5. Vuelva a intentar realizar la instalación del agente.

useradd: no se puede crear el directorio /usr/share/mgmt_agent

Durante la instalación de Management Agent, el usuario mgmt_agent se crea con la ubicación del directorio raíz por defecto en /usr/share/mgmt_agent.

Causa: No hay suficientes permisos de archivo en /usr/share o el sistema de archivos es de solo lectura.

Acciones posibles:

  • Defina permisos de archivo para proporcionar al usuario mgmt_agent acceso a la ubicación del directorio raíz del usuario por defecto: /usr/share.

  • Defina una ubicación de directorio raíz diferente mediante la variable de entorno USER_HOME_DIR_ROOT si desea utilizar una ubicación diferente.

    Defina la variable de entorno USER_HOME_DIR_ROOT con la ruta que prefiere utilizar como directorio raíz para el usuario mgmt_agent y asegúrese de que el usuario del agente de gestión tiene los permisos de archivo correctos en ese directorio preferido.

Windows: el sistema no encuentra la ruta de acceso especificada. Error al instalar el agente.

NIVEL DE ERROR=9009

Causa posible: las variables de entorno no se han definido correctamente debido a espacios en el nombre de directorio/carpeta.

Los entornos de Windows permiten utilizar espacios dentro de un nombre de directorio/carpeta que provoca un problema con la instalación del agente de gestión, ya que Windows agrega comillas al nombre automáticamente. Por ejemplo, hay un directorio/carpeta denominado: Program Files. En este caso, Windows inserta comillas automáticamente, ya que hay un espacio dentro del nombre de la carpeta y ahora dirá: "Program Files".

Las comillas adicionales pueden causar un problema, ya que el instalador del agente de gestión no permite comillas para variables de entorno como JAVA_HOME y AGENT_INSTALL_BASEDIR.

Nota

El instalador del agente de gestión no acepta los siguientes caracteres especiales en la ruta: [, ^^, ", ', & o ].

Acción:

La forma recomendada de configurar variables de entorno en Windows es mediante Configuración avanzada del sistema.
  • En la barra de tareas de Windows, haga clic con el botón derecho en el icono Windows y seleccione Sistema.
  • En la ventana Configuración, en Configuración relacionada, haga clic en Configuración avanzada del sistema.

    Configuración avanzada de Windows

  • En el separador Opciones avanzadas, haga clic en Variables de entorno.

    Variables de Entorno de Windows

  • Haga clic en Nuevo para crear una nueva variable de entorno. Haga clic en Editar para modificar una variable de entorno existente.
  • Después de crear o modificar la variable de entorno, haga clic en Aplicar y, a continuación, en Aceptar para que el cambio surta efecto.
    Nota

    La interfaz gráfica de usuario para crear variables de entorno puede variar ligeramente, según la versión de Windows.

El estado de Management Agent es "No disponible" en la consola después de la instalación inicial

Causa posible: registro de hora del sistema incorrecto

Acción: verifique la hora del sistema del host del agente y, a continuación, puede corregirla si es necesario.

Después de la configuración, Management Agent no está visible en la consola ni a través de la API

Causa posible: si después de configurar el agente de gestión o el agente de gateway de gestión el agente no se muestra en la consola de Oracle Cloud o a través de la API, puede que no se configuren las políticas correctas para el usuario o el grupo de usuarios.

Acción: verifique que el usuario o el grupo de usuarios tiene las políticas necesarias configuradas para el agente de gestión o el agente de gateway. Para configurar políticas, consulte Creación de políticas para grupos de usuarios.

Las métricas de Prometheus o Kubernetes supervisadas mediante Management Agent no están disponibles

Causas posibles: Management Agent no necesita políticas o grupos dinámicos para sus propias métricas, sino para las métricas de Prometheus y Kubernetes. El usuario debe definir un grupo dinámico y una política que permita a los agentes de ese grupo dinámico publicar métricas en OCI Monitoring. Si las métricas no se muestran en el compartimento o en el espacio de nombres de OCI Monitoring, puede comprobar las políticas y el grupo dinámico.
  • a) Faltan políticas

    Acción: Verifique que las políticas se agreguen a Management Agent como se describe en las instrucciones de configuración. Para obtener detalles, consulte Configuración de Oracle Cloud Infrastructure para el servicio del agente de gestión.

    Si faltan las políticas, agréguelas como se describe en Configuración de Oracle Cloud Infrastructure para Management Agent Service.

  • (b) Errores tipográficos en las políticas

    Acción: Revise la sintaxis de políticas para detectar errores comparándolos con los ejemplos de políticas. Para obtener detalles, consulte Configuración de Oracle Cloud Infrastructure para el servicio del agente de gestión.

    Por ejemplo, asegúrese de que la definición de grupo dinámico esté definida correctamente según la siguiente sintaxis con los caracteres de comillas simples correctos alrededor del ID de compartimento y el tipo de recurso managementagent:

    ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
  • (c) ID de compartimento incorrecto en la definición de grupo dinámico

    Acción: Verifique que el ID de compartimento de clave de instalación es el mismo que el ID de compartimento especificado en la definición de grupo dinámico del agente. Por defecto, el agente se crea en el compartimento de la clave de instalación.

El agente se ejecuta en OutOfMemoryException

Causa posible: el agente puede quedarse sin memoria de pila si no se ha ajustado correctamente para soportar la carga que se le ha asignado.

Acción: actualice la configuración de memoria de pila para el agente de gestión.

La configuración lista para usar para la pila máxima del agente es:
  • 128 MB para Management Agent como plugin de OCA.
  • 512 MB para el agente de gestión independiente. (El descargado de la consola del agente de gestión).
El usuario puede actualizar y asignar más pila al agente realizando lo siguiente:
  • Abrir archivo: agent_inst/config/java.options.
  • Edite el archivo anterior. Actualice la configuración de pila modificando la siguiente línea: -Xmx512m

    Por ejemplo: la línea anterior define la pila máxima para el agente en 512 MB.

    Para cambiar la pila a 800 MB, actualice la línea anterior para que sea: -Xmx800m

  • Guarde el archivo y reinicie el agente para que se apliquen los cambios.

Dirección IP que se muestra en la columna de host cuando Management Agent se instala en el host de Windows

Problema: Management Agent está instalado en un host de Windows y la consola de Management Agent muestra la dirección IP del host de Windows en la página de la interfaz de usuario en lugar de mostrar el nombre de dominio completo (nombre de host) del host de Windows.

Acción:
  • Inicie sesión en el host de Windows y abra el panel de control.

  • Haga clic en Sistema y seguridad y, a continuación, en Sistema.

  • Busque la sección Configuración de nombre de equipo, dominio y grupo de trabajo y, a continuación, haga clic en Cambiar configuración ubicada en la parte derecha de esta sección.

    Se muestra la ventana emergente Propiedades del sistema.

  • Por defecto, se selecciona el separador Nombre de equipo. Si no está seleccionada, haga clic en Nombre de equipo.

  • Busque el siguiente mensaje: Para cambiar el nombre de esta computadora o de su dominio o grupo de trabajo, haga clic en Cambiar.

  • Haga clic en Cambiar.

    Se muestra una ventana emergente denominada Cambios de nombre/dominio de equipo.

  • Por ejemplo, si el FQDN del host de Windows es: FOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.com , proporcione el nombre de host corto del host de Windows: FOOBAR004 en el cuadro de texto denominado Nombre de equipo.

  • Haga clic en Más y se mostrará otra ventana emergente denominada Sufijo DNS y nombre de equipo NetBIOS.

    En el cuadro de texto denominado Sufijo DNS primario de esta computadora, proporcione el nombre DNS del host de Windows.

    Por ejemplo: subnet1ab2regsu.dummytenantreg1.abcvcn.com

  • Haga clic en Aceptar o Aplicar y cierre todas las ventanas emergentes.

  • Reinicie el host de Windows.

  • Desinstale el agente de gestión existente ejecutando el script uninstaller.bat desde el terminal de Windows.

  • Ahora vuelva a instalar Management Agent en la máquina de Windows.

La instalación del agente de gestión debe ser correcta y en la página de la interfaz de usuario del agente FQDN del host de Windows se mostraría en la columna del host

La instalación del agente de gestión falla en SELinux al utilizar un volumen externo

El servicio de agente no se puede iniciar después de ejecutar la instalación. Esta situación da como resultado un agente que no trabaja y muestra los siguientes mensajes:
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
Para confirmar, compruebe los logs del gestor de servicios para ver los detalles del error.
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Además, compruebe los logs de auditoría.
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc:  denied  { read open } for  pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0           tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0

Todos los mensajes de error anteriores indican que SELinux no permite ejecutar comandos en la carpeta seleccionada.

Acción: póngase en contacto con el administrador del sistema y cree las políticas necesarias que permitan instalar y ejecutar Management Agent.

En un entorno RHEL 9x, la instalación de Management Agent o Management Gateway Agent falla con el siguiente mensaje: "La creación del servicio mgmt_gateway ha fallado. Motivo: se ha detectado un fallo en la creación del servicio Linux:" o "mgmt_agent". Motivo: Linux detectado:".

Causa: Red Hat ha eliminado el paquete chkconfig en la distribución de Red Hat Enterprise Linux (RHEL) 9. Para obtener más información, consulte la base de conocimientos de Red Hat. Como resultado, los mensajes del log de fallos de instalación pueden confirmar el error e indicar que los intentos de configuración utilizan un gestor de servicios incorrecto para instalar el agente.

Consulte el siguiente ejemplo de mensaje de error de log a continuación, que puede parecer similar en función del entorno. El problema se produce cuando OsFamily no se identifica mediante las reglas del script de Agentcore y, a continuación, la instalación intenta configurar el servicio de agente mediante init.d y no systemctl en RHEL 9x.
$ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm
Verifying... ################################# [100%]
Preparing... ################################# [100%]
Checking pre-requisites
Checking if any previous gateway service exists
Checking if OS has systemd or initd
Checking available disk space for gateway install
Checking if /opt/oracle/mgmt_agent directory exists
Checking if 'mgmt_agent' user exists
'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one.
Checking Java version
Trying /omc/java/jdk1.8.0_391
Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
Checking agent version
Updating / installing...
1:oracle.mgmt_gateway-231118.1208.1################################# [100%]

Executing install
Unpacking software zip
Copying files to destination dir (/opt/oracle/mgmt_agent)
Initializing software from template
Checking if JavaScript engine is available to use
Creating 'mgmt_gateway' daemon
mgmt_gateway service creation failed. Reason: Detected Linux:
Installing the mgmt_gateway daemon...
ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory
Service not installed.
warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
Acción:
  1. Confirme que el entorno utiliza Red Hat Enterprise Linux 9.x ejecutando el siguiente comando:
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. Verifique que falta el paquete chkconfig, como se describe en el siguiente artículo de la base de conocimientos de Red Hat.

Solución

  1. Instale el paquete que falta con el siguiente comando:
    $ dnf install chkconfig
  2. Valide que el paquete existe ahora en el entorno.
    $ rpm -qa | grep chkconfig
  3. Intente instalar Management Agent o Management Gateway Agent de nuevo.

Solución de problemas de desinstalación de Management Agent

En este tema se tratan los problemas típicos y sus soluciones relacionados con la desinstalación de Oracle Management Agent.

Error:... especifica varios paquetes

Causa: el registro rpm tiene varios paquetes con ese nombre.

Acción: utilice el indicador --allmatches al ejecutar el comando rpm -e:
rpm -e oracle.mgmt_agent --allmatches

Error:... fallo del scriptlet con código de salida

Causa: El rpm no ha podido parar el agente en ejecución o no ha podido eliminar el archivo del servicio de agente del sistema.

Acción: Para resolverlo, intente eliminar el agente manualmente.
  • Compruebe si el agente se está ejecutando:

    Para OL7: systemctl status mgmt_agent

    Para OL6: /sbin/initctl status mgmt_agent

    Si ve que el agente se está ejecutando, párelo:

    Para OL7: systemctl stop mgmt_agent

    Para OL6: /sbin/initctl stop mgmt_agent

  • Elimine rpm ejecutando rpm -e oracle.mgmt_agent --noscripts. Este comando omitirá todos los scripts rpm e intentará eliminar el paquete de su registro.
  • Elimine todos los archivos de agente ejecutando rm -rf /opt/oracle/mgmt_agent. Ejecute también los siguientes comandos:

    Para OL7: rm -rf /etc/systemd/system/mgmt_agent.service

    Para OL6: rm -rf /etc/init/mgmt_agent.conf

Solución de problemas de Management Agent en instancias informáticas

Los usuarios pueden encontrar varios errores durante el despliegue de Oracle Management Agent en instancias informáticas. A continuación se muestran las causas y las acciones recomendadas para algunos errores comunes.

El agente está en estado No disponible y el archivo log del agente informa "Etiquetas no válidas"

La página Agentes de gestión muestra el agente en estado 'No disponible' y el archivo mgmt_agent.log (ubicado en el directorio <Agent_Inst>/logs) informa el siguiente mensaje:

ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s). Agregue un valor a cada una de las siguientes definiciones de etiqueta: \nGLOBAL.ComponentType, GLOBAL.ApplicationName,

Causa:

Este problema puede ocurrir cuando el compartimento necesita etiquetas obligatorias para cada recurso y la solicitud de creación de recurso no incluye las etiquetas, la solicitud de activación fallará con el mensaje:"Etiquetas no válidas: fallo al crear el recurso porque necesita valores de etiqueta" y el estado del agente se muestra como "No disponible".

Acción:

  • Agentes de Gestión

    Si tiene un agente de gestión independiente, se debe desinstalar.

    Si Management Agent se instaló mediante un RPM o un archivo ZIP, se debe desinstalar y volver a instalar proporcionando un archivo de respuesta mediante el parámetro DefinedTags, como se describe en la sección Review Agent Parameters.

  • Management Agent en instancias informáticas
    Si el agente de gestión se activa mediante la consola de OCI mediante el plugin de OCA, no hay ningún archivo de respuesta porque no se utiliza para instancias informáticas. En este caso, haga lo siguiente:
    1. Conéctese a la instancia donde se despliega el agente de gestión y sudo como usuario oracle-cloud-agent mediante el comando:
      sudo -u oracle-cloud-agent sh
    2. Cree el archivo agent.definedtags en el directorio /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/.

    3. Agregue las etiquetas definidas necesarias para que el recurso se cree en el archivo agent.definedtags.

      Por ejemplo, puede agregar lo siguiente:
      [{"GLOBAL":{"ComponentType":"<value>"}}, {"GLOBAL":{"ApplicationName":"<value>"}}]
    4. Reinicie oracle-cloud-agent con el comando:
      sudo systemctl restart oracle-cloud-agent

Fallo de configuración de Management Agent con fork/exec oracle.polaris.oca.main: permiso denegado

Los usuarios pueden encontrar este error que provoca un fallo al instalar o iniciar Management Agent.

El mensaje de error que se muestra en la vista Plugin de la instancia informática para el plugin de Management Agent es similar al siguiente:

workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]

Posible causa:

Este problema puede ocurrir cuando una instancia informática no permite operaciones de bifurcación/ejecución desde el directorio /tmp montando tmpfs con el indicador noexec.

Para confirmar esta posible causa, ejecute lo siguiente:
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)

La salida debe indicar tiene el indicador noexec.

Acción:

  1. Pare Oracle Cloud Agent.
     sudo systemctl stop oracle-cloud-agent
  2. Agregue la siguiente configuración al archivo: /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
    overrideTmpDir: true
  3. Inicie Oracle Cloud Agent.
    $ sudo systemctl start oracle-cloud-agent

Fallo de autenticación de Management Agent debido a un sesgo de reloj, una hora diferente en la instancia informática en comparación con la hora en el servidor

Causa: si hay un sesgo de reloj de más de 5 minutos entre la instancia informática en la que se ejecuta el agente y el servicio Oracle Cloud Infrastructure Identity, las solicitudes se rechazarán con HTTP 401.

Si encuentra los siguientes errores:

En la instancia informática de OCI, vaya al separador Oracle Cloud Agent, Management Agent muestra un error en la columna Message:

rpc error: code = Unavailable desc = connection error: desc = "transport: error while
      dialing: dial unix /var/lib/oracle-cloud-agent/tmp/plugin1825606937: connect: connection
      refused"

O en los logs puede encontrar el siguiente error:

2022-12-09 07:41:22,144 [SysExecutor.0 (Resource Principal Token Refresher)-47] WARN  - #-#  invocation access log [request-id-prefix: K9YBE4AY] #-#
Service: OCI
Method:  GET
Path:    /20200202/managementAgents/ocid1.managementagent.....rvf6i3ba/resourcePrincipalToken
Headers:opc-rpt-request-token=********************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        date=Fri, 09 Dec 2022 07:41:19 GMT         
        host=management-agent.ap-tokyo-1.oci.oraclecloud.com         
        Authorization=******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO         
        User-Agent=Jersey/2.34 (Apache HttpClient 4.5.13)Attempts:
<--> Endpoint:       management-agent.ap-tokyo-1.oci.oraclecloud.com     
     opc-request-id: K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO     
     StartTime:      2022-12-09 07:41:19,976 GMT     
     Status:         401 Unauthorized     
     Headers:        X-Content-Type-Options=nosniff                     
                     Content-Length=187                         
                     opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO/E4356B68C6C541BAD867E46760316D35/4118B130EE46A8E25F90DC91AB7F12D7                     
                     Date=Fri, 09 Dec 2022 07:41:21 GMT                     
                     Content-Type=application/json     
      ErrorBody:
{  
    "code" : "NotAuthenticated",  
    "message" : "Unable to authenticate the request for ocid1.managementagent.oc1.ap-tokyo-1.amaaaa...6frjnrbvqrvf6i3ba"}

Acción

Corrija el sesgo del reloj y reinicie. Si el agente ha estado caído durante días debido a este error, debe limpiar el archivo donotrestart antes de reiniciar el agente.

Además, Oracle recomienda configurar la fecha y hora del sistema operativo para la sincronización automática con servidores NTP a fin de evitar tiempo de inactividad en el futuro. Si se están ejecutando servicios adicionales en la máquina, se recomienda reiniciar la máquina después del cambio de hora para que los servicios se puedan restablecer con la nueva hora.

Para corregir la fecha y hora del sistema operativo en la que se está ejecutando el agente y, a continuación, reiniciar el agente, puede seguir estos pasos:

  1. Para parar el agente, ejecute el siguiente comando:
    sudo systemctl stop oracle-cloud-agent
  2. Corrija la fecha y la hora.
  3. Ejecute el siguiente comando para suprimir el archivo configure.donotrestart.
    sudo rm /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/configure.donotrestart
  4. Iniciar el agente.
    sudo systemctl start oracle-cloud-agent

Solución de problemas de Management Gateways

En este tema se tratan problemas y soluciones comunes relacionados con los gateways de gestión.

Eliminar Management Gateway

Causa: en algunos casos, puede ser necesario eliminar una instalación de Management Gateway existente para volver a instalarla.

Acción:
  • Compruebe si el gateway se está ejecutando.

    Para OL7: systemctl status mgmt_gateway

    Para OL6: /sbin/initctl status mgmt_gateway

    Si el gateway se está ejecutando, párelo:

    Para OL7: systemctl stop mgmt_gateway

    Para OL6: /sbin/initctl stop mgmt_gateway

  • Elimine el RPM del gateway instalado con el siguiente comando: rpm -e oracle.mgmt_gateway --noscripts

  • Elimine los archivos de Gateway restantes con el siguiente comando:

    rm -rf /opt/oracle/mgmt_agent

  • Ejecute lo siguiente:

    Para OL7: rm -rf /etc/systemd/system/mgmt_gateway.service

    Para OL6: rm -rf /etc/init/mgmt_agent.conf

Configuración de Management Gateway

Causa: en algunos casos, es posible que el nombre de host no se resuelva en el entorno de instalación, lo que puede provocar que la instalación falle y aparezca el siguiente mensaje de error:

"No se ha podido resolver el nombre de host <hostname value> en el entorno de instalación. Resuelva el nombre de host o proporcione GatewayCertCommonName en el archivo de respuesta y vuelva a ejecutar el script de configuración de gateway".

Acción:

  • Compruebe y resuelva el nombre de host del entorno para obtener el valor de nombre de doamin totalmente cualificado (FQDN) después de ejecutar el comando: hostname -f
  • Opcionalmente, un usuario puede proporcionar un nombre de dominio totalmente cualificado personalizado para la configuración del gateway mediante la introducción de la propiedad GatewayCertCommonName en el archivo de respuesta de entrada. Consulte Response File Parmaters
  • Vuelva a ejecutar el script de configuración de gateway.
    sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

Causa: en algunos casos, la instalación de Management Gateway puede fallar con el siguiente mensaje de error debido a la ausencia de políticas en OCI o a problemas de límite de recursos en el arrendamiento. Si aparece el siguiente error, siga los pasos que se indican a continuación.

"Fallo al iniciar Management Gateway porque no se han podido crear, inicializar ni recuperar certificados en OCI. Compruebe los logs para obtener más detalles."

Acción:

  • Abra el archivo log en el directorio de instalación de Management Gateway, por ejemplo: /opt/oracle/mgmt_agent/plugins/GatewayProxy/statedir/log/mgmt_gateway.log
  • Si el archivo log contiene alguno de los siguientes códigos de error 404, seleccione una de las siguientes opciones para resolver el problema:
    2023-07-25 15:38:06.694/CEST [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "NotAuthorizedOrNotFound",  "message" : "Authorization failed or requested resource not found."}
    2023-07-25 15:38:06.696/CEST [pool-3-thread-1] ERROR com.oracle.mgmtagent.proxy.ProxyServer - Error while initializing and loading certificate bundlescom.oracle.mgmtagent.proxy.exception.CertificateFailureException: The response status is 404 after multiple retries at com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility.executeRequest(CertificateUtility.java:293) ~
  • Si el archivo log contiene alguno de los siguientes 400 códigos de error, revise las siguientes opciones para resolver el problema:
    2023-09-20 18:51:32.772/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateCreationUtil - Create Vault Service Url invoked https://kms.us-ashburn-1.oraclecloud.com/20180608/vaults
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Received response code 400
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Header name opc-request-id , value /5704D03441842D3818B824B2D6B2712E/1D1FED893474FDA900188E24F3DEE59B
    2023-09-20 18:51:33.401/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "LimitExceeded",  "message" : "The limit for this tenancy has been exceeded."}
    • Compruebe el límite del recurso Recuento de almacén por defecto para el servicio Key Management en la consola de OCI. Puede enviar una solicitud para aumentar los límites de recursos. Para obtener más información, consulte Gestión de claves y Gestión de almacenes.
    • Puede configurar certificados manualmente. Para obtener más información, consulte Realización de requisitos para desplegar Management Gateway y vaya a la sección Gestión manual de certificados.
      Nota

      Al crear los certificados Emitidos por CA interna , el perfil de certificado debe ser Servidor TLS o Cliente TLS y solo están soportados los algoritmos de firma RSA.
  • Si hay otros fallos relacionados con el almacén o las API del servicio de claves en los logs, puede emitir una solicitud y ponerse en contacto con el equipo oci_kms proporcionando el cuerpo de respuesta y opc-request-id.
  • Si hay otros fallos relacionados con las autoridades de certificación o las API del servicio de certificado en los logs, emita una solicitud y póngase en contacto con el equipo oci_certificates proporcionando el cuerpo de respuesta y opc-request-id.

La instalación de Management Gateway falla con un error: no se han podido crear los certificados y el informe de logs de identidad: fallo de autenticación: DATE_OUTSIDE_CLOCK_SKEW

Motivo:

Fallo de autenticación del informe de logs de identidad: DATE_OUTSIDE_CLOCK_SKEW

# /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<PATH>/gateway_agent.rsp/opt/oracle/mgmt_agent/agent_inst/bin/setupAgent.sh
    opts=<PATH>/gateway_agent.rsp

Executing configure

Parsing input response file
Validating install key
Generating communication wallet
Generating security artifactsRegistering Management Gateway
Found service plugin(s):[GatewayProxy]

Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...Done.
GatewayProxy : Successfully deployed external plugin

Gateway setup completed and the gateway is running.
In the future gateway can be started by directly running: sudo systemctl start mgmt_gateway

Please make sure that you delete <PATH>/gateway_agent.rsp or store it in secure location.

Creating gateway system properties file
Creating properties fileCreating or validating certificates
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Failed to start Management Gateway as certificates could not be created, initialized or retrieved in OCI. Please check the logs for more details.
Management Gateway stopped

Acción:

En el host en el que está instalado Management Gateway, asegúrese de que la hora del host es correcta y, a continuación, instale Management Gateway.