Solución de problemas de Stack Monitoring

Los temas de esta sección proporcionan información de solución de problemas para identificar y abordar problemas comunes que se pueden producir al trabajar con Stack Monitoring.

Solución de problemas generales

En algunos casos, puede que sea necesario revisar los logs de Management Agent para obtener más información:

Para el plugin de Management Agent en Oracle Cloud Agent (OCA) en instancias informáticas de OCI:

/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log

Para Standalone Management Agent (agente instalado manualmente):

/opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log

No se propagan los nuevos permisos en los tipos de recursos

Esto sucede porque IAM no recompila una política a menos que haya un cambio en la sentencia de política.

Para cualquier política existente que utilice tipos de recursos, cuando se agreguen nuevos permisos al tipo de recurso, edite la política agregando un espacio en blanco. A continuación, guarde la política.

Para obtener más información, consulte No se propagan los nuevos permisos en los tipos de recursos.

Error de etiquetas no válidas

Esto sucede cuando una definición de clave de etiqueta con Value Type=List incluye una variable de etiqueta como elemento. La asignación de dicha etiqueta a un recurso funciona inicialmente. Sin embargo, la validación falla durante acciones como refrescar o al asignar una nueva etiqueta, lo que da como resultado el error Etiquetas no válidas.

Uso correcto:

  • Las variables de etiqueta se pueden utilizar en etiquetas por defecto, pero no están soportadas en etiquetas definidas con valores predefinidos (listas).
  • Una definición de clave de etiqueta no puede incluir variables de etiqueta como valores de lista predefinidos.

Para obtener más información, consulte Tagging.

Resolución de problemas de una ventana de mantenimiento

Reintentar una ventana de mantenimiento

Un reintento solo se puede realizar después de que una operación se marque como Correcto parcial para Windows de mantenimiento activo.

Acceda al menú de acciones de la ventana de mantenimiento para acceder a la opción Reintentar.

Topología actualizada

Cuando un recurso cambia su topología, como un cluster que agrega o elimina uno o varios de sus servidores, la ventana de mantenimiento no se actualiza automáticamente. Para actualizar los recursos incluidos en la ventana de mantenimiento después de un cambio de topología, es necesario editar la ventana de mantenimiento según la nueva topología del recurso.

Ventana de mantenimiento parada en estado "Creando"

Si una ventana de mantenimiento se ha bloqueado en el estado "Creando" durante más de 10 minutos, la ventana de mantenimiento se puede detener seleccionando Detener en el menú de 3 puntos.

Si la ventana de mantenimiento se ha bloqueado durante menos de 10 minutos, la ventana de mantenimiento no podrá detener el proceso de creación.

Solución de problemas de Policy Manager

Cuota de política alcanzada


Error de cuota máxima de Policy Manager

Asegúrese de que se pueden crear nuevas políticas en el arrendamiento o de que se pueden utilizar políticas existentes (la política debe existir en el compartimento actual y en el compartimento raíz). Para permitir la creación de nuevas políticas, el arrendamiento limpie políticas obsoletas o trabaje con Oracle para aumentar los límites de las políticas. Una vez que se puedan crear nuevas políticas, vuelva a intentar la configuración.

No se puede crear la activación automática de Compute

Policy Manager espera que las configuraciones de Stack Monitoring estén en estado ACTIVE, ya que puede tener una de estas configuraciones en el compartimento. Si hay configuraciones en estado inesperado, la creación de la configuración fallará.


no se puede crear la activación automática de recursos informáticos

Configuraciones de limpieza en estado no válido en el compartimento actual. Para la limpieza, utilice el SDK o la CLI públicos, como el comando delete.

Solución de problemas de un host

Fallo de detección de host de Windows

Error:

[host] Discovery failure: ExecutionException: FetchletException: Process invocation failure: java.io.IOException: 
Cannot run program "powershell.exe": CreateProcess error=2, 
The system cannot find the file specified due to FetchletException: Process invocat...;

Solución:

Realice los siguientes pasos para agregar PowerShell en las variables del sistema host de Windows.

  1. Abra el panel de control del sistema y seleccione Sistema. Seleccione Configuración avanzada del sistema, vaya al separador Avanzada y seleccione Variables de entorno.
  2. En Variables del sistema, edite Path y asegúrese de que se haya agregado la siguiente ruta:
    %SYSTEMROOT%\System32\WindowsPowerShell\v1.0\
  3. Volver a intentar detección.

Solución de problemas de EBS

Base de Datos de EBS con Redefinición Basada en Edición (EBR)

Solución: para las instancias de EBS con EBR activado, después de cada nueva edición creada en la base de datos, es necesario refrescar el recurso de EBS para actualizar las conexiones anticuadas a las ediciones antiguas que tiene el agente de gestión y continuar con la recopilación de métricas. Si no se refrescan, los datos de métricas dejarán de recopilarse.

La detección de Weblogic de EBS falla "Excepción inesperada debido a IOException

Posible causa: credenciales de host de agente o agente de gestión incorrectas seleccionadas para la detección de recursos. No se ha podido establecer una conexión para realizar la operación de detección.

Solución: vuelva a introducir los detalles del agente y el host y vuelva a intentarlo. Si no existe ningún agente de gestión, instale un agente de gestión (consulte Instalación del agente de gestión) y vuelva a intentar la tarea de detección de recursos.

Solución de problemas de OUD

Los logs se pueden encontrar en <CUSTOM_EXPORTER_DIRECTORY_PATH>/logs.

Si el exportador de OUD se ha configurado correctamente, pero no se está cargando ninguna métrica en el servicio de telemetría, consulte los logs del agente de gestión, que se encuentran en <MANAGEMENT_AGENT_INSTALLATION_DIRECTORY>/log y busque OUD <RESOURCE_NAME>.

Solucionar problemas de PeopleSoft

Comportamiento de puesto de detección

Al ejecutar un trabajo de detección PeopleSoft, cada elemento de trabajo del dominio del programador de procesos genera un log. Registra errores y éxitos detallados (como un dominio caído). Cada entrada de log incluye un ID de elemento de trabajo para facilitar el seguimiento.

Mensajes de Error de Detección

Error de validación de base de datos

Cuando un trabajo de detección falla, utilice el ID de elemento de trabajo (WI) para buscar mensajes detallados. Si la base de datos muestra el estado No de informes, asegúrese de que el usuario de supervisión no ha caducado. Si ha caducado, restablezca su contraseña.

Los errores comunes y sus correcciones incluyen:

Credenciales no válidas:

  • Error: Invalid username/password, logon denied
  • Causa: nombre de usuario o contraseña incorrectos.
  • Solución: vuelva a introducir las credenciales correctas en la sección Database Credentials.
Errores de nombre de host:
  • Error: IO Error: The Network Adapter could not establish a connection due to UnknownHostException. Name or service not known
  • Causa: host incorrecto o mal escrito en la sección Base de datos PSFT.
  • Solución: corrija el nombre de host y vuelva a intentar el trabajo de detección.
Fallo de conexión:
  • Error: Connection refused, socket connect lapse
  • Causa: número de puerto incorrecto.
  • Solución: introduzca el puerto de base de datos correcto y vuelva a intentarlo.

  • Error: Failed to connect: java.sql.SQLException: ORA-01017: invalid username/password
  • Causa: el carácter numérico inicial de la contraseña de DBSNMP es la causa raíz, ya que entra en conflicto con las especificaciones de supervisión de Stack.
  • Solución: Para solucionarlo, modifique la contraseña de DBSNMP, asegurándose de que comience con un carácter alfabético o un guion bajo. Esto garantiza el cumplimiento de los estándares de supervisión de Stack. A continuación, actualice los archivos o valores de configuración de supervisión con las nuevas credenciales de contraseña. A continuación, inicie un proceso de redescubrimiento.

Error de Listener:

  • Error: Listener refused the connection with the following error: ORA-12514, TNS: listener does not currently know of service requested in connect descriptor
  • Causa: nombre de servicio de base de datos incorrecto.
  • Solución: introduzca el nombre de servicio de base de datos correcto en la sección Base de datos PSFT.

Los recursos de dominio del programador de procesos se muestran como caídos:

  • Error: El log del agente muestra el error: “WARN - failed to connect for cache: url service:jmx:rmi:///jndi/rmi://<ps_domain_host>:<admin_port>/<domain_name>/DomainRuntime/DefaultConnector
  • Causa: la conexión JMX del host del agente de supervisión al dominio del programador de procesos ha fallado debido a un cambio en el número de puerto de administración del dominio.
  • Solución: reinicie el dominio en psadmin y refresque Peoplesoft como se describe en PeopleSoft Refresh.

Error de validación de familias de recursos

PeopleSoft tiene las siguientes familias de recursos:

  • Dominio del servidor de la aplicación
  • Dominio del Gestor de Procesos
  • PeopleSoft Arquitectura de Internet (PIA)

Puede haber varios recursos de cada familia en un trabajo de descubrimiento. Un trabajo de detección se marcará como correcto si al menos un recurso de cada tipo es correcto. Por lo tanto, un trabajo puede tener éxito incluso si algunos elementos de trabajo fallan para algunos recursos secundarios.

Fallo de detección para oracle_psft_appserv" (también se aplica a oracle_psft_pcrs):

  • Causa: credenciales no válidas
  • Solución: introduzca las credenciales correctas.

Fallo al recuperar NameNotFoundException

  • Causa: dominio caído
  • Solución: asegúrese de que la aplicación/dominio se esté ejecutando en la consola PeopleSoft y reinicie si es necesario.

Configuración incorrecta de dominio de PIA

  • Causa: se produce cuando un dominio de PIA está caído o mal configurado.
  • Solución: Corrija la configuración del dominio PIA.

Errores de Elasticsearch

Si se detecta Elasticsearch junto con la detección PeopleSoft, esta detección de elementos de trabajo definirá el éxito o fallo de la detección PeopleSoft. Si se produce un error al detectar Elasticsearch y falla el elemento de trabajo, el trabajo de detección PeopleSoft tampoco se realizará correctamente.

500 ERROR DEL SERVIDOR:

  • Causa: fallo al recopilar datos debido a un nombre de usuario no válido.

  • Solución: introduzca el nombre de usuario correcto.

401 Acceso no Autorizado:

  • Causa: credenciales no válidas.

  • Solución: asegúrese de que se proporciona la contraseña correcta.

FileNotFoundException:

  • Causa: la ruta del archivo TrustStore es incorrecta o falta el archivo.

  • Solución: corrija la ruta de acceso TrustStore y asegúrese de que el host del agente pueda acceder al archivo.

Solución de Problemas de SOA

Supervisión de aplicaciones SOA creadas a partir de imágenes de Marketplace:

Cuando se aprovisiona una aplicación SOA mediante Market Place Image, no se rellenan los datos de las métricas relacionadas con SOA. Las imágenes de Marketplace colocan los archivos de configuración de SOA y WebLogic en dos ubicaciones separadas. Para rellenar las métricas de SOA, copie los archivos de configuración de los archivos de configuración en el directorio WebLogic.

Copie los archivos como se indica y reinicie Weblogic.

Las métricas de infraestructura de SOA comenzarán a aparecer en unos minutos después del reinicio de Weblogic

La imagen de Marketplace está instalando conjuntos de SOA en una ubicación diferente a la pila de Weblogic

/u01/app/oracle/middleware — Weblogic
/u01/app/oracle/suite/  --- SOA Suite

Copie los siguientes archivos:

Desde: /u01/app/oracle/suite/em/adml

-rwxrwxr-x. 1 oracle oracle 21156 mayo 18 2011 server-scheduler_service.xml

-rwxrwxr-x. 1 oracle oracle 15788 mayo 18 2011 domain-scheduler_service.xml

-rwxrwxr-x. 1 oracle oracle 2929 Nov 11 2013 server-bea_alsb.xml

-rwxrwxr-x. 1 oracle 242238 Feb 28 2016 server-oracle_soainfra.xml

-rwxrwxr-x. 1 oracle oracle 232504 Jul 10 2016 server-oracle_soainfra_partition.xml

-rwxrwxr-x. 1 oracle oracle 2992 Aug 15 2016 server-oracle_soa_composite-11.0.xml

-rwxrwxr-x. 1 oracle oracle 95241 Ene 16 2017 domain-oracle_soainfra.xml

Para: /u01/app/oracle/middleware/em/adml