Résoudre les problèmes liés à Stack Monitoring

Cette section fournit des informations de dépannage permettant d'identifier et de résoudre les problèmes courants qui peuvent survenir lors de l'utilisation de Stack Monitoring.

Résolution des problèmes d'ordre général

Dans certains cas, il peut être nécessaire de consulter les journaux de l'agent de gestion pour plus de détails :

Pour le module d'extension d'agent de gestion sur l'agent Oracle Cloud (OCA) sur les instances OCI Compute :

/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log

Pour l'agent de gestion autonome (agent installé manuellement) :

/opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log

Les nouveaux droits d'accès dans les types de ressource ne sont pas propagés

Cela est dû au fait qu'IAM ne compile pas une stratégie, sauf en cas de modification apportée à l'instruction de la stratégie.

Pour toute stratégie existante qui utilise des types de ressource, lorsque de nouveaux droits d'accès sont ajoutés au type de ressource, modifiez la stratégie en ajoutant un espace vide. Ensuite, enregistrez la stratégie.

Pour plus d'informations, reportez-vous à Les nouveaux droits d'accès dans les types de ressource ne sont pas propagés.

Erreur de balises non valide

Cela se produit lorsqu'une définition de clé de balise avec un élément Value Type=List inclut une variable de balise en tant qu'élément. L'affectation d'une telle balise à une ressource fonctionne initialement. Toutefois, la validation échoue lors d'actions telles que l'actualisation ou l'affectation d'une nouvelle balise, ce qui entraîne l'erreur Balises non valides.

Syntaxe correcte :

  • Les variables de balise peuvent être utilisées dans les balises par défaut, mais elles ne sont pas prises en charge dans les balises définies avec des valeurs prédéfinies (listes).
  • Une définition de clé de balise ne peut pas inclure de variables de balise en tant que valeurs de liste prédéfinies.

Pour plus d'informations, reportez-vous à Tagging.

Résolution des incidents dans une fenêtre de maintenance

Réessayer une fenêtre de maintenance

Une nouvelle tentative ne peut être effectuée qu'une fois qu'une opération est marquée comme Succès partiel pour les fenêtres de maintenance actives.

Accédez au menu Actions de la fenêtre de maintenance pour accéder à l'option Réessayer.

Topologie mise à jour

Lorsqu'une ressource change de topologie, comme un cluster qui ajoute ou supprime un ou plusieurs de ses serveurs, la fenêtre de maintenance n'est pas automatiquement mise à jour. Pour mettre à jour les ressources incluses dans la fenêtre de maintenance après une modification de topologie, il est nécessaire de modifier la fenêtre de maintenance en fonction de la nouvelle topologie de la ressource.

Fenêtre de maintenance bloquée à l'état "Création"

Si une fenêtre de maintenance est bloquée à l'état "Création" depuis plus de 10 minutes, vous pouvez arrêter la fenêtre de maintenance en sélectionnant Arrêter dans le menu à 3 points.

Si la fenêtre de maintenance est bloquée depuis moins de 10 minutes, elle ne sera pas autorisée à arrêter le processus de création.

Dépannage de Policy Manager

Quota de stratégie atteint


Erreur de quota maximal de Policy Manager

Assurez-vous que les stratégies peuvent être créées dans la location ou utiliser des stratégies existantes (la stratégie doit exister dans le compartiment en cours et dans le compartiment racine). Afin de permettre la création de stratégies, la location nettoie les stratégies obsolètes ou travaille avec Oracle pour augmenter les limites de stratégie. Une fois que de nouvelles stratégies peuvent être créées, réessayez de configurer.

Impossible de créer l'activation automatique de calcul

Policy Manager s'attend à ce que les configurations Stack Monitoring aient le statut ACTIVE, car vous pouvez avoir une configuration de ce type dans le compartiment. Si des configurations ont un statut inattendu, la création de la configuration échoue.


impossible de créer l'activation automatique de calcul

L'état des configurations de nettoyage n'est pas valide dans le compartiment en cours. Pour le nettoyage, utilisez l'interface de ligne de commande ou le kit SDK public, tel que la commande delete.

Dépannage d'un hôte

Echec de la découverte de l'hôte Windows

Erreur :

[host] Discovery failure: ExecutionException: FetchletException: Process invocation failure: java.io.IOException: 
Cannot run program "powershell.exe": CreateProcess error=2, 
The system cannot find the file specified due to FetchletException: Process invocat...;

Solution :

Suivez les étapes ci-dessous pour ajouter PowerShell sur les variables système de l'hôte Windows.

  1. Ouvrez le panneau de contrôle du système et sélectionnez système. Sélectionnez Paramètres système avancés, accédez à l'onglet Avancé et sélectionnez Variables d'environnement.
  2. Sous Variables système, modifiez Path et assurez-vous que le chemin ci-dessous a été ajouté :
    %SYSTEMROOT%\System32\WindowsPowerShell\v1.0\
  3. Réessayer le repérage.

Résoudre les problèmes liés à EBS

Base de données EBS avec redéfinition basée sur l'édition (EBR)

Solution : pour les instances EBS avec l'option EBR activée, après chaque nouvelle édition créée dans la base de données, il est nécessaire d'actualiser la ressource EBS pour mettre à jour les connexions obsolètes aux anciennes éditions détenues par l'agent de gestion et de poursuivre la collecte de mesures. Si elle n'est pas actualisée, les données de mesure cessent d'être collectées.

Echec du repérage Weblogic EBS "Exception inattendue due à IOException

Cause possible : les informations d'identification d'hôte d'agent ou d'agent sélectionnées pour le repérage de ressources sont incorrectes. Impossible d'établir une connexion pour effectuer l'opération de repérage.

Solution : entrez à nouveau les détails de l'agent et de l'hôte, puis réessayez. Si aucun agent de gestion n'existe, installez un agent de gestion (reportez-vous à Installation de l'agent de gestion) et réessayez de repérer les ressources.

Résoudre les problèmes liés à OUD

Les journaux se trouvent sous <CUSTOM_EXPORTER_DIRECTORY_PATH>/logs.

Si l'exportateur OUD a été configuré, mais qu'aucune mesure n'est en cours de téléchargement vers le service de télémétrie, reportez-vous aux journaux de l'agent de gestion, situés sous <MANAGEMENT_AGENT_INSTALLATION_DIRECTORY>/log, et recherchez OUD <RESOURCE_NAME>.

Dépannage de PeopleSoft

Comportement du travail de découverte

Lors de l'exécution d'un travail de repérage PeopleSoft, chaque élément de travail de domaine Process Scheduler génère un journal. Les journaux détaillent les succès et les erreurs (par exemple, un domaine en cours d'arrêt). Chaque entrée de journal inclut un ID d'élément de travail pour faciliter le suivi.

Messages d'erreur de repérage

Erreur d'échec de validation de base de données

En cas d'échec d'un travail de repérage, utilisez l'ID d'élément de travail pour rechercher des messages détaillés. Si la base de données affiche le statut Non signalé, assurez-vous que l'utilisateur de surveillance n'a pas expiré. S'il a expiré, réinitialisez son mot de passe.

Les erreurs courantes et leurs corrections sont les suivantes :

Informations d'identification et de connexion non valides :

  • Erreur : Invalid username/password, logon denied
  • Cause : nom utilisateur ou mot de passe incorrect.
  • Solution : saisissez à nouveau les informations d'identification correctes dans la section Informations d'identification de la base de données.
Erreurs de nom d'hôte :
  • Erreur : IO Error: The Network Adapter could not establish a connection due to UnknownHostException. Name or service not known
  • Cause : hôte incorrect ou mal orthographié dans la section Base de données PSFT.
  • Solution : corrigez le nom d'hôte et réessayez le travail de repérage.
Echec de la connexion:
  • Erreur : Connection refused, socket connect lapse
  • Cause : numéro de port incorrect.
  • Solution : entrez le port de base de données correct et réessayez.

  • Erreur : Failed to connect: java.sql.SQLException: ORA-01017: invalid username/password
  • Cause : le caractère numérique initial du mot de passe DBSNMP est la cause première, car il est en conflit avec les spécifications de surveillance de Stack.
  • Solution : Pour résoudre ce problème, modifiez votre mot de passe DBSNMP en vous assurant qu'il commence par un caractère alphabétique ou un trait de soulignement. Cela garantit la conformité aux normes de surveillance de Stack. Mettez ensuite à jour vos fichiers ou paramètres de configuration de surveillance avec les nouvelles informations d'identification de mot de passe. Lancez ensuite un processus de redécouverte.

Erreur du processus d'écoute :

  • Erreur : Listener refused the connection with the following error: ORA-12514, TNS: listener does not currently know of service requested in connect descriptor
  • Cause : nom de service de base de données incorrect.
  • Solution : Entrez le nom de service de base de données correct dans la section Base de données PSFT.

Les ressources de domaine Process Scheduler sont affichées comme étant arrêtées :

  • Erreur : le journal de l'agent affiche l'erreur : “WARN - failed to connect for cache: url service:jmx:rmi:///jndi/rmi://<ps_domain_host>:<admin_port>/<domain_name>/DomainRuntime/DefaultConnector
  • Cause : échec de la connexion JMX entre l'hôte de l'agent de surveillance et le domaine Process Scheduler en raison d'une modification du numéro de port d'administration du domaine.
  • Solution : redémarrez le domaine dans psadmin et actualisez Peoplesoft comme décrit sous Actualisation PeopleSoft.

Erreur de validation des familles de ressources

PeopleSoft possède les familles de ressources suivantes :

  • Domaine de serveur d'applications
  • Domaine Process Scheduler
  • PeopleSoft Architecture Internet (PIA)

Il peut y avoir plusieurs ressources de chaque famille dans un travail de découverte. Un travail de repérage sera marqué comme réussi si au moins une ressource de chaque type réussit. Par conséquent, un travail peut réussir même en cas d'échec de certains éléments de travail pour certaines ressources enfant.

Echec du repérage pour oracle_psft_appserv" (également applicable à oracle_psft_pcrs) :

  • Cause : informations d'identification non valides
  • Solution : saisissez les informations d'identification correctes.

Echec de l'extraction de NameNotFoundException

  • Cause : domaine arrêté
  • Solution : assurez-vous que l'application/le domaine est en cours d'exécution dans la console PeopleSoft et redémarrez si nécessaire.

Configuration incorrecte du domaine PIA

  • Cause : se produit lorsqu'un domaine PIA est arrêté ou mal configuré.
  • Solution : corrigez la configuration du domaine PIA.

Erreurs Elasticsearch

Si la recherche élastique est repérée avec le repérage PeopleSoft, ce repérage d'élément de travail définit le succès ou l'échec du repérage PeopleSoft. Si une erreur se produit lors du repérage d'Elastic Search et que l'élément de travail échoue, le travail de repérage PeopleSoft ne réussira pas non plus.

500 ERREUR SERVEUR :

  • Cause : échec de la collecte des données en raison d'un nom utilisateur non valide.

  • Solution : saisissez le nom d'utilisateur correct.

401 Accès non autorisé :

  • Cause : informations d'identification non valides.

  • Solution : assurez-vous que le mot de passe correct est fourni.

FileNotFoundException:

  • Cause : le chemin du fichier TrustStore est incorrect ou le fichier est manquant.

  • Solution : corrigez le chemin TrustStore et assurez-vous que le fichier est accessible par l'hôte de l'agent.

Résoudre les problèmes liés à SOA

Surveiller les applications SOA créées à partir d'images Marketplace :

Lorsqu'une application SOA est provisionnée à l'aide d'une image Market Place, les données des mesures SOA ne sont pas renseignées. Les images Marketplace placent les fichiers de configuration SOA et WebLogic à deux emplacements distincts. Pour remplir les mesures SOA, copiez les fichiers de configuration à partir des fichiers de configuration vers le répertoire WebLogic.

Copiez les fichiers comme indiqué et redémarrez Weblogic.

Les mesures d'infrastructure SOA commenceront à apparaître dans quelques minutes après le redémarrage de Weblogic

L'image Marketplace installe les suites SOA à un emplacement différent de celui de la pile Weblogic

/u01/app/oracle/middleware — Weblogic
/u01/app/oracle/suite/  --- SOA Suite

Veuillez copier les fichiers suivants :

De : /u01/app/oracle/suite/em/adml

-rwxrwxr-x. 1 oracle oracle 21156 18 mai 2011 server-scheduler_service.xml

-rwxrwxr-x. 1 oracle oracle 15788 18 mai 2011 domain-scheduler_service.xml

-rwxrwxr-x. 1 oracle oracle 2929 11 nov. 2013 server-bea_alsb.xml

-rwxrwxr-x. 1 oracle oracle 242238 28 février 2016 server-oracle_soainfra.xml

-rwxrwxr-x. 1 oracle oracle 232504 10 juillet 2016 server-oracle_soainfra_partition.xml

-rwxrwxr-x. 1 oracle oracle 2992 15 août 2016 server-oracle_soa_composite-11.0.xml

-rwxrwxr-x. 1 oracle oracle 95241 16 janvier 2017 domaine-oracle_soainfra.xml

A : /u01/app/oracle/middleware/em/adml