Dépannage du service d'agents de gestion

Cette section décrit certains problèmes et résolutions typiques liés au service des agents de gestion, tels que l'installation et la désinstallation avec les agents de gestion et les passerelles de gestion.

Rubriques :

Dépanner les problèmes d'installation et de configuration des agents de gestion

Les utilisateurs peuvent rencontrer diverses erreurs lors du processus d'installation et de configuration d'Oracle Management Agent. Les causes de certaines erreurs communes et les actions recommandées sont listées ci-dessous.

Dépanner : Désinstallez l'agent et supprimez le fichier de service avant d'installer le nouvel agent.

Cause : Un agent est déjà installé sur votre hôte. Un processus de désinstallation précédent n'a pas réussi à supprimer le fichier du service d'agent.

Action :
  • Exécutez rpm -e oracle.mgmt_agent pour désinstaller l'agent. Si la commande aboutit, essayez d'installer le nouvel agent. Dans le cas contraire, essayez l'action recommandée suivante.
  • Exécutez ls /opt/oracle/mgmt_agent pour vérifier s'il reste des éléments de l'installation précédente de l'agent. Si vous en trouvez, supprimez-les en exécutant : rm -rf /opt/oracle/mgmt_agent.
  • Vérifiez s'il existe déjà un fichier de service d'agent à l'emplacement suivant, selon votre version Linux :
    • Pour OL7 (si vous utilisez systemd) : /etc/systemd/system/mgmt_agent.service
    • Pour OL6 (si vous utilisez init) : /etc/init/mgmt_agent.conf.

      Si ce fichier de service existe, supprimez-le en exécutant : rm -rf /etc/init/mgmt_agent.conf, puis réessayez d'installer le nouvel agent.

Dépannage : Java n'est pas une JVM 64 bits. Définissez le chemin d'une JVM 64 bits dans la variable d'environnement JAVA_HOME ou Java introuvable, définissez votre chemin privilégié dans JAVA_HOME.

Cause : La variable d'environnement JAVA_HOME n'est pas définie ou ne pointe pas vers un emplacement de JDK à 64 bits.

Action : Réglez la variable d'environnement JAVA_HOME à la version de JDK appropriée et réessayez d'installer l'agent. Actuellement, seul JDK 64 bits est pris en charge.

Dépannage : Échec de l'installation de l'agent avec le message : useradd : Impossible d'obtenir un IDG unique (aucun autre IDG disponible)

Cause : Le script d'installation ne peut pas ajouter un utilisateur et un groupe lors du processus d'installation de l'agent de gestion, car les ID groupe disponibles sur votre système Linux sont déjà utilisés.

Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent) 
useradd: Can't get unique GID (no more available GIDs) 
useradd: can't create group 
Agent installation failed, please check log file

Action : Consultez l'administrateur du système avant d'effectuer les opérations suivantes :

  1. Modifiez le fichier /etc/login.defs. Vous devez disposer des privilèges sudo pour modifier ce fichier.

    Recherchez les entrées suivantes :
    SYS_GID_MIN               nnnn
    SYS_GID_MAX               mmmm
    SYS_UID_MIN               pppp
    SYS_UID_MAX               qqqq
    nnnn et pppp sont les valeurs minimales et mmmm et qqqq, les valeurs maximales.

    Si les entrées ci-dessus n'existent pas dans le fichier, ajoutez-les.

  2. Mettez à jour la valeur de l'entrée SYS_GID_MAX en fonction de la recommandation de l'administrateur du système et enregistrez le fichier.

  3. Supprimez l'installation de l'agent qui a échoué en exécutant : sudo rpm -e oracle.mgmt_agent.

  4. Déconnexion de l'interpréteur de commandes suivie d'une connexion.

  5. Réessayez d'installer l'agent.

Dépannage : Ajout d'utilisateur : Impossible de créer le répertoire /usr/share/mgmt_agent

Lors de l'installation de l'agent de gestion, l'utilisateur mgmt_agent est créé avec l'emplacement du répertoire de base par défaut sous /usr/share/mgmt_agent.

Cause : Les autorisations de fichier sous /usr/share sont insuffisantes ou le système de fichiers est en lecture seule.

Actions possibles :

  • Définissez les autorisations de fichier pour accorder à l'utilisateur mgmt_agent l'accès à l'emplacement du répertoire de base de l'utilisateur par défaut : /usr/share.

  • Définissez un autre emplacement de répertoire de base à l'aide de la variable d'environnement USER_HOME_DIR_ROOT si vous souhaitez utiliser un emplacement différent.

    Réglez la variable d'environnement USER_HOME_DIR_ROOT au chemin que vous préférez utiliser comme répertoire de base pour l'utilisateur mgmt_agent et assurez-vous que l'utilisateur de l'agent de gestion dispose des autorisations de fichier appropriées sur ce répertoire privilégié.

Dépannage : Windows : Le système ne trouve pas le chemin d'accès spécifié. Échec de l'installation de l'agent.

NIVEAU D'ERREUR=9009

Cause possible : Les variables d'environnement n'ont pas été définies correctement en raison d'espaces dans le nom du répertoire/dossier.

Les environnements Windows permettent d'utiliser des espaces dans un nom de répertoire ou de dossier, ce qui entraîne un problème avec l'installation de l'agent de gestion, car des guillemets sont ajoutés automatiquement au nom par Windows. Par exemple, il existe un répertoire/dossier nommé : Program Files. Dans ce cas, Windows insère automatiquement des guillemets car il y a un espace dans le nom du dossier, et il dira maintenant : "Program Files".

Les guillemets supplémentaires peuvent causer un problème car le programme d'installation de l'agent de gestion n'autorise pas les guillemets pour les variables d'environnement telles que JAVA_HOME et AGENT_INSTALL_BASEDIR.

Note

Le programme d'installation de l'agent de gestion n'accepte pas les caractères spéciaux suivants dans le chemin : [, ^^, ", ', & ou ].

Action :

La méthode recommandée pour configurer des variables d'environnement dans Windows consiste à utiliser les paramètres de système avancés.
  • Dans la barre des tâches Windows, cliquez avec le bouton droit de la souris sur l'icône Windows et sélectionnez Système.
  • Dans la fenêtre Paramètres, sous Paramètres connexes, cliquez sur Paramètres de système avancés.

    Paramètres avancés de Windows

  • Dans l'onglet Avancé, cliquez sur Variables d'environnement.

    Variables d'environnement Windows

  • Cliquez sur New (Nouveau) pour créer une variable d'environnement. Cliquez sur Modifier pour modifier une variable d'environnement existante.
  • Après avoir créé ou modifié la variable d'environnement, cliquez sur Appliquer, puis sur OK pour que la modification entre en vigueur.
    Note

    L'interface utilisateur graphique pour la création de variables d'environnement peut varier légèrement selon votre version de Windows.

Dépannage : Le statut de l'agent de gestion est "Non disponible" dans la console après l'installation initiale

Cause possible 1 : Horodatage de système incorrect

Action : Vérifiez l'heure système de l'hôte de l'agent, puis vous pouvez corriger l'heure si nécessaire.

Cause possible 2 : Si vous utilisez le fichier de réponses input.rsp pour l'agent de gestion, vous devez définir les marqueurs du compartiment de l'agent de gestion.

Si les marqueurs ne sont pas définis, vous pouvez voir une erreur comme suit :

Attempts:
<--> Endpoint:       management-agent.us-ashburn-1.oci.oraclecloud.com
     opc-request-id: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXJ8
     StartTime:      2024-09-18 03:45:12,662 GMT
     Status:         400 Bad Request
     Headers:        Strict-Transport-Security=max-age=31536000; includeSubDomains;
                     Connection=close
                     Content-Length=63
                     opc-request-id=XXXXXXXXXXXXXXXXXXXXXXXX..................B25ADA8E
                     Date=Wed, 18 Sep 2024 03:45:12 GMT
                     Content-Type=application/json
     ErrorBody:      
{
  "code" : "InvalidParameter",
  "message" : "Invalid tags"
}

Action : Pour définir les marqueurs propres à votre environnement, dans le fichier de réponses input.rsp, ajoutez les paramètres suivants et spécifiez les paires clé-valeur pour votre environnement. Pour plus d'informations, voir Créer un fichier de réponses.

DefinedTags = [{"namespace1":{"<key1>":"<value1>"}},
      {"namespace2":{"<key2>":"<value2>"}}]

Dépannage : Après la configuration, l'agent de gestion n'est pas visible dans la console ou au moyen de l'API

Cause possible : Si, après avoir configuré l'agent de gestion ou l'agent de passerelle de gestion, l'agent ne s'affiche pas dans la console Oracle Cloud ou au moyen de l'API, les politiques correctes peuvent ne pas être configurées pour l'utilisateur ou le groupe d'utilisateurs.

Action : Vérifiez que l'utilisateur ou le groupe d'utilisateurs a les politiques requises configurées pour l'agent de gestion ou l'agent de passerelle. Pour configurer des politiques, voir Créer des politiques pour un groupe d'utilisateurs.

Dépannage : Les mesures Prometheus ou Kubernetes surveillées à l'aide de l'agent de gestion ne sont pas disponibles

Causes possibles : L'agent de gestion n'a pas besoin de groupe dynamique ou de politiques pour ses propres mesures, mais pour les mesures Prometheus et Kubernetes. L'utilisateur doit définir un groupe dynamique et une politique qui permettent aux agents de ce groupe dynamique de publier des mesures dans le service de surveillance pour OCI. Si les mesures ne s'affichent pas dans le compartiment ou l'espace de noms du service de surveillance OCI, vous pouvez vérifier les politiques et le groupe dynamique.
  • a) Politiques manquantes

    Action : Vérifiez que les politiques ont été ajoutées à l'agent de gestion comme décrit dans les instructions de configuration. Pour plus de détails, voir Configurer Oracle Cloud Infrastructure pour le service d'agent de gestion.

    Si les politiques sont manquantes, ajoutez-les comme décrit sous Configurer le service d'agent de gestion pour Oracle Cloud Infrastructure.

  • (b) Fautes d'orthographe dans les politiques

    Action : Vérifiez si la syntaxe des politiques présente des erreurs en les comparant aux exemples de politiques. Pour plus de détails, voir Configurer Oracle Cloud Infrastructure pour le service d'agent de gestion.

    Par exemple, assurez-vous que la définition du groupe dynamique est conforme à la syntaxe suivante, avec des guillemets simples autour de l'ID compartiment et du type de ressource managementagent :

    ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
  • (c) ID compartiment incorrect dans la définition du groupe dynamique

    Action : Vérifiez que l'ID compartiment de la clé d'installation est identique à l'ID compartiment spécifié dans la définition du groupe dynamique de l'agent. Par défaut, l'agent est créé dans le compartiment de la clé d'installation.

Dépannage : L'agent s'exécute dans OutOfMemoryException

Cause possible : L'agent risque de manquer de mémoire de tas s'il n'est pas réglé correctement pour prendre en charge le chargement qui lui a été affecté.

Action : Mettez à jour les paramètres de mémoire de tas pour l'agent de gestion.

La configuration prête à l'emploi pour le tas maximal de l'agent est :
  • 128 Mo pour l'agent de gestion en tant que plugiciel OCA.
  • 512 Mo pour l'agent de gestion autonome. ( Celui téléchargé à partir de la console de l'agent de gestion).
L'utilisateur peut mettre à jour et affecter plus de tas à l'agent en procédant comme suit :
  • Ouvrez le fichier : agent_inst/config/java.options.
  • Modifiez le fichier ci-dessus. Mettez à jour le paramètre de tas en modifiant la ligne suivante : -Xmx512m

    Par exemple : La ligne ci-dessus définit le tas maximal pour l'agent sur 512 Mo.

    Pour remplacer le tas par 800 Mo, mettez à jour la ligne ci-dessus comme suit : -Xmx800m

  • Enregistrez le fichier et redémarrez l'agent pour que les modifications prennent effet.

Dépannage : L'agent de gestion OCI ne démarre pas sur un hôte Windows

Cause possible : Si l'agent démarre et échoue avec l'erreur suivante, cela peut être dû à l'échec de la mise à niveau automatique de l'agent de gestion. Vous pouvez voir les erreurs suivantes.

C:\Oracle\mgmt_agent\agent_inst\log>NET START mgmt_agent
The Oracle Management Agent service is starting...................
The Oracle Management Agent service could not be started.

A service specific error occurred: 1.

More help is available by typing NET HELPMSG 3547.

Dans ce fichier journal, C:\Oracle\mgmt_agent\agent_inst\log\mgmt_agent.log, vous pouvez voir l'erreur suivante.

[SysExecutor.0 (PrometheusEmitter.Agent-discovery)-131] INFO - DiscoveryItemTask PrometheusEmitter.Agent-discovery - autoPromote
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Cleaning up old files...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - On windows, skipping file owner check
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Starting agent upgrade from version [231002.2039] to version [231002.2040]...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Inserted RequestSigner associated with request SigningRequester[get([])] for signingKey:SigningKey[xxxxxxxxxxxx]
[SysExecutor.1 (ManagedAgent upgradechecker)-133] INFO - Package Stream size:99003892
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully unzipped agent upgrade package at: 
C:\Oracle\mgmt_agent\zip\unpack
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully copied C:\Oracle\mgmt_agent\agent_inst\bin\agentUpgrader.bat to 
C:\Oracle\mgmt_agent\agent_inst\bin\tmpAgentUpgrader.bat
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully deleted previous wrapper backup file:
C:\Oracle\mgmt_agent\agent_inst\config\wrapper.conf.backedUpForUpgrade
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Backed up wrapper.conf to attempt agent upgrade
[SysExecutor.1 (ManagedAgentupgrade checker)-133] INFO - Built macros for processing wrapper.conf as:{%SERVICE_TYPE%=mgmt_agent,%JAVA_HOME%=c:\Program 
Files\Java\jre-1.8,%EMSTATE%=C:\Oracle\mgmt_agent\agent_inst, %CORE_JAR%=agent-upgrader-1.0.3235.jar,%VERSION%=231002.2039, 
%ORACLE_HOME%=C:\Oracle\mgmt_agent\231002.2039}
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Processed wrapper.conf.template to point it to agent upgrader
[SysExecutor.1(ManagedAgent upgrade checker)-133] INFO - Exiting for wrapper to spin up the agent upgrader...

Action : Pour corriger le problème :

  1. Arrêtez l'agent de gestion sur l'hôte Windows, puis entrez les commandes suivantes :
    NET STOP mgmt_agent
    cd C:\Oracle\mgmt_agent\agent_inst\config
    Backup wrapper.conf
    Rename wrapper.conf.backedUpForUpgrade to wrapper.conf
  2. Démarrez le service d'agent de gestion.
  3. Mettez à niveau l'agent de gestion, voir Mise à niveau manuelle Windows.

Maintenant, après la mise à niveau, l'agent affiche Active sous Observability & Management.

Dépannage : La mise à niveau automatique de l'agent de gestion ne fonctionne pas ou certains agents ont été ignorés

Cause possible : Si la mise à niveau automatique de l'agent de gestion OCI ne fonctionne pas pour certains agents de gestion, il est possible que la mise à niveau automatique de l'agent de gestion ait cessé de fonctionner car certains fichiers ou répertoires étaient détenus par des responsables non valides dans le système de fichiers de l'agent.

Par exemple, si certains fichiers ou répertoires de l'emplacement suivant ne disposent pas des autorisations appropriées, la mise à niveau automatique de l'agent ne fonctionne pas : /opt/oracle/mgmt_agent/agent_inst.

Dans ce fichier journal, vous pouvez trouver l'erreur suivante : /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log

ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/db00_cred.json,
/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.backup]
(ManagedAgent upgrade checker)-32] WARN - Files with invalid owners were found, skipping auto-upgrade

Action : Sur l'hôte de l'agent de gestion, vérifiez que, sous le système de fichiers de l'agent, tous les fichiers et répertoires appartiennent au responsable mgmt_agent et au groupe mgmt_agent:mgmt_agent afin que la mise à niveau automatique de l'agent de gestion puisse se terminer.

Dépannage : Adresse IP affichée dans la colonne d'hôte lorsque l'agent de gestion est installé sur l'hôte Windows

Problème : L'agent de gestion est installé sur un hôte Windows et la console de l'agent de gestion affiche l'adresse IP de l'hôte Windows dans la console Oracle Cloud au lieu d'afficher un nom de domaine complet ou un nom d'hôte Windows.

Action :
  1. Connectez-vous à votre hôte Windows et ouvrez le panneau de configuration.
  2. Sélectionnez Système et sécurité, puis Système.
  3. Allez à la section Nom d'ordinateur, domaine et paramètres de groupe de travail, puis cliquez sur Modifier les paramètres.

    La fenêtre Propriétés du système s'affiche.

  4. Si elle n'est pas sélectionnée, cliquez sur Nom de l'ordinateur.
  5. Allez au message suivant : Pour renommer cet ordinateur, son domaine ou son groupe de travail, cliquez sur Modifier.
  6. Sélectionnez Modifier, une fenêtre Modifications de nom d'ordinateur/domaine s'affiche.

    Par exemple, si le nom de domaine complet de l'hôte Windows est : FOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.com, entrez le nom abrégé de l'hôte WindowsFOOBAR004 dans la zone de texte Nom de l'ordinateur.

  7. Sélectionnez Plus, la fenêtre Suffixe DNS et NetBIOS Nom de l'ordinateur s'affiche.
  8. Dans la zone de texte Suffixe DNS principal de cet ordinateur, entrez le nom DNS de l'hôte Windows.

    Par exemple : subnet1ab2regsu.exampletenantreg1.abcvcn.com

  9. Sélectionnez OK ou Appliquer, puis fermez toutes les fenêtres ouvertes.
  10. Redémarrez l'hôte Windows.
  11. Désinstallez l'agent de gestion existant en exécutant le script uninstaller.bat à partir du terminal Windows.
  12. Installez à nouveau l'agent de gestion sur l'ordinateur Windows.

L'installation de l'agent de gestion doit réussir et, dans la page Agent, le nom de domaine complet de l'hôte Windows s'affiche dans la colonne hôte.

Dépannage : Échec de l'installation de l'agent de gestion sur SELinux lors de l'utilisation d'un volume externe

Le service d'agent ne démarre pas après l'exécution de l'installation, ce qui entraîne l'affichage des messages suivants par un agent non actif :
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
Pour confirmer, vérifiez les détails de l'erreur dans les journaux du gestionnaire de services.
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Vérifiez également les journaux de vérification.
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc:  denied  { read open } for  pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0           tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0

Tous les messages d'erreur ci-dessus indiquent que SELinux ne vous permet pas d'exécuter des commandes dans le dossier sélectionné.

Action : Communiquez avec l'administrateur de système et créez les politiques requises qui permettent l'installation et l'exécution de l'agent de gestion.

Dépannage : Échec de l'installation de l'agent de gestion sur Red Hat Enterprise Linux 9.x

L'installation de l'agent de gestion échoue et le message d'erreur suivant peut s'afficher : mgmt_agent service creation failed. Reason: Detected Linux .

En outre, les messages du journal d'échec de l'installation peuvent confirmer l'erreur et indiquer que les tentatives de configuration utilisent un gestionnaire de services incorrect pour installer l'agent.

Cause : Red Hat a supprimé l'ensemble chkconfig dans la distribution Red Hat Enterprise Linux (RHEL) 9, pour plus de détails, voir la base de connaissances Red Hat.

Action :

Vérifier le problème
  1. Vérifiez que l'environnement utilise Red Hat Enterprise Linux 9.x en exécutant la commande suivante :
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. Les messages ci-dessous mettent en évidence le problème selon lequel le système d'exploitation/famille n'a pas été identifié correctement à l'aide des règles présentes dans le script agentcore. L'installation tentera de configurer le service d'agent à l'aide de init.d et non de systemctl dans RHEL 9x.
    $ rpm -ivh oracle.mgmt_agent.231118.1208.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous agent service exists
    Checking if OS has systemd or initd
    Checking available disk space for agent install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the agent will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_agent-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_agent' daemon
    mgmt_agent service creation failed. Reason: Detected Linux:
    Installing the mgmt_agent daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_agent': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_agent-231118.1208-1.x86_64) scriptlet failed, exit status 1
  3. Vérifiez que l'ensemble chkconfig est manquant, comme décrit dans l'article suivant de la base de connaissances Red Hat.

Solution 1 - Installer l'ensemble chkconfig

  1. Installez le paquet manquant en exécutant la commande suivante :
    $ dnf install chkconfig
  2. Vérifiez que le package existe dans l'environnement en exécutant la commande suivante :
    $ rpm -qa | grep chkconfig
  3. Réinstallez l'agent de gestion.

Solution 2 - Sans installer le package chkconfig

Note

Il s'agit d'une solution de rechange. Utilisez cette solution uniquement si l'ensemble chkconfig ne peut pas être installé. La solution recommandée consiste à installer l'ensemble chkconfig.

Si l'installation de l'ensemble chkconfig n'est pas une option décrite dans la section Solution 1 ci-dessus, effectuez les étapes suivantes comme solution alternative pour installer le logiciel de l'agent de gestion.

Utilisez les commandes suivantes pour :
  1. Passez à un shell racine.
  2. Définissez la variable d'environnement DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Installez le logiciel de l'agent OMA.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Dépannage : Échec de l'installation de l'agent de gestion sous Linux : la valeur RUN_AGENT_AS_USER attendue est racine

Si vous installez l'agent et que vous voyez l'erreur suivante, vous devez modifier les autorisations de l'utilisateur qui installe l'agent.

rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpm
Preparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is root
Current user group is rootroot is not the default user, checking if required environment variables are set
RUN_AGENT_AS_USER=mgmt_agent contains an unexpected value
Expected RUN_AGENT_AS_USER value to be root, exiting
error: %pre(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
error: oracle.mgmt_agent-240229.1733-1.x86_64: install failed

Solution :

  1. Réglez la variable d'environnement RUN_AGENT_AS_USER à la racine en ajoutant les éléments suivants à votre configuration d'environnement :
    export RUN_AGENT_AS_USER=root
    export AGENT_USER_GROUP=<OS_primary_group_of_selected_OS_user>
  2. Installez l'agent à l'aide de la commande suivante :
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

    Pour plus d'informations, voir Utiliser un utilisateur du système d'exploitation autre que par défaut pour installer l'agent de gestion.

Dépannage : Échec de l'accès au script à l'aide d'un chemin absolu. Droits insuffisants

Si vous trouvez l'erreur suivante, vous pouvez modifier les autorisations pour résoudre ces problèmes.

Copying files to destination dir (/opt/oracle/mgmt_agent)Initializing software from templateChecking if JavaScript engine is available to useCreating mgmt_agent daemonmgmt_agent service creation failed. Reason: Failed to access the script using an
        absolute path. Insufficient permissions may prevent the user "mgmt_agent" from traversing
        one of the folders. Please check the following permissions

Solution : Vous pouvez configurer le répertoire /opt/oralce avec 755 autorisations pour permettre l'accès au programme d'installation de l'agent.

Dépannage : Échec de la tentative d'enregistrement en nuage avec le statut HTTP 407, données d'identification de serveur de passerelle incorrectes

Si vous installez l'agent de gestion et que l'erreur CloudRegistrationStep échoue avec l'erreur HTTP Status 407 suivante, elle peut être due à des données d'identification GatewayServerUser ou GatewayServerPassword incorrectes.

CloudRegistrationStep: The registration attempt failed with HTTP Status 407
Additional details are available in the configure logs at /opt/oracle/mgmt_agent/configure-logs 

Solution : Générez une nouvelle clé de réponse avec les valeurs correctes GatewayServerUser et GatewayServerPassword, puis pour vérifier les détails corrects du serveur de passerelle, réessayez d'installer l'agent.

Dépannage : Échec de l'installation de l'agent JAVA_HOME n'est pas défini pour abandonner l'installation de l'agent

Lorsque vous installez l'agent, si l'erreur suivante se produit, l'emplacement du répertoire d'origine java n'a pas été trouvé lors de l'installation.
rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpmPreparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is rootCurrent user group is rootroot is not the default user, checking if required environment variables are set
Checking agent version
Updating / installing...
1:oracle.mgmt_agent-240229.xxxx-1################################# [100%]
Failed to get unit file state for mgmt_agent.service: No such file or directory
Executing install
JavaHome is not set aborting agent install
warning:%post(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1

Action :

  1. Dans le fichier de réponses, définissez le paramètre JAVA_HOME en ajoutant les éléments suivants :
    export JAVA_HOME=path/to/jdk/directory
  2. Installez l'agent à l'aide de la commande suivante.
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

Dépannage : Impossible de voir l'espace de noms et les mesures Prometheus dans le service de surveillance OCI

Dans la console OCI, si les politiques requises sont configurées correctement et que l'espace de noms et les mesures Prometheus ne sont pas visibles à partir du service de surveillance OCI dans l'explorateur de mesures, vous devrez peut-être confirmer que l'utilisateur du système d'exploitation mgmt_agent dispose des autorisations de lecture pour le fichier .properties.

Cause possible : L'utilisateur du système d'exploitation mgmt_agent n'est pas autorisé à lire le fichier .properties. Ce fichier peut être détenu par un utilisateur du système d'exploitation racine disposant de 600 autorisations.
agent_inst/discovery/PrometheusEmitter/compute_exporter.properties 
Action : Pour résoudre le problème :
  1. Vérifiez que le fichier  .properties dans agent_inst/discovery/PrometheusEmitter appartient à l'utilisateur du système d'exploitation mgmt_agent et que l'utilisateur du système d'exploitation mgmt_agent dispose des autorisations de lecture sur ce fichier.
  2. Redémarrez l'agent de gestion OCI.

Dépannage : Indicateur fourni mais non défini

Erreur : Si vous voyez l'erreur suivante : indicateur fourni mais non défini : -trusted-certs-dir

Action : Pour résoudre le problème, vous pouvez mettre à niveau OCA vers la dernière version à l'aide des commandes suivantes.
$ sudo -u oracle-cloud-agent /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent -cli -trusted-certs-dir=/tmp/trustedcerts
flag provided but not defined: -trusted-certs-dir
Usage of /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent:
  -agent-config string
        agent config yml file
  -cli
        run the monitoring in cli mode
  -debug
        enable debug logging
  -dev
        enable dev runs
  -force-redeploy
        force redeploy image
  -metadata-config string
        metadata config json file
  -oci-config string
        oci config file
  -staging
        enable staging endpoint
  -upgrade-native-agent
        invoke native agent upgrade

Dépannage : Échec de l'ajout des données d'identification SSH avec erreur : Caractère non guidé non autorisé

Cause possible : Lorsque vous ajoutez des données d'identification sources à un agent, si vous voyez l'erreur de caractère non cité non autorisé suivante, cela signifie que le fichier JSON n'est pas formaté correctement. Par exemple, si la clé SSH s'affiche en tant que lignes multiples, cela peut entraîner la non-reconnaissance de la clé SSH et cette erreur de caractère non cité non autorisée. Par exemple :

[root@host ociagent]# cat 2nd.json | sudo -u mgmt_agent
      /opt/oracle/mgmt_agent/agent_inst/bin/credential_mgmt.sh -o upsertCredentials -s
      logancom.fasterxml.jackson.databind.JsonMappingException: Illegal unquoted character ((CTRL-CHAR,
      code 10)): has to be escaped using backslash to be included in string valueat [Source: (BufferedInputStream); line: 7, column: 70] (through reference chain:
      oracle.polaris.core.source.metadata.impl.creds.CredentialFormat["properties"]->java.lang.Object[][1]->oracle.polaris.core.source.metadata.impl.creds.CredentialFormat$Property["value"])at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:402)at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:361)at
Solution : Vous pouvez corriger ce problème de deux façons :
  • Ajoutez un caractère spécial \n avant chaque ligne de la clé. Par exemple :
    {"source":"host.myvm.example.com", 
    "name":"OSCreds", 
    "type":"SSHKeyCreds", 
    "description":"SSH keys for a user", 
    "properties":[
    {"name":"SSHUserName","value":"username"},               
    {"name":"SSHPrivateKey","value":"-----BEGIN RSA PRIVATE KEY-----\n<private-key-value>
    \n-----END RSA PRIVATE KEY-----"},
    {"name":"SSHPublicKey","value":"-----BEGIN PUBLIC KEY-----\n<public-key-value>
    \n<public-key-value>
    \n-----END PUBLIC KEY-----"]}
  • Ou ajoutez la valeur de clé complète dans une seule ligne.

Maintenant, le format JSON est correct et vous pouvez réessayer l'opération pour ajouter les données d'identification sources.

Dépannage : Erreur de chemin d'accès au certificat

Cause possible : Si l'erreur suivante s'affiche lors de l'installation de l'agent, vous pouvez avoir un composant de réseau qui injecte ses propres certificats. Ou si vous rencontrez l'erreur lors de l'installation de l'agent et s'il se connecte au moyen d'un mandataire, il se peut que votre mandataire injecte un certificat personnalisé. Vous devrez consulter votre administrateur pour obtenir le certificat personnalisé, puis suivez les étapes ci-dessous.

PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException 

Solution : Pour résoudre ces deux problèmes, vous pouvez effectuer les étapes suivantes :

  1. Fournissez des certificats personnalisés lors de l'installation de l'agent, voir Importer des certificats ou Mettre à jour les certificats.
  2. Dans le fichier de clés de réponse, ajoutez le paramètre importTrustedCertsDirectory, y compris le chemin. Pour plus d'informations, voir l'exemple suivant et voir Configurer un fichier de réponses.
importTrustedCertsDirectory=/tmp/crt

Dépannage : Impossible d'installer l'agent de gestion Oracle sur l'instance Windows

Lors de l'installation de l'agent sur un hôte Windows, si le JDK pris en charge n'existe pas et qu'il existe un JDK utilisant une version Java différente, par exemple 1.8.0_51, l'installation de l'agent de gestion échoue sur le même hôte avec l'erreur suivante :

C:\Users\abc\Downloads\Latest-agent> .\installer.bat 
C:\Users\abc\Downloads\Latest-agent\Windows-input.rsp
64 bit Windows OS found.
Checking pre-requisites

Checking if previous agent service exists
Checking if C:\Oracle\mgmt_agent\agent_inst directory exists
Checking Java version

"Agent only supports 64 bit and 32 bit JDK 8 (with a minimum upgrade version JDK 8u281). 
Please set your preferred path in JAVA_HOME"
Solution : Pour corriger ce problème :
  1. Téléchargez le JDK dans un format d'archive compressé .zip.
  2. Extrayez le fichier JDK.zip dans un répertoire sur l'hôte Windows.
  3. Installez l'agent et indiquez JAVA_HOME qui pointe vers le répertoire.

Dépannage : Lorsque vous installez l'agent de gestion et que vous voyez les messages de temporisation de la connexion réseau

Cause possible : Si vous voyez des messages de temporisation de connexion réseau. Par exemple :
http://Example.example.com:4480->https://management-agent.us-ashburn-1.oci.oraclecloud.com:443 : Connection timed out Read failed)
Il est alors probable que l'agent de gestion ne puisse pas accéder aux services Oracle Cloud Infrastructure.

Solution :

Vérifiez vos règles de configuration de réseau et vérifiez que l'agent de gestion peut se connecter aux services OCI à partir de la machine virtuelle sur laquelle l'agent de gestion est installé. Si vous disposez d'un pare-feu ou d'une configuration NAT, vérifiez qu'il autorise la communication sortante sur les adresses IP recommandées par OCI. Pour plus d'informations, voir Intervalles d'adresses IP pour les services déployés dans Oracle Cloud Infrastructure.

Dépannage : CloudRegistrationStep : Échec de la tentative d'enregistrement avec le statut HTTP 401 (les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes)

Cause : Ce problème peut survenir en raison d'une clé de réponse non valide ou incorrecte.

Action : Assurez-vous d'avoir une clé valide. Pour plus de détails, voir Gérer les clés d'installation.

Dépannage : "code" : "NotAuthenticated","message" : "Les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes.

Cause : Ce problème peut survenir en raison d'une clé de réponse expirée.

Action : Assurez-vous d'avoir une clé valide. Pour plus de détails, voir Gérer les clés d'installation.

Résoudre les problèmes de désinstallation des agents de gestion

Cette rubrique présente les problèmes communs liés à la désinstallation des agents de gestion Oracle et leurs solutions.

Erreur :... désigne plusieurs ensembles

Cause : Le registre RPM contient plusieurs ensembles portant ce nom.

Action : Utilisez l'indicateur --allmatches lors de l'exécution de la commande rpm -e :
rpm -e oracle.mgmt_agent --allmatches

Erreur : échec du scriptlet... avec un code de sortie

Cause : Le script RPM n'a pas pu arrêter l'agent en cours d'exécution ou n'a pas pu supprimer le fichier de service de l'agent du système.

Action : Pourrésoudre cette erreur, essayez de supprimer l'agent manuellement.
  • Vérifiez si votre agent est en cours d'exécution :

    Pour OL7 : systemctl status mgmt_agent

    Pour OL6 : /sbin/initctl status mgmt_agent

    Si l'agent est en cours d'exécution, arrêtez-le :

    Pour OL7 : systemctl stop mgmt_agent

    Pour OL6 : /sbin/initctl stop mgmt_agent

  • Supprimez le RPM en exécutant rpm -e oracle.mgmt_agent --noscripts. Cette commande ignore tous les scripts RPM et tente de supprimer l'ensemble de son registre.
  • Supprimez tous les fichiers d'agent en exécutant rm -rf /opt/oracle/mgmt_agent. Exécutez également les commandes suivantes :

    Pour OL7 : rm -rf /etc/systemd/system/mgmt_agent.service

    Pour OL6 : rm -rf /etc/init/mgmt_agent.conf

Dépanner les problèmes de mise à niveau de l'agent de gestion

Lorsque vous mettez à niveau Oracle Management Agent, vous pouvez utiliser la liste suivante pour résoudre les erreurs courantes.

Dépannage : La mise à niveau automatique est activée, mais l'agent ne procède pas à la mise à niveau automatiquement en raison d'un responsable de fichier non valide

Cause : Vous pouvez configurer les agents de gestion pour qu'ils effectuent une mise à niveau automatique. L'option de mise à niveau automatique est disponible au niveau de la location. Par conséquent, si vous sélectionnez l'option de mise à niveau automatique dans la console Oracle Cloud, tous les agents de votre location OCI seront mis à niveau automatiquement. La mise à niveau automatique de l'agent peut prendre jusqu'à 24 heures après la disponibilité d'une nouvelle version de l'agent dans le service Cloud Service de l'agent de gestion.

Si la version de l'agent n'est pas mise à jour après 24 heures d'attente, certains problèmes sur le disque peuvent empêcher la mise à niveau automatique de l'agent.

La cause la plus fréquente de cette erreur est que les fichiers appartiennent à un utilisateur du système d'exploitation différent de l'utilisateur qui a installé l'agent de gestion. Le processus de mise à niveau s'exécute avec le même utilisateur de système d'exploitation que le processus en cours d'exécution et n'a pas la possibilité de passer à la racine. Tout fichier du répertoire mgmt_agent créé manuellement par l'utilisateur peut interférer avec la capacité de l'agent à effectuer une mise à niveau automatique.

Vous pouvez trouver le fichier mgmt_agent.log aux emplacements suivants :
  • Pour l'agent de gestion autonome :
    /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
  • Pour le plugiciel d'agent de gestion dans Oracle Cloud Agent (OCA) sur les instances de calcul OCI :
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log

    Dans le fichier mgmt_agent.log, vous pouvez voir l'erreur suivante indiquant les fichiers problématiques :

    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.oldbackup]
    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] WARN  - Files with invalid owners were found, skippingauto-upgrade
Action : Vous pouvez utiliser la solution de rechange suivante pour ce problème :
  1. L'utilisateur doit remplacer la propriété et le groupe des fichiers concernés par le compte d'utilisateur qui a initialement installé l'agent de gestion.
  2. Si un fichier a été créé avec un responsable incorrect, vous pouvez le supprimer ou le déplacer vers un autre répertoire en dehors du répertoire de l'agent de gestion. Selon votre installation, vous pouvez trouver le répertoire de l'agent de gestion à l'un des emplacements suivants :
    • Pour l'agent de gestion autonome : /opt/oracle/mgmt_agent/
    • Pour le plugiciel d'agent de gestion pour un agent Oracle Cloud dans une instance de calcul OCI : /var/lib/oracle-cloud-agent
    Note

    Pour éviter ces problèmes, ne créez pas manuellement de fichiers dans le répertoire de l'agent de gestion.

Dépanner les agents de gestion sur les instances de calcul

Les utilisateurs peuvent rencontrer diverses erreurs lors du déploiement d'Oracle Management Agent sur les instances de calcul. Les causes de certaines erreurs communes et les actions recommandées sont listées ci-dessous.

Dépannage : L'agent a l'état Non disponible et les rapports sur les fichiers journaux de l'agent "Marqueurs non valides"

La page Agents de gestion affiche l'agent dans l'état Non disponible et le fichier mgmt_agent.log (situé sous le répertoire <Agent_Inst>/logs) indique le message suivant :

ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s). Ajoutez une valeur à chacune des définitions de marqueur suivantes : \nGLOBAL.ComponentType, GLOBAL.ApplicationName,

Cause :

Ce problème peut se produire lorsque le compartiment requiert des marqueurs obligatoires pour chaque ressource et que la demande de création de ressource n'inclut pas les marqueurs, la demande d'activation échouera avec le message :"Marqueurs non valides : la création de ressource a échoué, car la ressource requiert des valeurs de marqueur)" et le statut de l'agent est 'Non disponible'.

Action :

  • Agents de gestion

    Si vous disposez d'un agent de gestion autonome, celui-ci doit être désinstallé.

    Si l'agent de gestion a été installé à l'aide d'un RPM ou d'un fichier ZIP, il doit être désinstallé et réinstallé en fournissant un fichier de réponse à l'aide du paramètre DefinedTags, comme décrit dans la section Vérifier les paramètres de l'agent.

  • Agents de gestion sur les instances de calcul
    Si l'agent de gestion est activé au moyen de la console OCI à l'aide du plugiciel OCA, il n'y a aucun fichier de réponse car il n'est pas utilisé pour les instances de calcul. Dans ce cas, procédez de la façon suivante :
    1. Connectez-vous à l'instance où l'agent de gestion est déployé et sudo en tant qu'utilisateur oracle-cloud-agent à l'aide de la commande suivante :
      sudo -u oracle-cloud-agent sh
    2. Créez un fichier agent.definedtags à l'emplacement suivant :/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/
    3. Ajoutez les marqueurs définis nécessaires pour la ressource à créer dans le fichier agent.definedtags.

      Par exemple, s'il existe 2 espaces de noms admin_namespace et finance_namespace

      et chaque espace de noms utilise 2 clés et 2 valeurs environment_type=non-prod, sensitivity=restricted, vous pouvez utiliser les éléments suivants :
      DefinedTags = [{"admin_namespace": {"environment_type": "non-prod",
          "sensitivity": "restricted"}, "finance_namespace": {"environment_type":
          "non-prod","sensitivity": "restricted"}}]
    4. Redémarrez oracle-cloud-agent à l'aide de la commande :
      sudo systemctl restart oracle-cloud-agent

Dépannage : Échec de la configuration de l'agent de gestion avec fork/exec oracle.polaris.oca.main : autorisation refusée

Les utilisateurs peuvent rencontrer cette erreur, ce qui entraîne l'échec de l'installation ou du démarrage de l'agent de gestion.

Le message d'erreur affiché dans la vue Plugiciel de l'instance de calcul pour le plugiciel d'agent de gestion ressemble à ce qui suit :

workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]

Cause possible :

Ce problème peut se produire lorsqu'une instance de calcul interdit les opérations fork/execute à partir du répertoire /tmp en montant tmpfs avec l'indicateur noexec.

Pour confirmer cette cause possible, exécutez la commande suivante :
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)

La sortie doit indiquer does have the noexec flag (Indicateur noexec).

Action :

  1. Arrêtez Oracle Cloud Agent.
     sudo systemctl stop oracle-cloud-agent
  2. Ajoutez le paramètre suivant au fichier : /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
    overrideTmpDir: true
  3. Démarrez Oracle Cloud Agent.
    $ sudo systemctl start oracle-cloud-agent

Dépannage : Échec de l'authentification de l'agent de gestion en raison d'une variation d'horloge, heure différente sur l'instance de calcul par rapport à l'heure sur le serveur

Cause : S'il y a un décalage d'horloge de plus de 5 minutes entre l'instance de calcul où l'agent est exécuté et le service d'identité pour Oracle Cloud Infrastructure, les demandes seront rejetées avec un protocole HTTP 401.

Si vous trouvez les erreurs suivantes :

Dans l'instance de calcul OCI, allez à l'onglet Oracle Cloud Agent, l'agent de gestion affiche une erreur dans la colonne Message :

rpc error: code = Unavailable desc = connection error: desc = "transport: error while
      dialing: dial unix /var/lib/oracle-cloud-agent/tmp/plugin1825606937: connect: connection
      refused"

Ou dans les journaux, vous pouvez trouver l'erreur suivante :

2022-12-09 07:41:22,144 [SysExecutor.0 (Resource Principal Token Refresher)-47] WARN  - #-#  invocation access log [request-id-prefix: K9YBE4AY] #-#
Service: OCI
Method:  GET
Path:    /20200202/managementAgents/ocid1.managementagent.....rvf6i3ba/resourcePrincipalToken
Headers:opc-rpt-request-token=********************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        date=Fri, 09 Dec 2022 07:41:19 GMT         
        host=management-agent.ap-tokyo-1.oci.oraclecloud.com         
        Authorization=******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO         
        User-Agent=Jersey/2.34 (Apache HttpClient 4.5.13)Attempts:
<--> Endpoint:       management-agent.ap-tokyo-1.oci.oraclecloud.com     
     opc-request-id: K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO     
     StartTime:      2022-12-09 07:41:19,976 GMT     
     Status:         401 Unauthorized     
     Headers:        X-Content-Type-Options=nosniff                     
                     Content-Length=187                         
                     opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO/E4356B68C6C541BAD867E46760316D35/4118B130EE46A8E25F90DC91AB7F12D7                     
                     Date=Fri, 09 Dec 2022 07:41:21 GMT                     
                     Content-Type=application/json     
      ErrorBody:
{  
    "code" : "NotAuthenticated",  
    "message" : "Unable to authenticate the request for ocid1.managementagent.oc1.ap-tokyo-1.amaaaa...6frjnrbvqrvf6i3ba"}

Action

Corrigez le décalage d'horloge et redémarrez. Si l'agent est arrêté depuis des jours en raison de cette erreur, vous devez nettoyer le fichier donotrestart avant de redémarrer l'agent.

En outre, Oracle recommande de configurer la date et l'heure du système d'exploitation pour la synchronisation automatique avec les serveurs NTP afin d'éviter les temps d'arrêt futurs. Si des services supplémentaires s'exécutent sur l'ordinateur, il est recommandé de redémarrer l'ordinateur après la modification de l'heure afin que les services puissent être réinitialisés avec la nouvelle heure.

Pour corriger la date et l'heure du système d'exploitation où l'agent est en cours d'exécution, puis redémarrer l'agent, vous pouvez suivre les étapes suivantes :

  1. Pour arrêter l'agent, exécutez la commande suivante :
    sudo systemctl stop oracle-cloud-agent
  2. Corrigez la date et l'heure.
  3. Exécutez la commande suivante pour supprimer le fichier configure.donotrestart.
    sudo rm /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/configure.donotrestart
  4. Démarrer l'agent.
    sudo systemctl start oracle-cloud-agent

Dépannage : Service d'agent de gestion OCI : Agent non visible dans la console OCI sous Observabilité et gestion

L'agent de gestion OCI a été installé sur une instance de calcul. L'agent s'exécute sur l'hôte. Toutefois, l'agent n'apparaît pas dans la console Oracle Cloud si vous accédez au menu de navigation, sélectionnez Observabilité et gestion, allez à Agents de gestion, puis sélectionnez Agents.

Cause possible : Les compartiments de l'instance de calcul et de la clé d'installation de l'agent sont différents.  

Action :
  1. Arrêtez et désinstallez l'agent de gestion sur l'instance de calcul.
  2. Créer une clé d'installation d'agent dans le même compartiment que l'instance de calcul.
  3. Utilisez cette nouvelle clé d'installation que vous venez de créer et installez l'agent de gestion.
Maintenant, l'agent de gestion apparaît comme actif sous Observabilité et gestion, allez à Agents de gestion, puis sélectionnez Agents.

Dépanner les passerelles de gestion

Cette rubrique présente les problèmes et solutions courants liés aux passerelles de gestion.

Dépannage : Supprimer la passerelle de gestion

Cause : Dans certains cas, il peut être nécessaire de supprimer une installation existante de la passerelle de gestion, afin de la réinstaller.

Action :
  1. Vérifiez si la passerelle est en cours d'exécution :

    Pour OL7 : systemctl status mgmt_gateway

    Pour OL6 : /sbin/initctl status mgmt_gateway

    Si la passerelle est en cours d'exécution, arrêtez-la :

    Pour OL7 : systemctl stop mgmt_gateway

    Pour OL6 : /sbin/initctl stop mgmt_gateway

  2. Supprimez le RPM de la passerelle installée à l'aide de la commande suivante : rpm -e oracle.mgmt_gateway --noscripts

  3. Supprimez tous les fichiers de passerelle restants à l'aide de la commande suivante :

    rm -rf /opt/oracle/mgmt_agent

  4. Exécutez la commande suivante :

    Pour OL7 : rm -rf /etc/systemd/system/mgmt_gateway.service

    Pour OL6 : rm -rf /etc/init/mgmt_agent.conf

Dépannage : Configurer la passerelle de gestion

Cause : Dans certains cas, le nom d'hôte peut ne pas être résolu dans l'environnement d'installation, ce qui peut entraîner l'échec de l'installation avec le message d'erreur suivant :

Dépannage : "Impossible de résoudre le nom d'hôte <hostname value> dans l'environnement d'installation. Résolvez le nom d'hôte ou indiquez GatewayCertCommonName dans le fichier de réponses et réexécutez le script de configuration de la passerelle."

Action :

  • Vérifiez et résolvez le nom d'hôte de l'environnement pour obtenir la valeur complète du nom doamin (FQDN) après avoir exécuté la commande : hostname -f
  • Facultativement, un utilisateur peut fournir un nom de domaine complet personnalisé pour la configuration de la passerelle en prédéfinissant la propriété GatewayCertCommonName dans le fichier de réponse d'entrée. Voir Parmaters de fichier de réponse
  • Réexécutez le script de configuration de passerelle.
    sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

Cause : Dans certains cas, l'installation de la passerelle de gestion peut échouer avec le message d'erreur suivant en raison de l'absence de politiques dans OCI ou de problèmes de limite de ressources dans la location. Si vous voyez l'erreur suivante, suivez les étapes ci-dessous.

Dépannage : "Échec du démarrage de la passerelle de gestion, car les certificats n'ont pas pu être créés, initialisés ou extraits dans OCI. Pour plus de détails, vérifiez les journaux."

Action :

  • Ouvrez le fichier journal dans le répertoire d'installation de la passerelle de gestion, par exemple : /opt/oracle/mgmt_agent/plugins/GatewayProxy/statedir/log/mgmt_gateway.log
  • Si le fichier journal contient l'un des codes d'erreur 404 suivants, sélectionnez l'une des options suivantes pour résoudre le problème :
    2023-07-25 15:38:06.694/CEST [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "NotAuthorizedOrNotFound",  "message" : "Authorization failed or requested resource not found."}
    2023-07-25 15:38:06.696/CEST [pool-3-thread-1] ERROR com.oracle.mgmtagent.proxy.ProxyServer - Error while initializing and loading certificate bundlescom.oracle.mgmtagent.proxy.exception.CertificateFailureException: The response status is 404 after multiple retries at com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility.executeRequest(CertificateUtility.java:293) ~
  • Si le fichier journal contient l'un des 400 codes d'erreur suivants, vérifiez les options suivantes pour résoudre le problème :
    2023-09-20 18:51:32.772/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateCreationUtil - Create Vault Service Url invoked https://kms.us-ashburn-1.oraclecloud.com/20180608/vaults
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Received response code 400
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Header name opc-request-id , value /5704D03441842D3818B824B2D6B2712E/1D1FED893474FDA900188E24F3DEE59B
    2023-09-20 18:51:33.401/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "LimitExceeded",  "message" : "The limit for this tenancy has been exceeded."}
    • Vérifiez la limite du nombre de chambres fortes par défaut pour le service de gestion des clés dans la console OCI. Vous pouvez lancer une demande pour augmenter les limites de ressources. Pour plus d'informations, voir Gestion des clés et Gestion des chambres fortes.
    • Vous pouvez configurer les certificats manuellement. Pour plus de détails, voir Exécuter les préalables au déploiement de la passerelle de gestion et aller à la section Gestion manuelle des certificats.
      Note

      Lorsque vous créez les certificats Émis par une autorité de certification interne, le profil de certificat doit être Serveur TLS ou Client TLS et seuls les algorithmes de signature RSA sont pris en charge.
  • S'il y a d'autres échecs liés à la chambre forte ou à l'API du service de clé dans les journaux, vous pouvez lancer une demande et communiquer avec l'équipe oci_kms en fournissant le corps de la réponse et opc-request-id.
  • S'il y a d'autres échecs liés aux autorités de certification ou aux API du service de certificats dans les journaux, soumettez une demande et communiquez avec l'équipe oci_certificates en fournissant le corps de la réponse et opc-request-id.

Dépannage : Échec de l'installation de la passerelle de gestion sur Red Hat Enterprise Linux 9.x

L'installation de la passerelle de gestion échoue et le message d'erreur suivant peut s'afficher : mgmt_gateway service creation failed. Reason: Detected Linux.

En outre, les messages du journal des échecs d'installation peuvent confirmer l'erreur et indiquer que les tentatives de configuration utilisent un gestionnaire de services incorrect pour installer la passerelle.

Cause : Red Hat a supprimé l'ensemble chkconfig dans la distribution Red Hat Enterprise Linux (RHEL) 9, pour plus de détails, voir la base de connaissances Red Hat.

Action :

Vérifier le problème
  1. Vérifiez que l'environnement utilise Red Hat Enterprise Linux 9.x en exécutant la commande suivante :
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. Les messages ci-dessous mettent en évidence le problème selon lequel le système d'exploitation/famille n'a pas été identifié correctement à l'aide des règles présentes dans le script agentcore. L'installation tentera de configurer le service d'agent à l'aide de init.d et non de systemctl dans RHEL 9x.
    $ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous gateway service exists
    Checking if OS has systemd or initd
    Checking available disk space for gateway install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_gateway-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_gateway' daemon
    mgmt_gateway service creation failed. Reason: Detected Linux:
    Installing the mgmt_gateway daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
  3. Vérifiez que l'ensemble chkconfig est manquant, comme décrit dans l'article suivant de la base de connaissances Red Hat.
Solution 1 - Installer l'ensemble chkconfig
  1. Installez le paquet manquant en exécutant la commande suivante :
    $ dnf install chkconfig
  2. Vérifiez que le package existe dans l'environnement en exécutant la commande suivante :
    $ rpm -qa | grep chkconfig
  3. Réinstallez la passerelle de gestion.
Solution 2 - Sans installer l'ensemble chkconfig
Note

Il s'agit d'une solution de rechange. Utilisez cette solution uniquement si l'ensemble chkconfig ne peut pas être installé. La solution recommandée consiste à installer l'ensemble chkconfig.

Si l'installation de l'ensemble chkconfig n'est pas une option décrite dans la section Solution 1 ci-dessus, effectuez les étapes suivantes en tant que solution alternative pour installer le logiciel de la passerelle de gestion.

Utilisez les commandes suivantes pour :
  1. Passez à un shell racine.
  2. Définissez la variable d'environnement DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Installez le logiciel de la passerelle de gestion.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Dépannage : Échec de l'installation de la passerelle de gestion avec erreur : Les certificats n'ont pas pu être créés et le rapport sur les journaux d'identité : Échec de l'authentification : DATE_OUTSIDE_CLOCK_SKEW

Cause :

Échec de l'authentification du rapport sur les journaux d'identité : DATE_OUTSIDE_CLOCK_SKEW

# /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<PATH>/gateway_agent.rsp/opt/oracle/mgmt_agent/agent_inst/bin/setupAgent.sh
    opts=<PATH>/gateway_agent.rsp

Executing configure

Parsing input response file
Validating install key
Generating communication wallet
Generating security artifactsRegistering Management Gateway
Found service plugin(s):[GatewayProxy]

Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...Done.
GatewayProxy : Successfully deployed external plugin

Gateway setup completed and the gateway is running.
In the future gateway can be started by directly running: sudo systemctl start mgmt_gateway

Please make sure that you delete <PATH>/gateway_agent.rsp or store it in secure location.

Creating gateway system properties file
Creating properties fileCreating or validating certificates
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Failed to start Management Gateway as certificates could not be created, initialized or retrieved in OCI. Please check the logs for more details.
Management Gateway stopped

Action :

Sur l'hôte où la passerelle de gestion est installée, assurez-vous que l'heure de l'hôte est correcte, puis installez la passerelle de gestion.

Dépannage : Lors de l'installation ou de la configuration de la passerelle de gestion, erreur de temporisation

Si vous vérifiez que la console OCI affiche la passerelle de gestion comme active, mais que les mesures ne sont pas alimentées.

Vous pouvez trouver l'erreur suivante si le service expire :

/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Starting gateway...
Gateway started successfully

Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...............Timed out.

Agent is unable to check if it deployed requested service plugin(s) successfully or not. 
Please check back later on the console.

Cause : Un délai plus long que prévu pour terminer la tâche de configuration de la passerelle de gestion peut entraîner un problème de communication réseau et entraîner une temporisation de la passerelle de gestion.

Action : Pour terminer la configuration :
  1. Vérifiez qu'il n'y a aucun problème de communication réseau.
  2. Vérifiez si les détails de mandataire suivants ont été mis à jour dans le fichier de réponses pour déterminer s'il existe un problème de mandataire. Par exemple, vérifiez que les détails corrects de l'hôte mandataire et du port ont été mis à jour dans le fichier de réponses :

    ProxyHost = my.proxyhost.com

    ProxyPort = 80

  3. Arrêtez la passerelle de gestion à l'aide de la commande suivante :

    systemctl stop mgmt_gateway

  4. Réexécutez la configuration de la passerelle de gestion à l'aide de la commande suivante :

    /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

  5. La configuration de la passerelle de gestion doit maintenant être terminée et les mesures doivent être alimentées.

Collecter les journaux de l'agent de gestion

Si vous devez soumettre une demande de soutien pour faire appel à Oracle Support, il est utile de recueillir les journaux de l'agent de gestion et de les joindre au ticket de soutien. L'emplacement du journal dépend de la façon dont l'agent de gestion est installé et activé.

Rechercher l'emplacement du journal

Vous pouvez .zip ou .tar manuellement tous les fichiers journaux à l'un des emplacements suivants :

  • Si vous avez activé le plugiciel d'agent de gestion à l'aide d'Oracle Cloud Agent (OCA), vous pouvez trouver les journaux à cet emplacement :
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log
  • Si vous avez installé l'agent de gestion à l'aide d'un graphique d'aide .rpm, zip, ou d'une image de conteneur, l'emplacement de journal par défaut est :
    /opt/oracle/mgmt_agent/agent_inst/log
Note

Si vous avez installé l'agent sous Windows, les emplacements de journal dépendent de l'endroit où les agents sont installés. Les emplacements de journal se trouvent généralement dans le répertoire d'installation à l'emplacement suivant : agent_inst/log

Créer un ensemble de diagnostics

Vous pouvez .zip ou .tar manuellement tous les fichiers journaux aux emplacements mentionnés ci-dessus ou générer un ensemble de diagnostics.

L'agent doit être en cours d'exécution et sain pour générer l'ensemble de diagnostics. Si la génération de l'archive de diagnostic échoue, .zip ou .tar manuellement tous les fichiers journaux mentionnés ci-dessus.

Note

Vous devez créer ces archives .zip ou .tar en tant qu'utilisateur du système d'exploitation de l'agent de gestion dans /tmp ou un autre répertoire en dehors du répertoire d'installation de l'agent.

Pour générer un ensemble de diagnostics :

  • Pour un plugiciel d'agent de gestion utilisant Oracle Cloud Agent (OCA), utilisez la commande suivante :
    $ sudo -u oracle-cloud-agent /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/bin/generateDiagnosticBundle.sh
  • Pour un agent de gestion installé à l'aide d'une image téléchargée, telle qu'un graphique .rpm, .zip, d'aide ou à partir d'une image de conteneur, vous pouvez utiliser la commande suivante :
    $ sudo -u mgmt_agent /opt/oracle/mgmt_agent/agent_inst/bin/generateDiagnosticBundle.sh