Dépannage du service Management Agents

Cette section traite de certains problèmes et résolutions courants liés au service des agents de gestion, tels que l'installation et la désinstallation avec les agents de gestion et les passerelles de gestion.

Rubriques :

Résoudre les problèmes d'installation et de configuration des agents de gestion

Les utilisateurs peuvent rencontrer différentes erreurs au cours du processus d'installation et de configuration d'Oracle Management Agent. Les causes et les actions recommandées pour certaines erreurs courantes sont répertoriées ci-dessous.

Résoudre les problèmes : désinstallez l'agent et enlevez le fichier de service avant d'installer le nouvel agent.

Cause : un agent est déjà installé sur l'hôte. Un processus de désinstallation précédent n'a pas enlevé le fichier de service de l'agent.

Action :
  • Exécutez rpm -e oracle.mgmt_agent pour désinstaller l'agent. Si la commande réussit, essayez d'installer le nouvel agent. Si la commande ne fonctionne pas, essayez l'action recommandée suivante.
  • Exécutez ls /opt/oracle/mgmt_agent pour vérifier s'il reste des éléments de l'installation d'agent précédente. Si c'est le cas, supprimez-les en exécutant la commande rm -rf /opt/oracle/mgmt_agent.
  • Vérifiez si vous disposez déjà d'un fichier de service d'agent à l'emplacement suivant, en fonction de votre version de Linux :
    • Pour OL7 (si vous utilisez systemd) : /etc/systemd/system/mgmt_agent.service
    • Pour OL6 (si vous utilisez init) : /etc/init/mgmt_agent.conf.

      Si vous constatez que vous avez ce fichier de service, enlevez-le en exécutant la commande rm -rf /etc/init/mgmt_agent.conf, puis réessayez d'installer le nouvel agent.

Dépannage : Java n'est pas une JVM 64 bits. Définissez le chemin d'une JVM 64 bits dans la variable d'environnement JAVA_HOME ou Java introuvable, définissez votre chemin préféré dans JAVA_HOME.

Cause : la variable d'environnement JAVA_HOME n'est pas définie ou ne pointe pas vers un emplacement de JDK 64 bits.

Action : définissez la variable d'environnement JAVA_HOME sur la version de JDK correcte et réessayez d'installer l'agent. Actuellement, seul le JDK 64 bits est pris en charge.

Dépannage : échec de l'installation de l'agent avec le message : useradd : impossible d'obtenir un GID unique (plus aucun GID disponible)

Cause : le script d'installation ne peut pas ajouter d'utilisateur et de groupe pendant le processus d'installation de l'agent de gestion car les ID de groupe disponibles sur votre système Linux sont déjà utilisés.

Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent) 
useradd: Can't get unique GID (no more available GIDs) 
useradd: can't create group 
Agent installation failed, please check log file

Action : contactez l'administrateur système avant d'effectuer les opérations suivantes :

  1. Modifiez le fichier /etc/login.defs. Vous devez disposer de privilèges sudo pour modifier le fichier.

    Recherchez les entrées suivantes :
    SYS_GID_MIN               nnnn
    SYS_GID_MAX               mmmm
    SYS_UID_MIN               pppp
    SYS_UID_MAX               qqqq
    nnnn et pppp sont la valeur minimale, et mmmm et qqqq la valeur maximale.

    Si les entrées ci-dessus n'existe pas dans le fichier, ajoutez-les.

  2. Mettez à jour la valeur de l'entrée SYS_GID_MAX en fonction de la recommandation de l'administrateur système et enregistrez le fichier.

  3. Enlevez l'installation d'agent ayant échoué en exécutant la commande sudo rpm -e oracle.mgmt_agent.

  4. Déconnexion du shell suivie de la connexion.

  5. Réessayez d'installer l'agent.

Dépannage : useradd : impossible d'établir le répertoire /usr/share/mgmt_agent

Lors de l'installation de l'agent de gestion, l'utilisateur mgmt_agent est créé avec l'emplacement du répertoire de base par défaut sous /usr/share/mgmt_agent.

Cause : les droits d'accès aux fichiers sous /usr/share sont insuffisants ou le système de fichiers est en lecture seule.

Actions possibles :

  • Définissez des droits d'accès aux fichiers pour permettre à l'utilisateur mgmt_agent d'accéder à l'emplacement du répertoire de base de l'utilisateur par défaut : /usr/share.

  • Définissez un autre emplacement de répertoire de base à l'aide de la variable d'environnement USER_HOME_DIR_ROOT si vous voulez utiliser un autre emplacement.

    Définissez la variable d'environnement USER_HOME_DIR_ROOT avec le chemin que vous préférez utiliser comme répertoire de base pour l'utilisateur mgmt_agent et assurez-vous que l'utilisateur d'agent de gestion dispose des droits d'accès aux fichiers appropriés sur ce répertoire préféré.

Dépannage : Windows : le système ne trouve pas le chemin spécifié. Echec de l'installation de l'agent.

NIVEAU D'ERREUR=9009

Cause possible : les variables d'environnement n'ont pas été définies correctement en raison d'espaces dans le nom de répertoire/dossier.

Les environnements Windows permettent d'utiliser des espaces dans un nom de répertoire/dossier, ce qui entraîne un problème lors de l'installation de l'agent de gestion car des guillemets sont automatiquement ajoutés au nom par Windows. Par exemple, il existe un répertoire/dossier nommé : Program Files. Dans ce cas, Windows insère automatiquement des guillemets car il y a un espace dans le nom du dossier et il va maintenant dire : "Program Files".

Les guillemets supplémentaires peuvent entraîner un problème car le programme d'installation de l'agent de gestion n'autorise pas les guillemets pour les variables d'environnement telles que JAVA_HOME et AGENT_INSTALL_BASEDIR.

Remarque

Le programme d'installation de l'agent de gestion n'accepte pas les caractères spéciaux suivants dans le chemin : [, ^^, ", ', & ou ].

Action :

La méthode recommandée pour configurer des variables d'environnement sous Windows est d'utiliser les paramètres système avancés.
  • Dans la barre des tâches Windows, cliquez avec le bouton droit de la souris sur l'icône Windows et sélectionnez Système.
  • Dans la fenêtre Paramètres, sous Paramètres associés, cliquez sur Paramètres système avancés.

    Paramètres avancés Windows

  • Dans l'onglet Avancé, cliquez sur Variables d'environnement.

    Variables d'environnement Windows

  • Cliquez sur Nouveau pour créer une variable d'environnement. Cliquez sur Modifier pour modifier une variable d'environnement existante.
  • Après avoir créé ou modifié la variable d'environnement, cliquez sur Appliquer, puis sur OK pour que la modification prenne effet.
    Remarque

    L'interface utilisateur graphique permettant de créer des variables d'environnement peut légèrement varier en fonction de votre version de Windows.

Dépannage : le statut de l'agent de gestion est Non disponible dans la console après l'installation initiale

Cause possible 1 : horodatage système incorrect

Action : vérifiez l'heure système de l'hôte de l'agent, puis vous pouvez corriger l'heure si nécessaire.

Cause possible 2 : si vous utilisez le fichier de réponses input.rsp pour l'agent de gestion, vous devez définir les balises pour le compartiment de l'agent de gestion.

Si les balises ne sont pas définies, une erreur semblable à celle-ci peut s'afficher :

Attempts:
<--> Endpoint:       management-agent.us-ashburn-1.oci.oraclecloud.com
     opc-request-id: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXJ8
     StartTime:      2024-09-18 03:45:12,662 GMT
     Status:         400 Bad Request
     Headers:        Strict-Transport-Security=max-age=31536000; includeSubDomains;
                     Connection=close
                     Content-Length=63
                     opc-request-id=XXXXXXXXXXXXXXXXXXXXXXXX..................B25ADA8E
                     Date=Wed, 18 Sep 2024 03:45:12 GMT
                     Content-Type=application/json
     ErrorBody:      
{
  "code" : "InvalidParameter",
  "message" : "Invalid tags"
}

Action : afin de définir les balises propres à votre environnement, dans le fichier de réponses input.rsp, ajoutez les paramètres suivants et indiquez les paires clé-valeur pour votre environnement. Pour plus d'informations, reportez-vous à Création d'un fichier de réponses.

DefinedTags = [{"namespace1":{"<key1>":"<value1>"}},
      {"namespace2":{"<key2>":"<value2>"}}]

Dépannage : après la configuration, l'agent de gestion n'est pas visible dans la console ou via l'API

Cause possible : si, après avoir configuré l'agent de gestion ou l'agent de passerelle de gestion, l'agent n'apparaît pas dans la console Oracle Cloud ou via l'API, il se peut que les stratégies appropriées ne soient pas configurées pour l'utilisateur ou le groupe d'utilisateurs.

Action : vérifiez que l'utilisateur ou le groupe d'utilisateurs dispose des stratégies requises configurées pour l'agent de gestion ou l'agent de passerelle. Afin de configurer des stratégies, reportez-vous à Création de stratégies pour un groupe d'utilisateurs.

Dépannage : les mesures Prometheus ou Kubernetes surveillées à l'aide de l'agent de gestion ne sont pas disponibles

Problèmes possibles : l'agent de gestion n'a pas besoin de groupes dynamiques ou de stratégies pour ses propres mesures, mais pour les mesures Prometheus et Kubernetes. L'utilisateur doit définir un groupe dynamique et une stratégie qui permettent aux agents de ce groupe dynamique de publier des mesures sur OCI Monitoring. Si les mesures n'apparaissent pas dans le compartiment ou dans l'espace de noms OCI Monitoring, vous pouvez vérifier les stratégies et le groupe dynamique.
  • a) Politiques manquantes

    Action : vérifiez que les stratégies sont ajoutées à l'agent de gestion, comme décrit dans les instructions de configuration. Pour plus de détails, reportez-vous à Configuration d'Oracle Cloud Infrastructure pour le service d'agent de gestion.

    Si les stratégies sont manquantes, ajoutez-les comme décrit dans Configuration d'Oracle Cloud Infrastructure pour le service d'agent de gestion.

  • (b) Fautes de frappe dans les stratégies

    Action : vérifiez que la syntaxe des stratégies ne comporte pas d'erreur en les comparant aux exemples de stratégies. Pour plus de détails, reportez-vous à Configuration d'Oracle Cloud Infrastructure pour le service d'agent de gestion.

    Par exemple, assurez-vous que le groupe dynamique est correctement défini, conformément à la syntaxe suivante, avec des guillemets simples autour de l'ID de compartiment et du type de ressource managementagent :

    ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
  • (c) ID de compartiment incorrect dans la définition du groupe dynamique

    Action : vérifiez que l'ID de compartiment de la clé d'installation est identique à l'ID de compartiment indiqué dans la définition du groupe dynamique de l'agent. Par défaut, l'agent est créé dans le compartiment de la clé d'installation.

Dépannage : l'agent est exécuté dans OutOfMemoryException

Cause possible : l'agent risque de manquer de mémoire de portion de mémoire s'il n'est pas réglé correctement pour prendre en charge la charge qui lui a été affectée.

Action : mettez à jour les paramètres de portion de mémoire de l'agent de gestion.

La configuration prête à l'emploi pour la portion de mémoire maximale de l'agent est la suivante :
  • 128 Mo pour Management Agent en tant que module d'extension OCA.
  • 512 Mo pour l'agent de gestion autonome. ( Celle téléchargée à partir de la console de l'agent de gestion).
L'utilisateur peut mettre à jour et affecter davantage de portion de mémoire à l'agent en procédant comme suit :
  • Ouvrez le fichier : agent_inst/config/java.options.
  • Modifiez le fichier ci-dessus. Mettez à jour le paramètre de portion de mémoire en modifiant la ligne suivante : -Xmx512m

    Par exemple, la ligne ci-dessus définit la portion de mémoire maximale de l'agent sur 512 Mo.

    Pour remplacer la portion de mémoire par 800 Mo, mettez à jour la ligne ci-dessus pour qu'elle soit : -Xmx800m

  • Enregistrez le fichier et redémarrez l'agent pour que les modifications prennent effet.

Dépannage : l'agent de gestion OCI ne démarre pas sur un hôte Windows

Cause possible : si l'agent démarre et échoue avec l'erreur suivante, cela peut être dû à l'échec de la mise à niveau automatique de l'agent de gestion. Vous pouvez voir les erreurs suivantes.

C:\Oracle\mgmt_agent\agent_inst\log>NET START mgmt_agent
The Oracle Management Agent service is starting...................
The Oracle Management Agent service could not be started.

A service specific error occurred: 1.

More help is available by typing NET HELPMSG 3547.

Dans ce fichier journal, C:\Oracle\mgmt_agent\agent_inst\log\mgmt_agent.log peut afficher l'erreur suivante.

[SysExecutor.0 (PrometheusEmitter.Agent-discovery)-131] INFO - DiscoveryItemTask PrometheusEmitter.Agent-discovery - autoPromote
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Cleaning up old files...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - On windows, skipping file owner check
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Starting agent upgrade from version [231002.2039] to version [231002.2040]...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Inserted RequestSigner associated with request SigningRequester[get([])] for signingKey:SigningKey[xxxxxxxxxxxx]
[SysExecutor.1 (ManagedAgent upgradechecker)-133] INFO - Package Stream size:99003892
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully unzipped agent upgrade package at: 
C:\Oracle\mgmt_agent\zip\unpack
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully copied C:\Oracle\mgmt_agent\agent_inst\bin\agentUpgrader.bat to 
C:\Oracle\mgmt_agent\agent_inst\bin\tmpAgentUpgrader.bat
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully deleted previous wrapper backup file:
C:\Oracle\mgmt_agent\agent_inst\config\wrapper.conf.backedUpForUpgrade
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Backed up wrapper.conf to attempt agent upgrade
[SysExecutor.1 (ManagedAgentupgrade checker)-133] INFO - Built macros for processing wrapper.conf as:{%SERVICE_TYPE%=mgmt_agent,%JAVA_HOME%=c:\Program 
Files\Java\jre-1.8,%EMSTATE%=C:\Oracle\mgmt_agent\agent_inst, %CORE_JAR%=agent-upgrader-1.0.3235.jar,%VERSION%=231002.2039, 
%ORACLE_HOME%=C:\Oracle\mgmt_agent\231002.2039}
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Processed wrapper.conf.template to point it to agent upgrader
[SysExecutor.1(ManagedAgent upgrade checker)-133] INFO - Exiting for wrapper to spin up the agent upgrader...

Action : pour résoudre le problème :

  1. Arrêtez l'agent de gestion sur l'hôte Windows, puis entrez les commandes suivantes :
    NET STOP mgmt_agent
    cd C:\Oracle\mgmt_agent\agent_inst\config
    Backup wrapper.conf
    Rename wrapper.conf.backedUpForUpgrade to wrapper.conf
  2. Démarrez le service Management Agent.
  3. Mettez à niveau l'agent de gestion (reportez-vous à Mise à niveau manuelle de Windows).

Désormais, après la mise à niveau, l'agent s'affiche comme Actif sous Observability & Management.

Dépannage : la mise à niveau automatique de l'agent de gestion ne fonctionne pas ou certains agents ont été ignorés

Cause possible : si la mise à niveau automatique de l'agent de gestion OCI ne fonctionne pas pour certains agents de gestion, il est possible que la mise à niveau automatique de l'agent de gestion ait cessé de fonctionner car certains des fichiers ou répertoires appartenaient à des propriétaires non valides dans le système de fichiers de l'agent.

Par exemple, si certains fichiers ou répertoires de l'emplacement suivant ne disposaient pas des droits d'accès appropriés, la mise à niveau automatique de l'agent n'a pas fonctionné : /opt/oracle/mgmt_agent/agent_inst.

Dans ce fichier journal, vous pouvez trouver l'erreur suivante : /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log

ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/db00_cred.json,
/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.backup]
(ManagedAgent upgrade checker)-32] WARN - Files with invalid owners were found, skipping auto-upgrade

Action : sur l'hôte de l'agent de gestion, vérifiez que, sous le système de fichiers de l'agent, tous les fichiers et répertoires appartiennent au propriétaire mgmt_agent et au groupe mgmt_agent:mgmt_agent afin que la mise à niveau automatique de l'agent de gestion puisse se terminer.

Dépannage : adresse IP affichée dans la colonne hôte lorsque l'agent de gestion est installé sur l'hôte Windows

Problème : l'agent de gestion est installé sur un hôte Windows et la console de l'agent de gestion affiche l'adresse IP de l'hôte Windows dans la console Oracle Cloud au lieu d'afficher le nom de domaine complet ou le nom d'hôte Windows.

Action :
  1. Connectez-vous à votre hôte Windows et ouvrez le panneau de configuration.
  2. Sélectionnez Système et sécurité, puis Système.
  3. Accédez à la section Paramètres de nom, de domaine et de groupe de travail de l'ordinateur, puis cliquez sur Modifier les paramètres.

    La fenêtre Propriétés système apparaît.

  4. S'il n'est pas sélectionné, cliquez sur Nom de l'ordinateur.
  5. Accédez au message suivant : Pour renommer cet ordinateur, son domaine ou son groupe de travail, cliquez sur Modifier.
  6. Sélectionnez Modifier, une fenêtre Modifications de nom d'ordinateur/de domaine apparaît.

    Par exemple, si le nom de domaine qualifié complet de l'hôte Windows est FOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.com, entrez le nom d'hôte Windows court FOOBAR004 dans la zone de texte Nom de l'ordinateur.

  7. Sélectionnez Plus, la fenêtre Suffixe DNS et nom d'ordinateur NetBIOS s'affiche.
  8. Dans la zone de texte Suffixe DNS principal de cet ordinateur, saisissez le nom DNS de l'hôte Windows.

    Par exemple : subnet1ab2regsu.exampletenantreg1.abcvcn.com

  9. Sélectionnez OK ou Appliquer, puis fermez toutes les fenêtres ouvertes.
  10. Redémarrez l'hôte Windows.
  11. Désinstallez l'agent de gestion existant en exécutant le script uninstaller.bat à partir du terminal Windows.
  12. Installez à nouveau l'agent de gestion sur la machine Windows.

L'installation de l'agent de gestion doit réussir et le nom de domaine qualifié complet de l'hôte Windows sur la page Agent apparaît dans la colonne de l'hôte.

Dépannage : échec de l'installation de l'agent de gestion sur SELinux lors de l'utilisation d'un volume externe

Le service d'agent ne parvient pas à démarrer après l'exécution de l'installation, ce qui entraîne un agent inactif qui affiche les messages suivants :
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
Pour confirmer l'erreur, consultez les journaux du gestionnaire de service.
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Consultez également les journaux d'audit.
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc:  denied  { read open } for  pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0           tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0

Tous les messages d'erreur ci-dessus indiquent que SELinux ne vous permet pas d'exécuter des commandes dans le dossier choisi.

Action : contactez l'administrateur système et créez les stratégies requises permettant d'installer et d'exécuter l'agent de gestion.

Dépannage : échec de l'installation de l'agent de gestion sur Red Hat Enterprise Linux 9.x

L'installation de l'agent de gestion échoue et le message d'erreur suivant peut s'afficher : mgmt_agent service creation failed. Reason: Detected Linux.

En outre, les messages du journal des échecs d'installation peuvent confirmer l'erreur et indiquer que les tentatives de configuration utilisent un gestionnaire de services incorrect pour installer l'agent.

Cause : Red Hat a supprimé le package chkconfig dans la distribution Red Hat Enterprise Linux (RHEL) 9. Pour plus de détails, reportez-vous à la base de connaissances Red Hat.

Action :

Vérifier le problème
  1. Vérifiez que l'environnement utilise Red Hat Enterprise Linux 9.x en exécutant la commande suivante :
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. Les messages ci-dessous mettent en évidence le problème selon lequel le système d'exploitation/la famille n'a pas été identifié correctement à l'aide des règles présentes dans le script agentcore. L'installation tentera de configurer le service agent à l'aide de init.d et non de systemctl sur RHEL 9x.
    $ rpm -ivh oracle.mgmt_agent.231118.1208.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous agent service exists
    Checking if OS has systemd or initd
    Checking available disk space for agent install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the agent will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_agent-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_agent' daemon
    mgmt_agent service creation failed. Reason: Detected Linux:
    Installing the mgmt_agent daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_agent': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_agent-231118.1208-1.x86_64) scriptlet failed, exit status 1
  3. Vérifiez que le package chkconfig est manquant, comme décrit dans l'article suivant de la base de connaissances Red Hat.

Solution 1 - Installer le package chkconfig

  1. Installez le package manquant en exécutant la commande suivante :
    $ dnf install chkconfig
  2. Vérifiez que le package existe dans l'environnement en exécutant la commande suivante :
    $ rpm -qa | grep chkconfig
  3. Installez à nouveau l'agent de gestion.

Solution 2 - Sans installer le package chkconfig

Remarque

Il s'agit d'une solution de contournement. Utilisez cette solution uniquement si le package chkconfig ne peut pas être installé. La solution recommandée consiste à installer le package chkconfig.

Si l'installation du package chkconfig n'est pas une option décrite dans la section Solution 1 ci-dessus, procédez comme suit en tant que solution alternative pour installer le logiciel Management Agent.

Pour :
  1. Passez à un shell root.
  2. Définissez la variable d'environnement DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Installez le logiciel d'agent de gestion.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Dépannage : échec de l'installation de l'agent de gestion sur la valeur RUN_AGENT_AS_USER attendue sous Linux en tant que root

Si vous installez l'agent et voyez l'erreur suivante, vous devez modifier les droits d'accès de l'utilisateur qui l'installe.

rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpm
Preparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is root
Current user group is rootroot is not the default user, checking if required environment variables are set
RUN_AGENT_AS_USER=mgmt_agent contains an unexpected value
Expected RUN_AGENT_AS_USER value to be root, exiting
error: %pre(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
error: oracle.mgmt_agent-240229.1733-1.x86_64: install failed

Solution :

  1. Définissez la variable d'environnement RUN_AGENT_AS_USER sur root en ajoutant les éléments suivants à votre configuration d'environnement :
    export RUN_AGENT_AS_USER=root
    export AGENT_USER_GROUP=<OS_primary_group_of_selected_OS_user>
  2. Installez l'agent en utilisant la commande suivante :
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

    Pour plus d'informations, reportez-vous à Utilisation d'un utilisateur de système d'exploitation autre que celui par défaut pour installer l'agent de gestion.

Dépannage : échec d'accès au script à l'aide d'un chemin absolu. Droits d'accès insuffisants

Si vous trouvez l'erreur suivante, vous pouvez modifier les droits d'accès pour résoudre ce problème.

Copying files to destination dir (/opt/oracle/mgmt_agent)Initializing software from templateChecking if JavaScript engine is available to useCreating mgmt_agent daemonmgmt_agent service creation failed. Reason: Failed to access the script using an
        absolute path. Insufficient permissions may prevent the user "mgmt_agent" from traversing
        one of the folders. Please check the following permissions

Solution : vous pouvez configurer le répertoire /opt/oralce avec les droits d'accès 755 pour autoriser l'accès du programme d'installation de l'agent.

Dépannage : échec de la tentative d'inscription cloud avec le statut HTTP 407, informations d'identification de Gateway Server incorrectes

Si vous installez l'agent OMA et que l'erreur CloudRegistrationStep échoue avec l'erreur HTTP Status 407 suivante, cela peut être dû à des informations d'identification GatewayServerUser ou GatewayServerPassword incorrectes.

CloudRegistrationStep: The registration attempt failed with HTTP Status 407
Additional details are available in the configure logs at /opt/oracle/mgmt_agent/configure-logs 

Solution : générez une nouvelle clé de réponse avec les valeurs correctes GatewayServerUser et GatewayServerPassword, puis, pour vérifier les détails corrects du serveur Gateway Server, réessayez d'installer l'agent.

Dépannage : échec de l'installation de l'agent JAVA_HOME n'est pas défini, abandon de l'installation de l'agent

Lorsque vous installez l'agent, si l'erreur suivante se produit, l'emplacement du répertoire de base java est introuvable au cours de l'installation.
rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpmPreparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is rootCurrent user group is rootroot is not the default user, checking if required environment variables are set
Checking agent version
Updating / installing...
1:oracle.mgmt_agent-240229.xxxx-1################################# [100%]
Failed to get unit file state for mgmt_agent.service: No such file or directory
Executing install
JavaHome is not set aborting agent install
warning:%post(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1

Action :

  1. Dans le fichier de réponses, définissez le paramètre JAVA_HOME en ajoutant ce qui suit :
    export JAVA_HOME=path/to/jdk/directory
  2. Installez l'agent en exécutant la commande suivante.
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

Dépannage : impossible d'afficher l'espace de noms et les mesures Prometheus dans le service OCI Monitoring

Dans la console OCI, si les stratégies requises sont configurées correctement et que l'espace de noms et les mesures Prometheus ne sont pas visibles à partir d'OCI Monitoring dans l'explorateur de mesures, vous devrez peut-être vérifier que l'utilisateur de système d'exploitation mgmt_agent dispose des droits d'accès en lecture pour le fichier .properties.

Cause possible : l'utilisateur du système d'exploitation mgmt_agent n'est pas autorisé à lire le fichier .properties. Ce fichier peut appartenir à un utilisateur du système d'exploitation root disposant de 600 autorisations.
agent_inst/discovery/PrometheusEmitter/compute_exporter.properties 
Action : pour résoudre le problème, procédez comme suit :
  1. Vérifiez que le fichier  .properties dans agent_inst/discovery/PrometheusEmitter appartient à l'utilisateur du système d'exploitation mgmt_agent et que l'utilisateur du système d'exploitation mgmt_agent dispose de droits d'accès en lecture sur ce fichier.
  2. Redémarrez l'agent de gestion OCI.

Résoudre les problèmes : Indicateur fourni mais non défini

Erreur : si l'erreur suivante s'affiche : indicateur fourni mais non défini : -trusted-certs-dir

Action : pour résoudre le problème, vous pouvez mettre à niveau OCA vers la dernière version à l'aide des commandes suivantes.
$ sudo -u oracle-cloud-agent /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent -cli -trusted-certs-dir=/tmp/trustedcerts
flag provided but not defined: -trusted-certs-dir
Usage of /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent:
  -agent-config string
        agent config yml file
  -cli
        run the monitoring in cli mode
  -debug
        enable debug logging
  -dev
        enable dev runs
  -force-redeploy
        force redeploy image
  -metadata-config string
        metadata config json file
  -oci-config string
        oci config file
  -staging
        enable staging endpoint
  -upgrade-native-agent
        invoke native agent upgrade

Dépannage : échec de l'ajout d'informations d'identification SSH avec erreur : caractère non guillemet interdit

Cause possible : lorsque vous ajoutez des informations d'identification source à un agent, si l'erreur de caractère non borné par des guillemets suivante s'affiche, cela signifie que le fichier JSON n'est pas formaté correctement. Par exemple, si la clé SSH s'affiche sur plusieurs lignes, cela peut entraîner la non-reconnaissance de la clé SSH et l'erreur de caractère non borné. Par exemple :

[root@host ociagent]# cat 2nd.json | sudo -u mgmt_agent
      /opt/oracle/mgmt_agent/agent_inst/bin/credential_mgmt.sh -o upsertCredentials -s
      logancom.fasterxml.jackson.databind.JsonMappingException: Illegal unquoted character ((CTRL-CHAR,
      code 10)): has to be escaped using backslash to be included in string valueat [Source: (BufferedInputStream); line: 7, column: 70] (through reference chain:
      oracle.polaris.core.source.metadata.impl.creds.CredentialFormat["properties"]->java.lang.Object[][1]->oracle.polaris.core.source.metadata.impl.creds.CredentialFormat$Property["value"])at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:402)at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:361)at
Solution : vous pouvez résoudre ce problème de deux manières :
  • Ajoutez le caractère spécial \n avant chaque ligne de la clé. Par exemple :
    {"source":"host.myvm.example.com", 
    "name":"OSCreds", 
    "type":"SSHKeyCreds", 
    "description":"SSH keys for a user", 
    "properties":[
    {"name":"SSHUserName","value":"username"},               
    {"name":"SSHPrivateKey","value":"-----BEGIN RSA PRIVATE KEY-----\n<private-key-value>
    \n-----END RSA PRIVATE KEY-----"},
    {"name":"SSHPublicKey","value":"-----BEGIN PUBLIC KEY-----\n<public-key-value>
    \n<public-key-value>
    \n-----END PUBLIC KEY-----"]}
  • Vous pouvez également ajouter la valeur de clé complète sur une seule ligne.

Maintenant, le format JSON est correct et vous pouvez réessayer l'opération pour ajouter les informations d'identification source.

Dépannage : erreur de chemin de certificat

Cause possible : si l'erreur suivante s'affiche lors de l'installation de l'agent, il se peut que vous ayez un composant réseau qui injecte ses propres certificats. Ou si vous rencontrez l'erreur lors de l'installation de l'agent et si celui-ci se connecte via un proxy, celui-ci peut injecter un certificat personnalisé. Vous devrez consulter votre administrateur pour obtenir le certificat personnalisé, puis suivre les étapes ci-dessous.

PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException 

Solution : pour résoudre l'un de ces problèmes, procédez comme suit :

  1. Fournissez des certificats personnalisés lors de l'installation de l'agent. Reportez-vous à Import Certificates ou à Update Certificates.
  2. Dans le fichier de clés de réponse, ajoutez le paramètre importTrustedCertsDirectory, y compris le chemin. Pour plus d'informations, reportez-vous à l'exemple suivant et à la section Configure a Response File.
importTrustedCertsDirectory=/tmp/crt

Dépannage : impossible d'installer l'agent Oracle Management sur l'instance Windows

Lors de l'installation de l'agent sur un hôte Windows, si le kit JDK pris en charge n'existe pas et qu'un kit JDK utilise une version Java différente, par exemple 1.8.0_51, l'installation de l'agent OMA échoue sur le même hôte avec l'erreur suivante :

C:\Users\abc\Downloads\Latest-agent> .\installer.bat 
C:\Users\abc\Downloads\Latest-agent\Windows-input.rsp
64 bit Windows OS found.
Checking pre-requisites

Checking if previous agent service exists
Checking if C:\Oracle\mgmt_agent\agent_inst directory exists
Checking Java version

"Agent only supports 64 bit and 32 bit JDK 8 (with a minimum upgrade version JDK 8u281). 
Please set your preferred path in JAVA_HOME"
Solution : pour résoudre ce problème :
  1. Téléchargez le kit JDK au format .zip d'archive compressée.
  2. Extrayez le fichier JDK.zip dans un répertoire de l'hôte Windows.
  3. Installez l'agent et fournissez le fichier JAVA_HOME qui pointe vers le répertoire.

Dépannage : lorsque vous installez l'agent de gestion et que vous voyez des messages d'expiration de connexion réseau

Cause possible : si vous voyez des messages d'expiration de la connexion réseau. Par exemple :
http://Example.example.com:4480->https://management-agent.us-ashburn-1.oci.oraclecloud.com:443 : Connection timed out Read failed)
Il est donc probable que l'agent de gestion ne puisse pas accéder aux services Oracle Cloud Infrastructure.

Solution :

Vérifiez les règles de configuration réseau et vérifiez que l'agent de gestion peut se connecter aux services OCI à partir de la machine virtuelle sur laquelle l'agent de gestion est installé. Si vous disposez d'un pare-feu ou d'une configuration NAT, vérifiez qu'il autorise la communication sortante sur les adresses IP recommandées par OCI. Pour plus d'informations, reportez-vous à Plages d'adresses IP pour les services déployés dans Oracle Cloud Infrastructure.

Dépannage : CloudRegistrationStep : échec de la tentative d'inscription avec le statut HTTP 401 (les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes)

Cause : ce problème peut survenir en raison d'une clé de réponse non valide ou incorrecte.

Action : vérifiez que vous disposez d'une clé valide. Pour plus d'informations, reportez-vous à la section Manage Install Keys.

Dépannage : "code" : "NotAuthenticated","message" : "Les informations requises pour procéder à l'authentification n'ont pas été fournies ou n'étaient plus correctes.

Cause : ce problème peut survenir en raison d'une clé de réponse expirée.

Action : vérifiez que vous disposez d'une clé valide. Pour plus d'informations, reportez-vous à la section Manage Install Keys.

Dépannage des problèmes de désinstallation des agents de gestion

Cette rubrique traite des problèmes courants liés à la désinstallation d'agents de gestion Oracle et de leur résolution.

Erreur : ... indique plusieurs packages

Cause : le registre rpm contient plusieurs packages portant ce nom.

Action : utilisez l'indicateur --allmatches lors de l'exécution de la commande rpm -e :
rpm -e oracle.mgmt_agent --allmatches

Erreur : échec du scriptlet ... avec le code de sortie

Cause : le script rpm n'a pas pu arrêter l'agent en cours d'exécution ou n'est pas parvenu à enlever le fichier du service d'agent du système.

Action : pour résoudre l'erreur, essayez d'enlever l'agent manuellement.
  • Vérifiez si votre agent est en cours d'exécution :

    Pour OL7 : systemctl status mgmt_agent

    Pour OL6 : /sbin/initctl status mgmt_agent

    Si l'agent est en cours d'exécution, arrêtez-le :

    Pour OL7 : systemctl stop mgmt_agent

    Pour OL6 : /sbin/initctl stop mgmt_agent

  • Enlevez le script rpm en exécutant la commande rpm -e oracle.mgmt_agent --noscripts. Cette commande ignorera tous les scripts rpm et essaiera d'enlever le package de son registre.
  • Enlevez tous les fichiers d'agent en exécutant la commande rm -rf /opt/oracle/mgmt_agent. Exécutez également la commande suivante :

    Pour OL7 : rm -rf /etc/systemd/system/mgmt_agent.service

    Pour OL6 : rm -rf /etc/init/mgmt_agent.conf

Résoudre les problèmes de mise à niveau de l'agent de gestion

Lorsque vous mettez à niveau Oracle Management Agent, vous pouvez utiliser la liste suivante pour résoudre les erreurs courantes.

Dépannage : la mise à niveau automatique est activée, mais l'agent ne procède pas à la mise à niveau automatique car le propriétaire du fichier n'est pas valide

Cause : vous pouvez configurer les agents de gestion pour qu'ils soient mis à niveau automatiquement. L'option de mise à niveau automatique est disponible au niveau de la location. Par conséquent, si vous sélectionnez l'option de mise à niveau automatique dans la console Oracle Cloud, tous les agents de votre location OCI seront mis à niveau automatiquement. La mise à niveau automatique de l'agent peut prendre jusqu'à 24 heures après la disponibilité d'une nouvelle version de l'agent dans Management Agent Cloud Service.

Si la version de l'agent n'est pas mise à jour après une attente de 24 heures, certains problèmes sur le disque peuvent empêcher l'agent de se mettre à niveau automatiquement.

La cause la plus fréquente de cette erreur est que les fichiers appartiennent à un utilisateur du système d'exploitation différent de celui qui a installé l'agent de gestion. Le processus de mise à niveau s'exécute avec le même utilisateur de système d'exploitation que le processus en cours d'exécution et n'a pas la possibilité de passer à la racine. Tout fichier dans le répertoire mgmt_agent créé manuellement par l'utilisateur risque d'interférer avec la capacité de l'agent à effectuer la mise à niveau automatique.

Vous pouvez trouver le fichier mgmt_agent.log aux emplacements suivants :
  • Pour l'agent de gestion autonome :
    /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
  • Pour le module d'extension d'agent de gestion sur l'agent Oracle Cloud (OCA) sur les instances OCI Compute :
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log

    Dans le fichier mgmt_agent.log, vous pouvez voir l'erreur suivante indiquant les fichiers problématiques :

    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.oldbackup]
    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] WARN  - Files with invalid owners were found, skippingauto-upgrade
Action : vous pouvez utiliser la solution de contournement suivante pour résoudre ce problème :
  1. L'utilisateur doit modifier la propriété et le groupe des fichiers affectés sur le compte utilisateur qui a installé l'agent de gestion à l'origine.
  2. Si un fichier a été créé avec le mauvais propriétaire, vous pouvez le supprimer ou le déplacer vers un autre répertoire en dehors du répertoire de l'agent de gestion. Selon votre installation, vous pouvez trouver le répertoire Management Agent à l'un des emplacements suivants :
    • Pour l'agent de gestion autonome : /opt/oracle/mgmt_agent/
    • Pour le module d'extension d'agent de gestion d'un agent Oracle Cloud dans une instance OCI Compute : /var/lib/oracle-cloud-agent
    Remarque

    Pour éviter ces problèmes, ne créez aucun fichier manuellement dans le répertoire d'agent de gestion.

Dépannage des agents de gestion sur les instances de calcul

Les utilisateurs peuvent rencontrer différentes erreurs lors du déploiement d'Oracle Management Agent sur les instances de calcul. Les causes et les actions recommandées pour certaines erreurs courantes sont répertoriées ci-dessous.

Dépannage : l'agent est à l'état Non disponible et le fichier journal de l'agent signale Balises non valides

La page Agents de gestion affiche l'agent dont l'état est Non disponible et le fichier mgmt_agent.log (situé sous le répertoire <Agent_Inst>/logs) affiche le message suivant :

ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s). Ajoutez une valeur à chacune des définitions de balise suivantes : \nGLOBAL.ComponentType, GLOBAL.ApplicationName,

Cause :

Ce problème peut survenir lorsque le compartiment requiert des balises obligatoires pour chaque ressource et que la demande de création de ressource n'inclut pas les balises, la demande d'activation échouera avec le message suivant :"Balises non valides : échec de la création de ressource car la ressource exige des valeurs de balise" et le statut de l'agent est "Non disponible".

Action :

  • Agents de gestion

    Si vous disposez d'un agent de gestion autonome, il doit être désinstallé.

    Si l'agent OMA a été installé à l'aide d'un fichier RPM ou ZIP, il doit être désinstallé et réinstallé en fournissant un fichier de réponses à l'aide du paramètre DefinedTags, comme décrit dans la section Vérifier les paramètres de l'agent.

  • Agents de gestion sur les instances de calcul
    Si l'agent de gestion est activé via la console OCI à l'aide du module d'extension OCA, il n'existe aucun fichier de réponse car il n'est pas utilisé pour les instances de calcul. Dans ce cas, procédez comme suit :
    1. Connectez-vous à l'instance où l'agent de gestion est déployé et utilisez sudo en tant qu'utilisateur oracle-cloud-agent à l'aide de la commande suivante :
      sudo -u oracle-cloud-agent sh
    2. Créez un fichier agent.definedtags à l'emplacement suivant :/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/
    3. Ajoutez les balises définies nécessaires à la création de la ressource dans le fichier agent.definedtags.

      Par exemple, s'il existe 2 espaces de noms admin_namespace et finance_namespace

      et chaque espace de noms utilise 2 clés et 2 valeurs environment_type=non-prod, sensitivity=restricted, vous pouvez utiliser les éléments suivants :
      DefinedTags = [{"admin_namespace": {"environment_type": "non-prod",
          "sensitivity": "restricted"}, "finance_namespace": {"environment_type":
          "non-prod","sensitivity": "restricted"}}]
    4. Redémarrez oracle-cloud-agent à l'aide de la commande suivante :
      sudo systemctl restart oracle-cloud-agent

Dépannage : échec de la configuration de l'agent de gestion avec fork/exec oracle.polaris.oca.main : droit d'accès refusé

Cette erreur peut entraîner l'échec de l'installation ou du démarrage de l'agent de gestion pour les utilisateurs.

Le message d'erreur affiché dans la vue Module d'extension de l'instance de calcul pour le module d'extension d'agent de gestion se présente comme suit :

workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]

Cause possible :

Ce problème peut se produire lorsqu'une instance de calcul interdit les opérations fork/execute à partir du répertoire /tmp en montant tmpfs avec l'indicateur noexec.

Pour confirmer cette cause possible, exécutez la commande suivante :
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)

La sortie doit indiquer does have the noexec flag.

Action :

  1. Arrêtez l'agent Oracle Cloud.
     sudo systemctl stop oracle-cloud-agent
  2. Ajoutez le paramètre suivant au fichier : /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
    overrideTmpDir: true
  3. Démarrez l'agent Oracle Cloud.
    $ sudo systemctl start oracle-cloud-agent

Dépannage : échec de l'authentification de l'agent de gestion en raison d'un décalage d'horloge, heure différente sur l'instance de calcul par rapport à l'heure sur le serveur

Cause : s'il existe un écart d'horloge de plus de 5 minutes entre l'instance de calcul sur laquelle l'agent est en cours d'exécution et le service Oracle Cloud Infrastructure Identity, les demandes sont rejetées avec HTTP 401.

Si vous trouvez les erreurs suivantes :

Dans l'instance OCI Compute, accédez à l'onglet Agent Oracle Cloud. L'agent de gestion affiche une erreur dans la colonne Message :

rpc error: code = Unavailable desc = connection error: desc = "transport: error while
      dialing: dial unix /var/lib/oracle-cloud-agent/tmp/plugin1825606937: connect: connection
      refused"

Ou dans les journaux, vous pouvez trouver l'erreur suivante :

2022-12-09 07:41:22,144 [SysExecutor.0 (Resource Principal Token Refresher)-47] WARN  - #-#  invocation access log [request-id-prefix: K9YBE4AY] #-#
Service: OCI
Method:  GET
Path:    /20200202/managementAgents/ocid1.managementagent.....rvf6i3ba/resourcePrincipalToken
Headers:opc-rpt-request-token=********************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        date=Fri, 09 Dec 2022 07:41:19 GMT         
        host=management-agent.ap-tokyo-1.oci.oraclecloud.com         
        Authorization=******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO         
        User-Agent=Jersey/2.34 (Apache HttpClient 4.5.13)Attempts:
<--> Endpoint:       management-agent.ap-tokyo-1.oci.oraclecloud.com     
     opc-request-id: K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO     
     StartTime:      2022-12-09 07:41:19,976 GMT     
     Status:         401 Unauthorized     
     Headers:        X-Content-Type-Options=nosniff                     
                     Content-Length=187                         
                     opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO/E4356B68C6C541BAD867E46760316D35/4118B130EE46A8E25F90DC91AB7F12D7                     
                     Date=Fri, 09 Dec 2022 07:41:21 GMT                     
                     Content-Type=application/json     
      ErrorBody:
{  
    "code" : "NotAuthenticated",  
    "message" : "Unable to authenticate the request for ocid1.managementagent.oc1.ap-tokyo-1.amaaaa...6frjnrbvqrvf6i3ba"}

Action

Corrigez l'écart d'horloge et redémarrez. Si l'agent est arrêté depuis des jours en raison de cette erreur, vous devez nettoyer le fichier donotrestart avant de redémarrer l'agent.

En outre, Oracle recommande de configurer la date et l'heure du système d'exploitation pour la synchronisation automatique avec les serveurs NTP afin d'éviter les temps d'arrêt futurs. Si des services supplémentaires sont en cours d'exécution sur l'ordinateur, il est recommandé de redémarrer l'ordinateur après le changement d'heure afin que les services puissent être réinitialisés avec la nouvelle heure.

Pour corriger la date et l'heure d'exécution du système d'exploitation, puis redémarrer l'agent, procédez comme suit :

  1. Pour arrêter l'agent, exécutez la commande suivante :
    sudo systemctl stop oracle-cloud-agent
  2. Corrigez la date et l'heure.
  3. Exécutez la commande suivante pour supprimer le fichier configure.donotrestart.
    sudo rm /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/configure.donotrestart
  4. Démarrage de l'agent.
    sudo systemctl start oracle-cloud-agent

Dépannage : service d'agent de gestion OCI : agent non visible dans la console OCI sous Observability and Management

L'agent de gestion OCI a été installé sur une instance de calcul. L'agent est exécuté sur l'hôte. Toutefois, l'agent n'apparaît pas dans la console Oracle Cloud si vous accédez au menu de navigation, sélectionnez Observability & Management, accédez à Management Agents, puis sélectionnez Agents.

Cause possible : les compartiments de l'instance de calcul et de la clé d'installation de l'agent sont différents.

Action :
  1. Arrêtez et désinstallez l'agent de gestion sur l'instance de calcul.
  2. Créez une clé d'installation d'agent dans le même compartiment de l'instance de calcul.
  3. Utilisez cette nouvelle clé d'installation que vous venez de créer et installez l'agent de gestion.
Désormais, l'agent de gestion apparaît comme actif sous Observation et gestion, accédez à Agents de gestion, puis sélectionnez Agents.

Dépannage des passerelles de gestion

Cette rubrique traite des problèmes courants et des solutions liées aux passerelles de gestion.

Dépannage : suppression d'une passerelle de gestion

Cause : dans certains cas, il peut être nécessaire d'enlever une installation de passerelle de gestion existante afin de la réinstaller.

Action :
  1. Vérifiez si la passerelle est en cours d'exécution :

    Pour OL7 : systemctl status mgmt_gateway

    Pour OL6 : /sbin/initctl status mgmt_gateway

    Si la passerelle est en cours d'exécution, arrêtez-la :

    Pour OL7 : systemctl stop mgmt_gateway

    Pour OL6 : /sbin/initctl stop mgmt_gateway

  2. Enlevez le script RPM de la passerelle installée à l'aide de la commande suivante : rpm -e oracle.mgmt_gateway --noscripts

  3. Enlevez tous les fichiers de la passerelle restants à l'aide de la commande suivante :

    rm -rf /opt/oracle/mgmt_agent

  4. Exécutez la commande suivante :

    Pour OL7 : rm -rf /etc/systemd/system/mgmt_gateway.service

    Pour OL6 : rm -rf /etc/init/mgmt_agent.conf

Dépannage : configuration d'une passerelle de gestion

Cause : dans certains cas, le nom d'hôte peut ne pas être résolu dans l'environnement d'installation, ce qui peut entraîner l'échec de l'installation avec le message d'erreur suivant :

Dépannage : "Impossible de résoudre le nom d'hôte <hostname value> dans l'environnement d'installation. Résolvez le nom d'hôte ou indiquez GatewayCertCommonName dans le fichier de réponses et réexécutez le script de configuration de la passerelle."

Action :

  • Vérifiez et résolvez le nom d'hôte de l'environnement pour obtenir la valeur de nom de domaine qualifié complet après avoir exécuté la commande : hostname -f
  • Un utilisateur peut éventuellement fournir un nom de domaine qualifié complet personnalisé pour la configuration de la passerelle via la saisie de la propriété GatewayCertCommonName dans le fichier de réponses d'entrée. Reportez-vous à Parmaters du fichier de réponses
  • Réexécutez le script de configuration de la passerelle.
    sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

Cause : dans certains cas, l'installation de la passerelle de gestion peut échouer avec le message d'erreur suivant en raison de l'absence de stratégies dans OCI ou de problèmes de limite de ressources dans la location. Si l'erreur suivante s'affiche, suivez les étapes ci-dessous.

Dépannage : échec du démarrage de la passerelle de gestion car les certificats n'ont pas pu être créés, initialisés ou extraits dans OCI. Pour plus d'informations, consultez les journaux."

Action :

  • Ouvrez le fichier journal dans le répertoire d'installation de la passerelle de gestion, par exemple : /opt/oracle/mgmt_agent/plugins/GatewayProxy/statedir/log/mgmt_gateway.log
  • Si le fichier journal contient l'un des 404 codes d'erreur suivants, choisissez l'une des options suivantes pour résoudre le problème :
    2023-07-25 15:38:06.694/CEST [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "NotAuthorizedOrNotFound",  "message" : "Authorization failed or requested resource not found."}
    2023-07-25 15:38:06.696/CEST [pool-3-thread-1] ERROR com.oracle.mgmtagent.proxy.ProxyServer - Error while initializing and loading certificate bundlescom.oracle.mgmtagent.proxy.exception.CertificateFailureException: The response status is 404 after multiple retries at com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility.executeRequest(CertificateUtility.java:293) ~
  • Si le fichier journal contient l'un des 400 codes d'erreur suivants, consultez les options suivantes pour résoudre le problème :
    2023-09-20 18:51:32.772/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateCreationUtil - Create Vault Service Url invoked https://kms.us-ashburn-1.oraclecloud.com/20180608/vaults
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Received response code 400
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Header name opc-request-id , value /5704D03441842D3818B824B2D6B2712E/1D1FED893474FDA900188E24F3DEE59B
    2023-09-20 18:51:33.401/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "LimitExceeded",  "message" : "The limit for this tenancy has been exceeded."}
    • Vérifiez la limite de la ressource Nombre de coffres par défaut pour le service Key Management dans la console OCI. Vous pouvez émettre une demande pour augmenter les limites de ressources. Pour plus d'informations, reportez-vous à Managing Keys et Managing Vaults.
    • Vous pouvez configurer des certificats manuellement. Pour plus de détails, reportez-vous à Exécution des prérequis pour le déploiement de la passerelle de gestion et accédez à la section Gestion manuelle des certificats.
      Remarque

      Lorsque vous créez les certificats émis par une autorité de certification interne, le profil de certificat doit être Serveur TLS ou Client TLS et seuls les algorithmes de signature RSA sont pris en charge.
  • Si d'autres échecs sont liés au coffre ou à l'API de service de clé dans les journaux, vous pouvez générer une demande et contacter l'équipe oci_kms en fournissant le corps de réponse et opc-request-id.
  • Si d'autres échecs sont liés aux autorités de certification ou aux API de service de certificat dans les journaux, soumettez une demande et contactez l'équipe oci_certificates en fournissant le corps de réponse et opc-request-id.

Dépannage : échec de l'installation de la passerelle de gestion sur Red Hat Enterprise Linux 9.x

L'installation de la passerelle de gestion échoue et le message d'erreur suivant peut s'afficher : mgmt_gateway service creation failed. Reason: Detected Linux.

En outre, les messages du journal des échecs d'installation peuvent confirmer l'erreur et indiquer que les tentatives de configuration utilisent un gestionnaire de services incorrect pour installer la passerelle.

Cause : Red Hat a supprimé le package chkconfig dans la distribution Red Hat Enterprise Linux (RHEL) 9. Pour plus de détails, reportez-vous à la base de connaissances Red Hat.

Action :

Vérifier le problème
  1. Confirmez que l'environnement utilise Red Hat Enterprise Linux 9.x en exécutant la commande suivante :
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. Les messages ci-dessous mettent en évidence le problème selon lequel le système d'exploitation/la famille n'a pas été identifié correctement à l'aide des règles présentes dans le script agentcore. L'installation tentera de configurer le service agent à l'aide de init.d et non de systemctl sur RHEL 9x.
    $ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous gateway service exists
    Checking if OS has systemd or initd
    Checking available disk space for gateway install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_gateway-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_gateway' daemon
    mgmt_gateway service creation failed. Reason: Detected Linux:
    Installing the mgmt_gateway daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
  3. Vérifiez que le package chkconfig est manquant, comme décrit dans l'article suivant de la base de connaissances Red Hat.
Solution 1 - Installer le package chkconfig
  1. Installez le package manquant en exécutant la commande suivante :
    $ dnf install chkconfig
  2. Vérifiez que le package existe dans l'environnement en exécutant la commande suivante :
    $ rpm -qa | grep chkconfig
  3. Réinstallez la passerelle de gestion.
Solution 2 - Sans installation du package chkconfig
Remarque

Il s'agit d'une solution de contournement. Utilisez cette solution uniquement si le package chkconfig ne peut pas être installé. La solution recommandée consiste à installer le package chkconfig.

Si l'installation du package chkconfig n'est pas une option décrite dans la section Solution 1 ci-dessus, procédez comme suit en tant que solution alternative pour installer le logiciel Management Gateway.

Pour :
  1. Passez à un shell root.
  2. Définissez la variable d'environnement DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Installez le logiciel de passerelle de gestion.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Dépannage : échec de l'installation de la passerelle de gestion avec erreur : impossible de créer des certificats et rapport des journaux d'identité : échec de l'authentification : DATE_OUTSIDE_CLOCK_SKEW

Cause :

Echec de l'authentification du rapport des journaux d'identité : DATE_OUTSIDE_CLOCK_SKEW

# /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<PATH>/gateway_agent.rsp/opt/oracle/mgmt_agent/agent_inst/bin/setupAgent.sh
    opts=<PATH>/gateway_agent.rsp

Executing configure

Parsing input response file
Validating install key
Generating communication wallet
Generating security artifactsRegistering Management Gateway
Found service plugin(s):[GatewayProxy]

Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...Done.
GatewayProxy : Successfully deployed external plugin

Gateway setup completed and the gateway is running.
In the future gateway can be started by directly running: sudo systemctl start mgmt_gateway

Please make sure that you delete <PATH>/gateway_agent.rsp or store it in secure location.

Creating gateway system properties file
Creating properties fileCreating or validating certificates
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Failed to start Management Gateway as certificates could not be created, initialized or retrieved in OCI. Please check the logs for more details.
Management Gateway stopped

Action :

Sur l'hôte sur lequel la passerelle de gestion est installée, assurez-vous que l'heure de l'hôte est correcte, puis installez la passerelle de gestion.

Dépannage : erreur d'expiration lors de l'installation ou de la configuration de la passerelle de gestion

Si vous vérifiez que la console OCI affiche la passerelle de gestion comme active, mais que les mesures ne sont pas renseignées.

Vous pouvez trouver l'erreur suivante si le service expire :

/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Starting gateway...
Gateway started successfully

Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...............Timed out.

Agent is unable to check if it deployed requested service plugin(s) successfully or not. 
Please check back later on the console.

Cause : un délai plus long que prévu pour terminer la tâche de configuration de la passerelle de gestion peut entraîner un problème de communication réseau et entraîner l'expiration de la passerelle de gestion.

Action : pour terminer la configuration :
  1. Vérifiez qu'il n'y a aucun problème de communication réseau.
  2. Vérifiez si les détails de proxy suivants ont été mis à jour dans le fichier de réponses pour déterminer s'il existe un problème de proxy. Par exemple, vérifiez que les détails corrects de l'hôte proxy et du port ont été mis à jour dans le fichier de réponses :

    ProxyHost = my.proxyhost.com

    ProxyPort = 80

  3. Arrêtez la passerelle de gestion à l'aide de la commande suivante :

    systemctl stop mgmt_gateway

  4. Exécutez à nouveau la configuration de la passerelle de gestion à l'aide de la commande suivante :

    /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

  5. La configuration de la passerelle de gestion doit maintenant se terminer avec succès et les mesures doivent être renseignées.

Collecter les journaux de l'agent de gestion

Si vous devez déposer un ticket d'assistance pour contacter le support technique Oracle, il est utile de rassembler les journaux de l'agent OMA et de les joindre au ticket d'assistance. L'emplacement du journal dépend de la façon dont l'agent OMA est installé et activé.

Rechercher l'emplacement du journal

Vous pouvez .zip ou .tar manuellement pour tous les fichiers journaux à l'un des emplacements suivants :

  • Si vous avez activé le module d'extension d'agent OCA à l'aide de l'agent Oracle Cloud, vous pouvez trouver les journaux à cet emplacement :
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log
  • Si vous avez installé l'agent OMA à l'aide d'un graphique d'aide .rpm, zip, ou d'une image de conteneur, l'emplacement de journal par défaut est :
    /opt/oracle/mgmt_agent/agent_inst/log
Remarque

Si vous avez installé l'agent sous Windows, les emplacements des journaux dépendent de l'emplacement d'installation des agents. Les emplacements des journaux se trouvent généralement dans le répertoire d'installation à l'emplacement suivant : agent_inst/log

Créer un groupe de diagnostics

Vous pouvez soit .zip manuellement, soit .tar tous les fichiers journaux aux emplacements mentionnés ci-dessus, soit générer un groupe de diagnostics.

L'agent doit être en cours d'exécution et en bon état pour générer le groupe de diagnostics. Si la génération de l'archive de diagnostic échoue, .zip ou .tar manuellement tous les fichiers journaux mentionnés ci-dessus.

Remarque

Vous devez créer ces archives .zip ou .tar en tant qu'utilisateur du système d'exploitation de l'agent de gestion dans le répertoire /tmp ou dans un autre répertoire en dehors du répertoire d'installation de l'agent.

Pour générer un lot de diagnostics :

  • Pour un module d'extension d'agent de gestion utilisant l'agent Oracle Cloud (OCA), utilisez la commande suivante :
    $ sudo -u oracle-cloud-agent /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/bin/generateDiagnosticBundle.sh
  • Pour un agent OMA installé à l'aide d'une image téléchargée, telle qu'un fichier .rpm, .zip,, un graphique d'aide ou une image de conteneur, vous pouvez utiliser la commande suivante :
    $ sudo -u mgmt_agent /opt/oracle/mgmt_agent/agent_inst/bin/generateDiagnosticBundle.sh