Dépannage du service d'agents de gestion
Cette section décrit certains problèmes et résolutions typiques liés au service des agents de gestion, tels que l'installation et la désinstallation avec les agents de gestion et les passerelles de gestion.
Rubriques :
-
Dépanner les problèmes d'installation et de configuration des agents de gestion
- Dépannage : Désinstallez l'agent et supprimez le fichier de service avant d'installer le nouvel agent.
- Dépannage : Java n'est pas une JVM 64 bits. Définissez le chemin d'une JVM 64 bits dans la variable d'environnement JAVA_HOME ou Java introuvable, définissez votre chemin privilégié dans JAVA_HOME.
- Dépannage : Échec de l'installation de l'agent avec le message : useradd : Impossible d'obtenir un IDG unique (aucun autre IDG disponible)
- Dépannage : useradd : Impossible de créer le répertoire /usr/share/mgmt_agent
- Dépannage : Windows : Le système ne trouve pas le chemin spécifié. Échec de l'installation de l'agent.
- Dépannage : Le statut de l'agent de gestion est "Non disponible" dans la console après l'installation initiale
- Dépannage : L'agent s'exécute dans OutOfMemoryException
- Dépannage : L'agent de gestion OCI ne démarre pas sur l'hôte Windows
- Dépannage : La mise à niveau automatique de l'agent de gestion ne fonctionne pas ou certains agents ont été ignorés
- Dépannage : Adresse IP affichée dans la colonne d'hôte lorsque l'agent de gestion est installé sur l'hôte Windows
- Dépannage : Échec de l'installation de l'agent de gestion sur SELinux lors de l'utilisation d'un volume externe
- Dépannage : Échec de l'installation de l'agent de gestion sur Red Hat Enterprise Linux 9.x
- Dépannage : Échec de l'installation de l'agent - JavaHome n'est pas défini pour abandonner l'installation de l'agent
- Dépannage : Échec de l'installation de l'agent de gestion sous Linux : la valeur RUN_AGENT_AS_USER attendue est racine
- Dépannage : Échec de la tentative d'enregistrement en nuage avec le statut HTTP 407, données d'identification de serveur de passerelle incorrectes
- Dépannage : Impossible de voir l'espace de noms et les mesures Prometheus dans le service de surveillance
- Dépannage : Indicateur fourni mais non défini
- Dépannage : Échec de l'ajout des données d'identification SSH avec erreur : Caractère non guidé non autorisé
- Dépannage : Erreur de chemin d'accès au certificat
- Dépannage : Impossible d'installer l'agent de gestion Oracle sur l'instance Windows
- Dépannage : Lorsque vous installez l'agent de gestion et que vous voyez les messages de temporisation de la connexion réseau
- Dépannage : CloudRegistrationStep : Échec de la tentative d'enregistrement avec le statut HTTP 401 (les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes)
- Dépannage : "code" : "NotAuthenticated","message" : "Les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes.
-
Résoudre les problèmes de désinstallation des agents de gestion
-
Dépanner les agents de gestion sur les instances de calcul
- Dépannage : L'agent est à l'état Non disponible et le fichier journal de l'agent indique "Balises non valides"
- Dépannage : Échec de la configuration de l'agent de gestion avec fork/exec oracle.polaris.oca.main : autorisation refusée
- Dépannage : Échec de l'authentification de l'agent de gestion en raison d'une variation d'horloge, heure différente sur l'instance de calcul par rapport à l'heure sur le serveur
- Dépannage : Service d'agent de gestion OCI : Agent non visible dans la console OCI sous Observabilité et gestion
- Dépanner les problèmes de mise à niveau des agents de gestion
-
Dépanner les passerelles de gestion
- Dépannage : Supprimer la passerelle de gestion
- Dépannage : Configurer la passerelle de gestion
- Dépannage : Échec de l'installation de la passerelle de gestion sur Red Hat Enterprise Linux 9.x
- Dépannage : Échec de l'installation de la passerelle de gestion avec l'erreur : Les certificats n'ont pas pu être créés et le rapport sur les journaux d'identité : Échec de l'authentification : DATE_OUTSIDE_CLOCK_SKEW
- Dépannage : Lors de l'installation et de la configuration de l'agent de gestion, erreur de temporisation
Dépanner les problèmes d'installation et de configuration des agents de gestion
Les utilisateurs peuvent rencontrer diverses erreurs lors du processus d'installation et de configuration d'Oracle Management Agent. Les causes de certaines erreurs communes et les actions recommandées sont listées ci-dessous.
- Dépannage : Désinstallez l'agent et supprimez le fichier de service avant d'installer le nouvel agent.
- Dépannage : Java n'est pas une JVM 64 bits. Définissez le chemin d'une JVM 64 bits dans la variable d'environnement JAVA_HOME ou Java introuvable, définissez votre chemin privilégié dans JAVA_HOME.
- Dépannage : Échec de l'installation de l'agent avec le message : useradd : Impossible d'obtenir un IDG unique (aucun autre IDG disponible).
- Dépannage : useradd : Impossible de créer le répertoire /usr/share/mgmt_agent
- Dépannage : Windows : Le système ne trouve pas le chemin spécifié. Échec de l'installation de l'agent.
- Dépannage : Le statut de l'agent de gestion est "Non disponible" dans la console après l'installation initiale
- Dépannage : Après la configuration, l'agent de gestion n'est pas visible dans la console ou au moyen de l'API
- Dépannage : Les mesures Prometheus ou Kubernetes surveillées à l'aide de l'agent de gestion ne sont pas disponibles
- Dépannage : L'agent s'exécute dans OutOfMemoryException
- Dépannage : L'agent de gestion OCI ne démarre pas sur l'hôte Windows
- Dépannage : La mise à niveau automatique de l'agent de gestion ne fonctionne pas ou certains agents ont été ignorés
- Dépannage : Adresse IP affichée dans la colonne d'hôte lorsque l'agent de gestion est installé sur l'hôte Windows
- Dépannage : Échec de l'installation de l'agent de gestion sur SELinux lors de l'utilisation d'un volume externe
- Dépannage : Échec de l'installation de l'agent de gestion sur Red Hat Enterprise Linux 9.x
- Dépannage : Échec de l'installation de l'agent - JavaHome n'est pas défini pour abandonner l'installation de l'agent
- Dépannage : Échec de l'installation de l'agent de gestion sous Linux : la valeur RUN_AGENT_AS_USER attendue est racine
- Dépannage : Échec de l'accès au script à l'aide d'un chemin absolu. Autorisations insuffisantes
- Dépannage : Échec de la tentative d'enregistrement en nuage avec le statut HTTP 407, données d'identification de serveur de passerelle incorrectes
- Dépannage : Impossible de voir l'espace de noms et les mesures Prometheus dans le service de surveillance
- Dépannage : Indicateur fourni mais non défini
- Dépannage : Échec de l'ajout des données d'identification SSH avec erreur : Caractère non guidé non autorisé
- Dépannage : Erreur de chemin d'accès au certificat
- Dépannage : Impossible d'installer l'agent de gestion Oracle sur l'instance Windows
- Dépannage : Lorsque vous installez l'agent de gestion et que vous voyez les messages de temporisation de la connexion réseau
- Dépannage : CloudRegistrationStep : Échec de la tentative d'enregistrement avec le statut HTTP 401 (les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes)
- Dépannage : "code" : "NotAuthenticated","message" : "Les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes.
Dépanner : Désinstallez l'agent et supprimez le fichier de service avant d'installer le nouvel agent.
Cause : Un agent est déjà installé sur votre hôte. Un processus de désinstallation précédent n'a pas réussi à supprimer le fichier du service d'agent.
- Exécutez
rpm -e oracle.mgmt_agent
pour désinstaller l'agent. Si la commande aboutit, essayez d'installer le nouvel agent. Dans le cas contraire, essayez l'action recommandée suivante. - Exécutez
ls /opt/oracle/mgmt_agent
pour vérifier s'il reste des éléments de l'installation précédente de l'agent. Si vous en trouvez, supprimez-les en exécutant :rm -rf /opt/oracle/mgmt_agent
. - Vérifiez s'il existe déjà un fichier de service d'agent à l'emplacement suivant, selon votre version Linux :
- Pour OL7 (si vous utilisez systemd) :
/etc/systemd/system/mgmt_agent.service
- Pour OL6 (si vous utilisez init) :
/etc/init/mgmt_agent.conf
.Si ce fichier de service existe, supprimez-le en exécutant :
rm -rf /etc/init/mgmt_agent.conf
, puis réessayez d'installer le nouvel agent.
- Pour OL7 (si vous utilisez systemd) :
Dépannage : Java n'est pas une JVM 64 bits. Définissez le chemin d'une JVM 64 bits dans la variable d'environnement JAVA_HOME ou Java introuvable, définissez votre chemin privilégié dans JAVA_HOME.
Cause : La variable d'environnement JAVA_HOME
n'est pas définie ou ne pointe pas vers un emplacement de JDK à 64 bits.
Action : Réglez la variable d'environnement JAVA_HOME
à la version de JDK appropriée et réessayez d'installer l'agent. Actuellement, seul JDK 64 bits est pris en charge.
Dépannage : Échec de l'installation de l'agent avec le message : useradd : Impossible d'obtenir un IDG unique (aucun autre IDG disponible)
Cause : Le script d'installation ne peut pas ajouter un utilisateur et un groupe lors du processus d'installation de l'agent de gestion, car les ID groupe disponibles sur votre système Linux sont déjà utilisés.
Executing install
Unpacking software zip
Copying files to destination dir (/opt/oracle/mgmt_agent)
useradd: Can't get unique GID (no more available GIDs)
useradd: can't create group
Agent installation failed, please check log file
Action : Consultez l'administrateur du système avant d'effectuer les opérations suivantes :
-
Modifiez le fichier
/etc/login.defs
. Vous devez disposer des privilègessudo
pour modifier ce fichier.Recherchez les entrées suivantes :
OùSYS_GID_MIN nnnn SYS_GID_MAX mmmm SYS_UID_MIN pppp SYS_UID_MAX qqqq
nnnn
etpppp
sont les valeurs minimales etmmmm
etqqqq
, les valeurs maximales.Si les entrées ci-dessus n'existent pas dans le fichier, ajoutez-les.
-
Mettez à jour la valeur de l'entrée
SYS_GID_MAX
en fonction de la recommandation de l'administrateur du système et enregistrez le fichier. -
Supprimez l'installation de l'agent qui a échoué en exécutant :
sudo rpm -e oracle.mgmt_agent
. -
Déconnexion de l'interpréteur de commandes suivie d'une connexion.
-
Réessayez d'installer l'agent.
Dépannage : Ajout d'utilisateur : Impossible de créer le répertoire /usr/share/mgmt_agent
Lors de l'installation de l'agent de gestion, l'utilisateur mgmt_agent
est créé avec l'emplacement du répertoire de base par défaut sous /usr/share/mgmt_agent
.
Cause : Les autorisations de fichier sous /usr/share
sont insuffisantes ou le système de fichiers est en lecture seule.
Actions possibles :
-
Définissez les autorisations de fichier pour accorder à l'utilisateur
mgmt_agent
l'accès à l'emplacement du répertoire de base de l'utilisateur par défaut :/usr/share
. -
Définissez un autre emplacement de répertoire de base à l'aide de la variable d'environnement
USER_HOME_DIR_ROOT
si vous souhaitez utiliser un emplacement différent.Réglez la variable d'environnement
USER_HOME_DIR_ROOT
au chemin que vous préférez utiliser comme répertoire de base pour l'utilisateurmgmt_agent
et assurez-vous que l'utilisateur de l'agent de gestion dispose des autorisations de fichier appropriées sur ce répertoire privilégié.
Dépannage : Windows : Le système ne trouve pas le chemin d'accès spécifié. Échec de l'installation de l'agent.
NIVEAU D'ERREUR=9009
Cause possible : Les variables d'environnement n'ont pas été définies correctement en raison d'espaces dans le nom du répertoire/dossier.
Les environnements Windows permettent d'utiliser des espaces dans un nom de répertoire ou de dossier, ce qui entraîne un problème avec l'installation de l'agent de gestion, car des guillemets sont ajoutés automatiquement au nom par Windows. Par exemple, il existe un répertoire/dossier nommé : Program Files
. Dans ce cas, Windows insère automatiquement des guillemets car il y a un espace dans le nom du dossier, et il dira maintenant : "Program Files"
.
Les guillemets supplémentaires peuvent causer un problème car le programme d'installation de l'agent de gestion n'autorise pas les guillemets pour les variables d'environnement telles que JAVA_HOME
et AGENT_INSTALL_BASEDIR
.
Le programme d'installation de l'agent de gestion n'accepte pas les caractères spéciaux suivants dans le chemin : [
, ^^
, "
, '
, &
ou ]
.
Action :
- Dans la barre des tâches Windows, cliquez avec le bouton droit de la souris sur l'icône Windows et sélectionnez Système.
- Dans la fenêtre Paramètres, sous Paramètres connexes, cliquez sur Paramètres de système avancés.
- Dans l'onglet Avancé, cliquez sur Variables d'environnement.
- Cliquez sur New (Nouveau) pour créer une variable d'environnement. Cliquez sur Modifier pour modifier une variable d'environnement existante.
- Après avoir créé ou modifié la variable d'environnement, cliquez sur Appliquer, puis sur OK pour que la modification entre en vigueur.
Note
L'interface utilisateur graphique pour la création de variables d'environnement peut varier légèrement selon votre version de Windows.
Dépannage : Le statut de l'agent de gestion est "Non disponible" dans la console après l'installation initiale
Cause possible 1 : Horodatage de système incorrect
Action : Vérifiez l'heure système de l'hôte de l'agent, puis vous pouvez corriger l'heure si nécessaire.
Cause possible 2 : Si vous utilisez le fichier de réponses input.rsp
pour l'agent de gestion, vous devez définir les marqueurs du compartiment de l'agent de gestion.
Si les marqueurs ne sont pas définis, vous pouvez voir une erreur comme suit :
Attempts:
<--> Endpoint: management-agent.us-ashburn-1.oci.oraclecloud.com
opc-request-id: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXJ8
StartTime: 2024-09-18 03:45:12,662 GMT
Status: 400 Bad Request
Headers: Strict-Transport-Security=max-age=31536000; includeSubDomains;
Connection=close
Content-Length=63
opc-request-id=XXXXXXXXXXXXXXXXXXXXXXXX..................B25ADA8E
Date=Wed, 18 Sep 2024 03:45:12 GMT
Content-Type=application/json
ErrorBody:
{
"code" : "InvalidParameter",
"message" : "Invalid tags"
}
Action : Pour définir les marqueurs propres à votre environnement, dans le fichier de réponses input.rsp
, ajoutez les paramètres suivants et spécifiez les paires clé-valeur pour votre environnement. Pour plus d'informations, voir Créer un fichier de réponses.
DefinedTags = [{"namespace1":{"<key1>":"<value1>"}},
{"namespace2":{"<key2>":"<value2>"}}]
Dépannage : Après la configuration, l'agent de gestion n'est pas visible dans la console ou au moyen de l'API
Cause possible : Si, après avoir configuré l'agent de gestion ou l'agent de passerelle de gestion, l'agent ne s'affiche pas dans la console Oracle Cloud ou au moyen de l'API, les politiques correctes peuvent ne pas être configurées pour l'utilisateur ou le groupe d'utilisateurs.
Action : Vérifiez que l'utilisateur ou le groupe d'utilisateurs a les politiques requises configurées pour l'agent de gestion ou l'agent de passerelle. Pour configurer des politiques, voir Créer des politiques pour un groupe d'utilisateurs.
Dépannage : Les mesures Prometheus ou Kubernetes surveillées à l'aide de l'agent de gestion ne sont pas disponibles
-
a) Politiques manquantes
Action : Vérifiez que les politiques ont été ajoutées à l'agent de gestion comme décrit dans les instructions de configuration. Pour plus de détails, voir Configurer Oracle Cloud Infrastructure pour le service d'agent de gestion.
Si les politiques sont manquantes, ajoutez-les comme décrit sous Configurer le service d'agent de gestion pour Oracle Cloud Infrastructure.
-
(b) Fautes d'orthographe dans les politiques
Action : Vérifiez si la syntaxe des politiques présente des erreurs en les comparant aux exemples de politiques. Pour plus de détails, voir Configurer Oracle Cloud Infrastructure pour le service d'agent de gestion.
Par exemple, assurez-vous que la définition du groupe dynamique est conforme à la syntaxe suivante, avec des guillemets simples autour de l'ID compartiment et du type de ressource
managementagent
:ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
-
(c) ID compartiment incorrect dans la définition du groupe dynamique
Action : Vérifiez que l'ID compartiment de la clé d'installation est identique à l'ID compartiment spécifié dans la définition du groupe dynamique de l'agent. Par défaut, l'agent est créé dans le compartiment de la clé d'installation.
Dépannage : L'agent s'exécute dans OutOfMemoryException
Cause possible : L'agent risque de manquer de mémoire de tas s'il n'est pas réglé correctement pour prendre en charge le chargement qui lui a été affecté.
Action : Mettez à jour les paramètres de mémoire de tas pour l'agent de gestion.
- 128 Mo pour l'agent de gestion en tant que plugiciel OCA.
- 512 Mo pour l'agent de gestion autonome. ( Celui téléchargé à partir de la console de l'agent de gestion).
- Ouvrez le fichier :
agent_inst/config/java.options
. - Modifiez le fichier ci-dessus. Mettez à jour le paramètre de tas en modifiant la ligne suivante :
-Xmx512m
Par exemple : La ligne ci-dessus définit le tas maximal pour l'agent sur 512 Mo.
Pour remplacer le tas par 800 Mo, mettez à jour la ligne ci-dessus comme suit :
-Xmx800m
- Enregistrez le fichier et redémarrez l'agent pour que les modifications prennent effet.
Dépannage : L'agent de gestion OCI ne démarre pas sur un hôte Windows
Cause possible : Si l'agent démarre et échoue avec l'erreur suivante, cela peut être dû à l'échec de la mise à niveau automatique de l'agent de gestion. Vous pouvez voir les erreurs suivantes.
C:\Oracle\mgmt_agent\agent_inst\log>NET START mgmt_agent
The Oracle Management Agent service is starting...................
The Oracle Management Agent service could not be started.
A service specific error occurred: 1.
More help is available by typing NET HELPMSG 3547.
Dans ce fichier journal, C:\Oracle\mgmt_agent\agent_inst\log\mgmt_agent.log
, vous pouvez voir l'erreur suivante.
[SysExecutor.0 (PrometheusEmitter.Agent-discovery)-131] INFO - DiscoveryItemTask PrometheusEmitter.Agent-discovery - autoPromote
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Cleaning up old files...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - On windows, skipping file owner check
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Starting agent upgrade from version [231002.2039] to version [231002.2040]...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Inserted RequestSigner associated with request SigningRequester[get([])] for signingKey:SigningKey[xxxxxxxxxxxx]
[SysExecutor.1 (ManagedAgent upgradechecker)-133] INFO - Package Stream size:99003892
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully unzipped agent upgrade package at:
C:\Oracle\mgmt_agent\zip\unpack
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully copied C:\Oracle\mgmt_agent\agent_inst\bin\agentUpgrader.bat to
C:\Oracle\mgmt_agent\agent_inst\bin\tmpAgentUpgrader.bat
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully deleted previous wrapper backup file:
C:\Oracle\mgmt_agent\agent_inst\config\wrapper.conf.backedUpForUpgrade
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Backed up wrapper.conf to attempt agent upgrade
[SysExecutor.1 (ManagedAgentupgrade checker)-133] INFO - Built macros for processing wrapper.conf as:{%SERVICE_TYPE%=mgmt_agent,%JAVA_HOME%=c:\Program
Files\Java\jre-1.8,%EMSTATE%=C:\Oracle\mgmt_agent\agent_inst, %CORE_JAR%=agent-upgrader-1.0.3235.jar,%VERSION%=231002.2039,
%ORACLE_HOME%=C:\Oracle\mgmt_agent\231002.2039}
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Processed wrapper.conf.template to point it to agent upgrader
[SysExecutor.1(ManagedAgent upgrade checker)-133] INFO - Exiting for wrapper to spin up the agent upgrader...
Action : Pour corriger le problème :
- Arrêtez l'agent de gestion sur l'hôte Windows, puis entrez les commandes suivantes :
NET STOP mgmt_agent cd C:\Oracle\mgmt_agent\agent_inst\config Backup wrapper.conf Rename wrapper.conf.backedUpForUpgrade to wrapper.conf
- Démarrez le service d'agent de gestion.
- Mettez à niveau l'agent de gestion, voir Mise à niveau manuelle Windows.
Maintenant, après la mise à niveau, l'agent affiche Active sous Observability & Management.
Dépannage : La mise à niveau automatique de l'agent de gestion ne fonctionne pas ou certains agents ont été ignorés
Cause possible : Si la mise à niveau automatique de l'agent de gestion OCI ne fonctionne pas pour certains agents de gestion, il est possible que la mise à niveau automatique de l'agent de gestion ait cessé de fonctionner car certains fichiers ou répertoires étaient détenus par des responsables non valides dans le système de fichiers de l'agent.
Par exemple, si certains fichiers ou répertoires de l'emplacement suivant ne disposent pas des autorisations appropriées, la mise à niveau automatique de l'agent ne fonctionne pas : /opt/oracle/mgmt_agent/agent_inst
.
Dans ce fichier journal, vous pouvez trouver l'erreur suivante : /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/db00_cred.json,
/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.backup]
(ManagedAgent upgrade checker)-32] WARN - Files with invalid owners were found, skipping auto-upgrade
Action : Sur l'hôte de l'agent de gestion, vérifiez que, sous le système de fichiers de l'agent, tous les fichiers et répertoires appartiennent au responsable mgmt_agent
et au groupe mgmt_agent:mgmt_agent
afin que la mise à niveau automatique de l'agent de gestion puisse se terminer.
Dépannage : Adresse IP affichée dans la colonne d'hôte lorsque l'agent de gestion est installé sur l'hôte Windows
Problème : L'agent de gestion est installé sur un hôte Windows et la console de l'agent de gestion affiche l'adresse IP de l'hôte Windows dans la console Oracle Cloud au lieu d'afficher un nom de domaine complet ou un nom d'hôte Windows.
- Connectez-vous à votre hôte Windows et ouvrez le panneau de configuration.
- Sélectionnez Système et sécurité, puis Système.
- Allez à la section Nom d'ordinateur, domaine et paramètres de groupe de travail, puis cliquez sur Modifier les paramètres.
La fenêtre Propriétés du système s'affiche.
- Si elle n'est pas sélectionnée, cliquez sur Nom de l'ordinateur.
- Allez au message suivant : Pour renommer cet ordinateur, son domaine ou son groupe de travail, cliquez sur Modifier.
- Sélectionnez Modifier, une fenêtre Modifications de nom d'ordinateur/domaine s'affiche.
Par exemple, si le nom de domaine complet de l'hôte Windows est :
FOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.com
, entrez le nom abrégé de l'hôte WindowsFOOBAR004
dans la zone de texte Nom de l'ordinateur. - Sélectionnez Plus, la fenêtre Suffixe DNS et NetBIOS Nom de l'ordinateur s'affiche.
- Dans la zone de texte Suffixe DNS principal de cet ordinateur, entrez le nom DNS de l'hôte Windows.
Par exemple :
subnet1ab2regsu.exampletenantreg1.abcvcn.com
- Sélectionnez OK ou Appliquer, puis fermez toutes les fenêtres ouvertes.
- Redémarrez l'hôte Windows.
- Désinstallez l'agent de gestion existant en exécutant le script uninstaller.bat à partir du terminal Windows.
- Installez à nouveau l'agent de gestion sur l'ordinateur Windows.
L'installation de l'agent de gestion doit réussir et, dans la page Agent, le nom de domaine complet de l'hôte Windows s'affiche dans la colonne hôte.
Dépannage : Échec de l'installation de l'agent de gestion sur SELinux lors de l'utilisation d'un volume externe
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc: denied { read open } for pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0 tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0
Tous les messages d'erreur ci-dessus indiquent que SELinux ne vous permet pas d'exécuter des commandes dans le dossier sélectionné.
Action : Communiquez avec l'administrateur de système et créez les politiques requises qui permettent l'installation et l'exécution de l'agent de gestion.
Dépannage : Échec de l'installation de l'agent de gestion sur Red Hat Enterprise Linux 9.x
L'installation de l'agent de gestion échoue et le message d'erreur suivant peut s'afficher : mgmt_agent service creation failed. Reason: Detected Linux
.
En outre, les messages du journal d'échec de l'installation peuvent confirmer l'erreur et indiquer que les tentatives de configuration utilisent un gestionnaire de services incorrect pour installer l'agent.
Cause : Red Hat a supprimé l'ensemble chkconfig
dans la distribution Red Hat Enterprise Linux (RHEL) 9, pour plus de détails, voir la base de connaissances Red Hat.
Action :
- Vérifiez que l'environnement utilise Red Hat Enterprise Linux 9.x en exécutant la commande suivante :
$ cat /etc/redhat-release Red Hat Enterprise Linux release 9.3 (Plow)
- Les messages ci-dessous mettent en évidence le problème selon lequel le système d'exploitation/famille n'a pas été identifié correctement à l'aide des règles présentes dans le script agentcore. L'installation tentera de configurer le service d'agent à l'aide de
init.d
et non desystemctl
dans RHEL 9x.$ rpm -ivh oracle.mgmt_agent.231118.1208.Linux-x86_64.rpm Verifying... ################################# [100%] Preparing... ################################# [100%] Checking pre-requisites Checking if any previous agent service exists Checking if OS has systemd or initd Checking available disk space for agent install Checking if /opt/oracle/mgmt_agent directory exists Checking if 'mgmt_agent' user exists 'mgmt_agent' user already exists, the agent will proceed installation without creating a new one. Checking Java version Trying /omc/java/jdk1.8.0_391 Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java Checking agent version Updating / installing... 1:oracle.mgmt_agent-231118.1208.1################################# [100%] Executing install Unpacking software zip Copying files to destination dir (/opt/oracle/mgmt_agent) Initializing software from template Checking if JavaScript engine is available to use Creating 'mgmt_agent' daemon mgmt_agent service creation failed. Reason: Detected Linux: Installing the mgmt_agent daemon... ln: failed to create symbolic link '/etc/init.d/mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_agent': No such file or directory Service not installed. warning: %post(oracle.mgmt_agent-231118.1208-1.x86_64) scriptlet failed, exit status 1
- Vérifiez que l'ensemble
chkconfig
est manquant, comme décrit dans l'article suivant de la base de connaissances Red Hat.
Solution 1 - Installer l'ensemble chkconfig
- Installez le paquet manquant en exécutant la commande suivante :
$ dnf install chkconfig
- Vérifiez que le package existe dans l'environnement en exécutant la commande suivante :
$ rpm -qa | grep chkconfig
- Réinstallez l'agent de gestion.
Solution 2 - Sans installer le package chkconfig
Il s'agit d'une solution de rechange. Utilisez cette solution uniquement si l'ensemble
chkconfig
ne peut pas être installé. La solution recommandée consiste à installer l'ensemble chkconfig
.
Si l'installation de l'ensemble chkconfig
n'est pas une option décrite dans la section Solution 1 ci-dessus, effectuez les étapes suivantes comme solution alternative pour installer le logiciel de l'agent de gestion.
- Passez à un shell racine.
- Définissez la variable d'environnement
DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
. - Installez le logiciel de l'agent OMA.
$ sudo /bin/bash
$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
# RPM install
$ rpm -ivh <rpm_file_name.rpm>
# ZIP install
$ ./installer.sh <full_path_of_response_file>
Dépannage : Échec de l'installation de l'agent de gestion sous Linux : la valeur RUN_AGENT_AS_USER attendue est racine
Si vous installez l'agent et que vous voyez l'erreur suivante, vous devez modifier les autorisations de l'utilisateur qui installe l'agent.
rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpm
Preparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is root
Current user group is rootroot is not the default user, checking if required environment variables are set
RUN_AGENT_AS_USER=mgmt_agent contains an unexpected value
Expected RUN_AGENT_AS_USER value to be root, exiting
error: %pre(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
error: oracle.mgmt_agent-240229.1733-1.x86_64: install failed
Solution :
- Réglez la variable d'environnement
RUN_AGENT_AS_USER
à la racine en ajoutant les éléments suivants à votre configuration d'environnement :export RUN_AGENT_AS_USER=root export AGENT_USER_GROUP=<OS_primary_group_of_selected_OS_user>
- Installez l'agent à l'aide de la commande suivante :
rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm
Pour plus d'informations, voir Utiliser un utilisateur du système d'exploitation autre que par défaut pour installer l'agent de gestion.
Dépannage : Échec de l'accès au script à l'aide d'un chemin absolu. Droits insuffisants
Si vous trouvez l'erreur suivante, vous pouvez modifier les autorisations pour résoudre ces problèmes.
Copying files to destination dir (/opt/oracle/mgmt_agent)Initializing software from templateChecking if JavaScript engine is available to useCreating mgmt_agent daemonmgmt_agent service creation failed. Reason: Failed to access the script using an
absolute path. Insufficient permissions may prevent the user "mgmt_agent" from traversing
one of the folders. Please check the following permissions
Solution : Vous pouvez configurer le répertoire /opt/oralce
avec 755 autorisations pour permettre l'accès au programme d'installation de l'agent.
Dépannage : Échec de la tentative d'enregistrement en nuage avec le statut HTTP 407, données d'identification de serveur de passerelle incorrectes
Si vous installez l'agent de gestion et que l'erreur CloudRegistrationStep
échoue avec l'erreur HTTP Status 407
suivante, elle peut être due à des données d'identification GatewayServerUser ou GatewayServerPassword incorrectes.
CloudRegistrationStep: The registration attempt failed with HTTP Status 407
Additional details are available in the configure logs at /opt/oracle/mgmt_agent/configure-logs
Solution : Générez une nouvelle clé de réponse avec les valeurs correctes GatewayServerUser et GatewayServerPassword, puis pour vérifier les détails corrects du serveur de passerelle, réessayez d'installer l'agent.
Dépannage : Échec de l'installation de l'agent JAVA_HOME n'est pas défini pour abandonner l'installation de l'agent
Lorsque vous installez l'agent, si l'erreur suivante se produit, l'emplacement du répertoire d'origine java n'a pas été trouvé lors de l'installation.rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpmPreparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is rootCurrent user group is rootroot is not the default user, checking if required environment variables are set
Checking agent version
Updating / installing...
1:oracle.mgmt_agent-240229.xxxx-1################################# [100%]
Failed to get unit file state for mgmt_agent.service: No such file or directory
Executing install
JavaHome is not set aborting agent install
warning:%post(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
Action :
- Dans le fichier de réponses, définissez le paramètre
JAVA_HOME
en ajoutant les éléments suivants :export JAVA_HOME=path/to/jdk/directory
- Installez l'agent à l'aide de la commande suivante.
rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm
Dépannage : Impossible de voir l'espace de noms et les mesures Prometheus dans le service de surveillance OCI
Dans la console OCI, si les politiques requises sont configurées correctement et que l'espace de noms et les mesures Prometheus ne sont pas visibles à partir du service de surveillance OCI dans l'explorateur de mesures, vous devrez peut-être confirmer que l'utilisateur du système d'exploitation mgmt_agent dispose des autorisations de lecture pour le fichier .properties
.
.properties
. Ce fichier peut être détenu par un utilisateur du système d'exploitation racine disposant de 600 autorisations.
agent_inst/discovery/PrometheusEmitter/compute_exporter.properties
- Vérifiez que le fichier
.properties
dansagent_inst/discovery/PrometheusEmitter
appartient à l'utilisateur du système d'exploitation mgmt_agent et que l'utilisateur du système d'exploitation mgmt_agent dispose des autorisations de lecture sur ce fichier. - Redémarrez l'agent de gestion OCI.
Dépannage : Indicateur fourni mais non défini
Erreur : Si vous voyez l'erreur suivante : indicateur fourni mais non défini : -trusted-certs-dir
$ sudo -u oracle-cloud-agent /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent -cli -trusted-certs-dir=/tmp/trustedcerts
flag provided but not defined: -trusted-certs-dir
Usage of /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent:
-agent-config string
agent config yml file
-cli
run the monitoring in cli mode
-debug
enable debug logging
-dev
enable dev runs
-force-redeploy
force redeploy image
-metadata-config string
metadata config json file
-oci-config string
oci config file
-staging
enable staging endpoint
-upgrade-native-agent
invoke native agent upgrade
Dépannage : Échec de l'ajout des données d'identification SSH avec erreur : Caractère non guidé non autorisé
Cause possible : Lorsque vous ajoutez des données d'identification sources à un agent, si vous voyez l'erreur de caractère non cité non autorisé suivante, cela signifie que le fichier JSON n'est pas formaté correctement. Par exemple, si la clé SSH s'affiche en tant que lignes multiples, cela peut entraîner la non-reconnaissance de la clé SSH et cette erreur de caractère non cité non autorisée. Par exemple :
[root@host ociagent]# cat 2nd.json | sudo -u mgmt_agent
/opt/oracle/mgmt_agent/agent_inst/bin/credential_mgmt.sh -o upsertCredentials -s
logancom.fasterxml.jackson.databind.JsonMappingException: Illegal unquoted character ((CTRL-CHAR,
code 10)): has to be escaped using backslash to be included in string valueat [Source: (BufferedInputStream); line: 7, column: 70] (through reference chain:
oracle.polaris.core.source.metadata.impl.creds.CredentialFormat["properties"]->java.lang.Object[][1]->oracle.polaris.core.source.metadata.impl.creds.CredentialFormat$Property["value"])at
com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:402)at
com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:361)at
- Ajoutez un caractère spécial
\n
avant chaque ligne de la clé. Par exemple :{"source":"host.myvm.example.com", "name":"OSCreds", "type":"SSHKeyCreds", "description":"SSH keys for a user", "properties":[ {"name":"SSHUserName","value":"username"}, {"name":"SSHPrivateKey","value":"-----BEGIN RSA PRIVATE KEY-----\n<private-key-value> \n-----END RSA PRIVATE KEY-----"}, {"name":"SSHPublicKey","value":"-----BEGIN PUBLIC KEY-----\n<public-key-value> \n<public-key-value> \n-----END PUBLIC KEY-----"]}
- Ou ajoutez la valeur de clé complète dans une seule ligne.
Maintenant, le format JSON est correct et vous pouvez réessayer l'opération pour ajouter les données d'identification sources.
Cause possible : Si l'erreur suivante s'affiche lors de l'installation de l'agent, vous pouvez avoir un composant de réseau qui injecte ses propres certificats. Ou si vous rencontrez l'erreur lors de l'installation de l'agent et s'il se connecte au moyen d'un mandataire, il se peut que votre mandataire injecte un certificat personnalisé. Vous devrez consulter votre administrateur pour obtenir le certificat personnalisé, puis suivez les étapes ci-dessous.
PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException
Solution : Pour résoudre ces deux problèmes, vous pouvez effectuer les étapes suivantes :
- Fournissez des certificats personnalisés lors de l'installation de l'agent, voir Importer des certificats ou Mettre à jour les certificats.
- Dans le fichier de clés de réponse, ajoutez le paramètre
importTrustedCertsDirectory
, y compris le chemin. Pour plus d'informations, voir l'exemple suivant et voir Configurer un fichier de réponses.
importTrustedCertsDirectory=/tmp/crt
Dépannage : Impossible d'installer l'agent de gestion Oracle sur l'instance Windows
Lors de l'installation de l'agent sur un hôte Windows, si le JDK pris en charge n'existe pas et qu'il existe un JDK utilisant une version Java différente, par exemple 1.8.0_51
, l'installation de l'agent de gestion échoue sur le même hôte avec l'erreur suivante :
C:\Users\abc\Downloads\Latest-agent> .\installer.bat
C:\Users\abc\Downloads\Latest-agent\Windows-input.rsp
64 bit Windows OS found.
Checking pre-requisites
Checking if previous agent service exists
Checking if C:\Oracle\mgmt_agent\agent_inst directory exists
Checking Java version
"Agent only supports 64 bit and 32 bit JDK 8 (with a minimum upgrade version JDK 8u281).
Please set your preferred path in JAVA_HOME"
Solution : Pour corriger ce problème :
- Téléchargez le JDK dans un format d'archive compressé .zip.
- Extrayez le fichier JDK.zip dans un répertoire sur l'hôte Windows.
- Installez l'agent et indiquez JAVA_HOME qui pointe vers le répertoire.
Dépannage : Lorsque vous installez l'agent de gestion et que vous voyez les messages de temporisation de la connexion réseau
http://Example.example.com:4480->https://management-agent.us-ashburn-1.oci.oraclecloud.com:443 : Connection timed out Read failed)
Il est alors probable que l'agent de gestion ne puisse pas accéder aux services Oracle Cloud Infrastructure. Solution :
Vérifiez vos règles de configuration de réseau et vérifiez que l'agent de gestion peut se connecter aux services OCI à partir de la machine virtuelle sur laquelle l'agent de gestion est installé. Si vous disposez d'un pare-feu ou d'une configuration NAT, vérifiez qu'il autorise la communication sortante sur les adresses IP recommandées par OCI. Pour plus d'informations, voir Intervalles d'adresses IP pour les services déployés dans Oracle Cloud Infrastructure.
Dépannage : CloudRegistrationStep : Échec de la tentative d'enregistrement avec le statut HTTP 401 (les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes)
Cause : Ce problème peut survenir en raison d'une clé de réponse non valide ou incorrecte.
Action : Assurez-vous d'avoir une clé valide. Pour plus de détails, voir Gérer les clés d'installation.
Dépannage : "code" : "NotAuthenticated","message" : "Les informations requises pour terminer l'authentification n'ont pas été fournies ou étaient incorrectes.
Cause : Ce problème peut survenir en raison d'une clé de réponse expirée.
Action : Assurez-vous d'avoir une clé valide. Pour plus de détails, voir Gérer les clés d'installation.
Résoudre les problèmes de désinstallation des agents de gestion
Cette rubrique présente les problèmes communs liés à la désinstallation des agents de gestion Oracle et leurs solutions.
Erreur :... désigne plusieurs ensembles
Cause : Le registre RPM contient plusieurs ensembles portant ce nom.
--allmatches
lors de l'exécution de la commande rpm -e
:
rpm -e oracle.mgmt_agent --allmatches
Erreur : échec du scriptlet... avec un code de sortie
Cause : Le script RPM n'a pas pu arrêter l'agent en cours d'exécution ou n'a pas pu supprimer le fichier de service de l'agent du système.
- Vérifiez si votre agent est en cours d'exécution :
Pour OL7 :
systemctl status mgmt_agent
Pour OL6 :
Si l'agent est en cours d'exécution, arrêtez-le :/sbin/initctl status mgmt_agent
Pour OL7 :
systemctl stop mgmt_agent
Pour OL6 :
/sbin/initctl stop mgmt_agent
- Supprimez le RPM en exécutant
rpm -e oracle.mgmt_agent --noscripts
. Cette commande ignore tous les scripts RPM et tente de supprimer l'ensemble de son registre. - Supprimez tous les fichiers d'agent en exécutant
rm -rf /opt/oracle/mgmt_agent
. Exécutez également les commandes suivantes :Pour OL7 :
rm -rf /etc/systemd/system/mgmt_agent.service
Pour OL6 :
rm -rf /etc/init/mgmt_agent.conf
Dépanner les problèmes de mise à niveau de l'agent de gestion
Lorsque vous mettez à niveau Oracle Management Agent, vous pouvez utiliser la liste suivante pour résoudre les erreurs courantes.
Dépannage : La mise à niveau automatique est activée, mais l'agent ne procède pas à la mise à niveau automatiquement en raison d'un responsable de fichier non valide
Cause : Vous pouvez configurer les agents de gestion pour qu'ils effectuent une mise à niveau automatique. L'option de mise à niveau automatique est disponible au niveau de la location. Par conséquent, si vous sélectionnez l'option de mise à niveau automatique dans la console Oracle Cloud, tous les agents de votre location OCI seront mis à niveau automatiquement. La mise à niveau automatique de l'agent peut prendre jusqu'à 24 heures après la disponibilité d'une nouvelle version de l'agent dans le service Cloud Service de l'agent de gestion.Si la version de l'agent n'est pas mise à jour après 24 heures d'attente, certains problèmes sur le disque peuvent empêcher la mise à niveau automatique de l'agent.
La cause la plus fréquente de cette erreur est que les fichiers appartiennent à un utilisateur du système d'exploitation différent de l'utilisateur qui a installé l'agent de gestion. Le processus de mise à niveau s'exécute avec le même utilisateur de système d'exploitation que le processus en cours d'exécution et n'a pas la possibilité de passer à la racine. Tout fichier du répertoire mgmt_agent
créé manuellement par l'utilisateur peut interférer avec la capacité de l'agent à effectuer une mise à niveau automatique.
mgmt_agent.log
aux emplacements suivants :
- Pour l'agent de gestion autonome :
/opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
- Pour le plugiciel d'agent de gestion dans Oracle Cloud Agent (OCA) sur les instances de calcul OCI :
/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log
Dans le fichier
mgmt_agent.log
, vous pouvez voir l'erreur suivante indiquant les fichiers problématiques :2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.oldbackup] 2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] WARN - Files with invalid owners were found, skippingauto-upgrade
- L'utilisateur doit remplacer la propriété et le groupe des fichiers concernés par le compte d'utilisateur qui a initialement installé l'agent de gestion.
- Si un fichier a été créé avec un responsable incorrect, vous pouvez le supprimer ou le déplacer vers un autre répertoire en dehors du répertoire de l'agent de gestion. Selon votre installation, vous pouvez trouver le répertoire de l'agent de gestion à l'un des emplacements suivants :
- Pour l'agent de gestion autonome :
/opt/oracle/mgmt_agent/
- Pour le plugiciel d'agent de gestion pour un agent Oracle Cloud dans une instance de calcul OCI :
/var/lib/oracle-cloud-agent
Note
Pour éviter ces problèmes, ne créez pas manuellement de fichiers dans le répertoire de l'agent de gestion. - Pour l'agent de gestion autonome :
Dépanner les agents de gestion sur les instances de calcul
Les utilisateurs peuvent rencontrer diverses erreurs lors du déploiement d'Oracle Management Agent sur les instances de calcul. Les causes de certaines erreurs communes et les actions recommandées sont listées ci-dessous.
- Dépannage : L'agent a l'état Non disponible
- Dépannage : Échec de la configuration de l'agent de gestion avec fork/exec oracle.polaris.oca.main : autorisation refusée
- Dépannage : Échec de l'authentification de l'agent de gestion en raison d'une variation d'horloge, heure différente sur l'instance de calcul par rapport à l'heure sur le serveur
- Dépannage : Service d'agent de gestion OCI : Agent non visible dans la console OCI sous Observabilité et gestion
Dépannage : L'agent a l'état Non disponible et les rapports sur les fichiers journaux de l'agent "Marqueurs non valides"
La page Agents de gestion affiche l'agent dans l'état Non disponible et le fichier mgmt_agent.log
(situé sous le répertoire <Agent_Inst>/logs
) indique le message suivant :
ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s). Ajoutez une valeur à chacune des définitions de marqueur suivantes : \nGLOBAL.ComponentType, GLOBAL.ApplicationName,
Cause :
Ce problème peut se produire lorsque le compartiment requiert des marqueurs obligatoires pour chaque ressource et que la demande de création de ressource n'inclut pas les marqueurs, la demande d'activation échouera avec le message :"Marqueurs non valides : la création de ressource a échoué, car la ressource requiert des valeurs de marqueur)" et le statut de l'agent est 'Non disponible'.
Action :
- Agents de gestion
Si vous disposez d'un agent de gestion autonome, celui-ci doit être désinstallé.
Si l'agent de gestion a été installé à l'aide d'un RPM ou d'un fichier ZIP, il doit être désinstallé et réinstallé en fournissant un fichier de réponse à l'aide du paramètre
DefinedTags
, comme décrit dans la section Vérifier les paramètres de l'agent. - Agents de gestion sur les instances de calculSi l'agent de gestion est activé au moyen de la console OCI à l'aide du plugiciel OCA, il n'y a aucun fichier de réponse car il n'est pas utilisé pour les instances de calcul. Dans ce cas, procédez de la façon suivante :
- Connectez-vous à l'instance où l'agent de gestion est déployé et sudo en tant qu'utilisateur
oracle-cloud-agent
à l'aide de la commande suivante :sudo -u oracle-cloud-agent sh
- Créez un fichier
agent.definedtags
à l'emplacement suivant :/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/
- Ajoutez les marqueurs définis nécessaires pour la ressource à créer dans le fichier
agent.definedtags
.Par exemple, s'il existe 2 espaces de noms
admin_namespace
etfinance_namespace
et chaque espace de noms utilise 2 clés et 2 valeursenvironment_type=non-prod
,sensitivity=restricted
, vous pouvez utiliser les éléments suivants :DefinedTags = [{"admin_namespace": {"environment_type": "non-prod", "sensitivity": "restricted"}, "finance_namespace": {"environment_type": "non-prod","sensitivity": "restricted"}}]
- Redémarrez oracle-cloud-agent à l'aide de la commande :
sudo systemctl restart oracle-cloud-agent
- Connectez-vous à l'instance où l'agent de gestion est déployé et sudo en tant qu'utilisateur
Dépannage : Échec de la configuration de l'agent de gestion avec fork/exec oracle.polaris.oca.main : autorisation refusée
Les utilisateurs peuvent rencontrer cette erreur, ce qui entraîne l'échec de l'installation ou du démarrage de l'agent de gestion.
Le message d'erreur affiché dans la vue Plugiciel de l'instance de calcul pour le plugiciel d'agent de gestion ressemble à ce qui suit :
workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
Cause possible :
Ce problème peut se produire lorsqu'une instance de calcul interdit les opérations fork/execute à partir du répertoire /tmp
en montant tmpfs
avec l'indicateur noexec
.
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)
La sortie doit indiquer does have the noexec flag (Indicateur noexec).
Action :
- Arrêtez Oracle Cloud Agent.
sudo systemctl stop oracle-cloud-agent
- Ajoutez le paramètre suivant au fichier : /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
overrideTmpDir: true
- Démarrez Oracle Cloud Agent.
$ sudo systemctl start oracle-cloud-agent
Dépannage : Échec de l'authentification de l'agent de gestion en raison d'une variation d'horloge, heure différente sur l'instance de calcul par rapport à l'heure sur le serveur
Cause : S'il y a un décalage d'horloge de plus de 5 minutes entre l'instance de calcul où l'agent est exécuté et le service d'identité pour Oracle Cloud Infrastructure, les demandes seront rejetées avec un protocole HTTP 401.
Si vous trouvez les erreurs suivantes :Dans l'instance de calcul OCI, allez à l'onglet Oracle Cloud Agent, l'agent de gestion affiche une erreur dans la colonne Message :
rpc error: code = Unavailable desc = connection error: desc = "transport: error while
dialing: dial unix /var/lib/oracle-cloud-agent/tmp/plugin1825606937: connect: connection
refused"
Ou dans les journaux, vous pouvez trouver l'erreur suivante :
2022-12-09 07:41:22,144 [SysExecutor.0 (Resource Principal Token Refresher)-47] WARN - #-# invocation access log [request-id-prefix: K9YBE4AY] #-#
Service: OCI
Method: GET
Path: /20200202/managementAgents/ocid1.managementagent.....rvf6i3ba/resourcePrincipalToken
Headers:opc-rpt-request-token=********************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************
date=Fri, 09 Dec 2022 07:41:19 GMT
host=management-agent.ap-tokyo-1.oci.oraclecloud.com
Authorization=******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************
opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO
User-Agent=Jersey/2.34 (Apache HttpClient 4.5.13)Attempts:
<--> Endpoint: management-agent.ap-tokyo-1.oci.oraclecloud.com
opc-request-id: K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO
StartTime: 2022-12-09 07:41:19,976 GMT
Status: 401 Unauthorized
Headers: X-Content-Type-Options=nosniff
Content-Length=187
opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO/E4356B68C6C541BAD867E46760316D35/4118B130EE46A8E25F90DC91AB7F12D7
Date=Fri, 09 Dec 2022 07:41:21 GMT
Content-Type=application/json
ErrorBody:
{
"code" : "NotAuthenticated",
"message" : "Unable to authenticate the request for ocid1.managementagent.oc1.ap-tokyo-1.amaaaa...6frjnrbvqrvf6i3ba"}
Action
Corrigez le décalage d'horloge et redémarrez. Si l'agent est arrêté depuis des jours en raison de cette erreur, vous devez nettoyer le fichier donotrestart
avant de redémarrer l'agent.
En outre, Oracle recommande de configurer la date et l'heure du système d'exploitation pour la synchronisation automatique avec les serveurs NTP afin d'éviter les temps d'arrêt futurs. Si des services supplémentaires s'exécutent sur l'ordinateur, il est recommandé de redémarrer l'ordinateur après la modification de l'heure afin que les services puissent être réinitialisés avec la nouvelle heure.
Pour corriger la date et l'heure du système d'exploitation où l'agent est en cours d'exécution, puis redémarrer l'agent, vous pouvez suivre les étapes suivantes :
- Pour arrêter l'agent, exécutez la commande suivante :
sudo systemctl stop oracle-cloud-agent
- Corrigez la date et l'heure.
- Exécutez la commande suivante pour supprimer le fichier
configure.donotrestart
.sudo rm /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/configure.donotrestart
- Démarrer l'agent.
sudo systemctl start oracle-cloud-agent
Dépannage : Service d'agent de gestion OCI : Agent non visible dans la console OCI sous Observabilité et gestion
L'agent de gestion OCI a été installé sur une instance de calcul. L'agent s'exécute sur l'hôte. Toutefois, l'agent n'apparaît pas dans la console Oracle Cloud si vous accédez au menu de navigation, sélectionnez Observabilité et gestion, allez à Agents de gestion, puis sélectionnez Agents.
Cause possible : Les compartiments de l'instance de calcul et de la clé d'installation de l'agent sont différents.
- Arrêtez et désinstallez l'agent de gestion sur l'instance de calcul.
- Créer une clé d'installation d'agent dans le même compartiment que l'instance de calcul.
- Utilisez cette nouvelle clé d'installation que vous venez de créer et installez l'agent de gestion.
Dépanner les passerelles de gestion
Cette rubrique présente les problèmes et solutions courants liés aux passerelles de gestion.
- Dépannage : Supprimer la passerelle de gestion
- Dépannage : Configurer la passerelle de gestion
- Dépannage : Échec de l'installation de la passerelle de gestion sur Red Hat Enterprise Linux 9.x
- Dépannage : Échec de l'installation de la passerelle de gestion avec l'erreur : Les certificats n'ont pas pu être créés et le rapport sur les journaux d'identité : Échec de l'authentification : DATE_OUTSIDE_CLOCK_SKEW
- Dépannage : Lors de l'installation ou de la configuration de la passerelle de gestion, erreur de temporisation
Dépannage : Supprimer la passerelle de gestion
Cause : Dans certains cas, il peut être nécessaire de supprimer une installation existante de la passerelle de gestion, afin de la réinstaller.
-
Vérifiez si la passerelle est en cours d'exécution :
Pour OL7 :
systemctl status mgmt_gateway
Pour OL6 :
/sbin/initctl status mgmt_gateway
Si la passerelle est en cours d'exécution, arrêtez-la :
Pour OL7 :
systemctl stop mgmt_gateway
Pour OL6 :
/sbin/initctl stop mgmt_gateway
-
Supprimez le RPM de la passerelle installée à l'aide de la commande suivante :
rpm -e oracle.mgmt_gateway --noscripts
-
Supprimez tous les fichiers de passerelle restants à l'aide de la commande suivante :
rm -rf /opt/oracle/mgmt_agent
-
Exécutez la commande suivante :
Pour OL7 :
rm -rf /etc/systemd/system/mgmt_gateway.service
Pour OL6 :
rm -rf /etc/init/mgmt_agent.conf
Dépannage : Configurer la passerelle de gestion
Cause : Dans certains cas, le nom d'hôte peut ne pas être résolu dans l'environnement d'installation, ce qui peut entraîner l'échec de l'installation avec le message d'erreur suivant :
Dépannage : "Impossible de résoudre le nom d'hôte <hostname value> dans l'environnement d'installation. Résolvez le nom d'hôte ou indiquez GatewayCertCommonName dans le fichier de réponses et réexécutez le script de configuration de la passerelle."
Action :
- Vérifiez et résolvez le nom d'hôte de l'environnement pour obtenir la valeur complète du nom doamin (FQDN) après avoir exécuté la commande :
hostname -f
- Facultativement, un utilisateur peut fournir un nom de domaine complet personnalisé pour la configuration de la passerelle en prédéfinissant la propriété
GatewayCertCommonName
dans le fichier de réponse d'entrée. Voir Parmaters de fichier de réponse - Réexécutez le script de configuration de passerelle.
sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Cause : Dans certains cas, l'installation de la passerelle de gestion peut échouer avec le message d'erreur suivant en raison de l'absence de politiques dans OCI ou de problèmes de limite de ressources dans la location. Si vous voyez l'erreur suivante, suivez les étapes ci-dessous.
Dépannage : "Échec du démarrage de la passerelle de gestion, car les certificats n'ont pas pu être créés, initialisés ou extraits dans OCI. Pour plus de détails, vérifiez les journaux."
Action :
- Ouvrez le fichier journal dans le répertoire d'installation de la passerelle de gestion, par exemple :
/opt/oracle/mgmt_agent/plugins/GatewayProxy/statedir/log/mgmt_gateway.log
- Si le fichier journal contient l'un des codes d'erreur 404 suivants, sélectionnez l'une des options suivantes pour résoudre le problème :
2023-07-25 15:38:06.694/CEST [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String { "code" : "NotAuthorizedOrNotFound", "message" : "Authorization failed or requested resource not found."} 2023-07-25 15:38:06.696/CEST [pool-3-thread-1] ERROR com.oracle.mgmtagent.proxy.ProxyServer - Error while initializing and loading certificate bundlescom.oracle.mgmtagent.proxy.exception.CertificateFailureException: The response status is 404 after multiple retries at com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility.executeRequest(CertificateUtility.java:293) ~
- Option recommandée : Utilisez l'application Marketplace à démarrage rapide de la passerelle de gestion pour créer automatiquement les groupes dynamiques, les politiques et gérer les certificats requis pour installer la passerelle de gestion.
- Ajoutez et confirmez manuellement les groupes dynamiques et les politiques appropriés requis pour installer la passerelle de gestion sont ajoutés au compartiment spécifique de la location où vous voulez installer la passerelle de gestion. Pour plus d'informations, voir Exécuter les préalables au déploiement de la passerelle de gestion.
- Si le fichier journal contient l'un des 400 codes d'erreur suivants, vérifiez les options suivantes pour résoudre le problème :
2023-09-20 18:51:32.772/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateCreationUtil - Create Vault Service Url invoked https://kms.us-ashburn-1.oraclecloud.com/20180608/vaults 2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Received response code 400 2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Header name opc-request-id , value /5704D03441842D3818B824B2D6B2712E/1D1FED893474FDA900188E24F3DEE59B 2023-09-20 18:51:33.401/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String { "code" : "LimitExceeded", "message" : "The limit for this tenancy has been exceeded."}
- Vérifiez la limite du nombre de chambres fortes par défaut pour le service de gestion des clés dans la console OCI. Vous pouvez lancer une demande pour augmenter les limites de ressources. Pour plus d'informations, voir Gestion des clés et Gestion des chambres fortes.
- Vous pouvez configurer les certificats manuellement. Pour plus de détails, voir Exécuter les préalables au déploiement de la passerelle de gestion et aller à la section Gestion manuelle des certificats.
Note
Lorsque vous créez les certificats Émis par une autorité de certification interne, le profil de certificat doit être Serveur TLS ou Client TLS et seuls les algorithmes de signature RSA sont pris en charge.
- S'il y a d'autres échecs liés à la chambre forte ou à l'API du service de clé dans les journaux, vous pouvez lancer une demande et communiquer avec l'équipe
oci_kms
en fournissant le corps de la réponse etopc-request-id
. - S'il y a d'autres échecs liés aux autorités de certification ou aux API du service de certificats dans les journaux, soumettez une demande et communiquez avec l'équipe
oci_certificates
en fournissant le corps de la réponse etopc-request-id
.
Dépannage : Échec de l'installation de la passerelle de gestion sur Red Hat Enterprise Linux 9.x
L'installation de la passerelle de gestion échoue et le message d'erreur suivant peut s'afficher :mgmt_gateway service creation failed. Reason: Detected Linux
.
En outre, les messages du journal des échecs d'installation peuvent confirmer l'erreur et indiquer que les tentatives de configuration utilisent un gestionnaire de services incorrect pour installer la passerelle.
Cause : Red Hat a supprimé l'ensemble chkconfig
dans la distribution Red Hat Enterprise Linux (RHEL) 9, pour plus de détails, voir la base de connaissances Red Hat.
Action :
- Vérifiez que l'environnement utilise Red Hat Enterprise Linux 9.x en exécutant la commande suivante :
$ cat /etc/redhat-release Red Hat Enterprise Linux release 9.3 (Plow)
- Les messages ci-dessous mettent en évidence le problème selon lequel le système d'exploitation/famille n'a pas été identifié correctement à l'aide des règles présentes dans le script agentcore. L'installation tentera de configurer le service d'agent à l'aide de
init.d
et non desystemctl
dans RHEL 9x.$ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm Verifying... ################################# [100%] Preparing... ################################# [100%] Checking pre-requisites Checking if any previous gateway service exists Checking if OS has systemd or initd Checking available disk space for gateway install Checking if /opt/oracle/mgmt_agent directory exists Checking if 'mgmt_agent' user exists 'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one. Checking Java version Trying /omc/java/jdk1.8.0_391 Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java Checking agent version Updating / installing... 1:oracle.mgmt_gateway-231118.1208.1################################# [100%] Executing install Unpacking software zip Copying files to destination dir (/opt/oracle/mgmt_agent) Initializing software from template Checking if JavaScript engine is available to use Creating 'mgmt_gateway' daemon mgmt_gateway service creation failed. Reason: Detected Linux: Installing the mgmt_gateway daemon... ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory Service not installed. warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
- Vérifiez que l'ensemble
chkconfig
est manquant, comme décrit dans l'article suivant de la base de connaissances Red Hat.
chkconfig
- Installez le paquet manquant en exécutant la commande suivante :
$ dnf install chkconfig
- Vérifiez que le package existe dans l'environnement en exécutant la commande suivante :
$ rpm -qa | grep chkconfig
- Réinstallez la passerelle de gestion.
chkconfig
Il s'agit d'une solution de rechange. Utilisez cette solution uniquement si l'ensemble
chkconfig
ne peut pas être installé. La solution recommandée consiste à installer l'ensemble chkconfig
.
Si l'installation de l'ensemble chkconfig
n'est pas une option décrite dans la section Solution 1 ci-dessus, effectuez les étapes suivantes en tant que solution alternative pour installer le logiciel de la passerelle de gestion.
- Passez à un shell racine.
- Définissez la variable d'environnement
DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
. - Installez le logiciel de la passerelle de gestion.
$ sudo /bin/bash
$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
# RPM install
$ rpm -ivh <rpm_file_name.rpm>
# ZIP install
$ ./installer.sh <full_path_of_response_file>
Dépannage : Échec de l'installation de la passerelle de gestion avec erreur : Les certificats n'ont pas pu être créés et le rapport sur les journaux d'identité : Échec de l'authentification : DATE_OUTSIDE_CLOCK_SKEW
Cause :
Échec de l'authentification du rapport sur les journaux d'identité : DATE_OUTSIDE_CLOCK_SKEW
# /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<PATH>/gateway_agent.rsp/opt/oracle/mgmt_agent/agent_inst/bin/setupAgent.sh
opts=<PATH>/gateway_agent.rsp
Executing configure
Parsing input response file
Validating install key
Generating communication wallet
Generating security artifactsRegistering Management Gateway
Found service plugin(s):[GatewayProxy]
Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...Done.
GatewayProxy : Successfully deployed external plugin
Gateway setup completed and the gateway is running.
In the future gateway can be started by directly running: sudo systemctl start mgmt_gateway
Please make sure that you delete <PATH>/gateway_agent.rsp or store it in secure location.
Creating gateway system properties file
Creating properties fileCreating or validating certificates
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Failed to start Management Gateway as certificates could not be created, initialized or retrieved in OCI. Please check the logs for more details.
Management Gateway stopped
Action :
Sur l'hôte où la passerelle de gestion est installée, assurez-vous que l'heure de l'hôte est correcte, puis installez la passerelle de gestion.
Dépannage : Lors de l'installation ou de la configuration de la passerelle de gestion, erreur de temporisation
Si vous vérifiez que la console OCI affiche la passerelle de gestion comme active, mais que les mesures ne sont pas alimentées.
/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...............Timed out.
Agent is unable to check if it deployed requested service plugin(s) successfully or not.
Please check back later on the console.
Cause : Un délai plus long que prévu pour terminer la tâche de configuration de la passerelle de gestion peut entraîner un problème de communication réseau et entraîner une temporisation de la passerelle de gestion.
- Vérifiez qu'il n'y a aucun problème de communication réseau.
- Vérifiez si les détails de mandataire suivants ont été mis à jour dans le fichier de réponses pour déterminer s'il existe un problème de mandataire. Par exemple, vérifiez que les détails corrects de l'hôte mandataire et du port ont été mis à jour dans le fichier de réponses :
ProxyHost = my.proxyhost.com
ProxyPort = 80
- Arrêtez la passerelle de gestion à l'aide de la commande suivante :
systemctl stop mgmt_gateway
- Réexécutez la configuration de la passerelle de gestion à l'aide de la commande suivante :
/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
- La configuration de la passerelle de gestion doit maintenant être terminée et les mesures doivent être alimentées.
Collecter les journaux de l'agent de gestion
Si vous devez soumettre une demande de soutien pour faire appel à Oracle Support, il est utile de recueillir les journaux de l'agent de gestion et de les joindre au ticket de soutien. L'emplacement du journal dépend de la façon dont l'agent de gestion est installé et activé.
Rechercher l'emplacement du journal
Vous pouvez .zip
ou .tar
manuellement tous les fichiers journaux à l'un des emplacements suivants :
- Si vous avez activé le plugiciel d'agent de gestion à l'aide d'Oracle Cloud Agent (OCA), vous pouvez trouver les journaux à cet emplacement :
/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log
- Si vous avez installé l'agent de gestion à l'aide d'un graphique d'aide
.rpm, zip,
ou d'une image de conteneur, l'emplacement de journal par défaut est :/opt/oracle/mgmt_agent/agent_inst/log
Si vous avez installé l'agent sous Windows, les emplacements de journal dépendent de l'endroit où les agents sont installés. Les emplacements de journal se trouvent généralement dans le répertoire d'installation à l'emplacement suivant :
agent_inst/log
Créer un ensemble de diagnostics
Vous pouvez .zip
ou .tar
manuellement tous les fichiers journaux aux emplacements mentionnés ci-dessus ou générer un ensemble de diagnostics.
L'agent doit être en cours d'exécution et sain pour générer l'ensemble de diagnostics. Si la génération de l'archive de diagnostic échoue, .zip
ou .tar
manuellement tous les fichiers journaux mentionnés ci-dessus.
Vous devez créer ces archives
.zip
ou .tar
en tant qu'utilisateur du système d'exploitation de l'agent de gestion dans /tmp
ou un autre répertoire en dehors du répertoire d'installation de l'agent.
Pour générer un ensemble de diagnostics :
- Pour un plugiciel d'agent de gestion utilisant Oracle Cloud Agent (OCA), utilisez la commande suivante :
$ sudo -u oracle-cloud-agent /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/bin/generateDiagnosticBundle.sh
- Pour un agent de gestion installé à l'aide d'une image téléchargée, telle qu'un graphique .
rpm, .zip,
d'aide ou à partir d'une image de conteneur, vous pouvez utiliser la commande suivante :$ sudo -u mgmt_agent /opt/oracle/mgmt_agent/agent_inst/bin/generateDiagnosticBundle.sh