Risoluzione dei problemi relativi al servizio dei Management Agent

In questa sezione vengono descritti alcuni problemi e risoluzioni tipici correlati al servizio Management Agent, ad esempio l'installazione e la disinstallazione con i Management Agent e i Management Gateway.

argomenti:

Risolvere i problemi di installazione e configurazione dei Management Agent

Gli utenti possono riscontrare vari errori durante il processo di installazione e configurazione di Oracle Management Agent. Di seguito sono elencate le cause e le azioni consigliate per alcuni errori comuni.

Risoluzione dei problemi: disinstallare l'agente e rimuovere il file del servizio prima di installare il nuovo agente.

Causa: sull'host è già installato un agente. Un processo di disinstallazione precedente non ha rimosso correttamente il file del servizio agente.

Azione:
  • Eseguire rpm -e oracle.mgmt_agent per disinstallare l'agente. Se il comando riesce, provare a installare il nuovo agente. Se il comando non funziona, provare l'azione consigliata successiva.
  • Eseguire ls /opt/oracle/mgmt_agent per verificare se sono presenti residui dell'installazione dell'agente precedente. Se lo si trova, eliminarlo eseguendo: rm -rf /opt/oracle/mgmt_agent.
  • Verificare se il file del servizio agente è già disponibile nella posizione seguente, a seconda della versione di Linux in uso:
    • Per OL7 (se si utilizza systemd): /etc/systemd/system/mgmt_agent.service
    • Per OL6 (se si utilizza init): /etc/init/mgmt_agent.conf.

      Se si dispone di questo file di servizio, rimuoverlo eseguendo: rm -rf /etc/init/mgmt_agent.conf e riprovare a installare il nuovo agente.

Risoluzione dei problemi: Java non è una JVM a 64 bit. Impostare il percorso di una JVM a 64 bit nella variabile di ambiente JAVA_HOME oppure Java non trovato. Impostare il percorso preferito in JAVA_HOME.

Causa: la variabile di ambiente JAVA_HOME non è impostata oppure non punta a una posizione JDK a 64 bit.

Azione: impostare la variabile di ambiente JAVA_HOME sulla versione JDK corretta e riprovare a installare l'agente. Attualmente è supportato solo il JDK a 64 bit.

Risoluzione dei problemi: installazione dell'agente non riuscita con messaggio: useradd: impossibile ottenere un GID univoco (nessun altro GID disponibile)

Causa: lo script di installazione non può aggiungere un utente e un gruppo durante il processo di installazione del Management Agent poiché gli ID gruppo disponibili nel sistema Linux sono già in uso.

Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent) 
useradd: Can't get unique GID (no more available GIDs) 
useradd: can't create group 
Agent installation failed, please check log file

Azione: rivolgersi all'amministratore di sistema prima di procedere con quanto riportato di seguito.

  1. Modificare il file /etc/login.defs. Per modificare il file sono necessari i privilegi sudo.

    Cercare le voci riportate di seguito.
    SYS_GID_MIN               nnnn
    SYS_GID_MAX               mmmm
    SYS_UID_MIN               pppp
    SYS_UID_MAX               qqqq
    Dove nnnn e pppp sono il valore minimo e mmmm e qqqq sono il valore massimo.

    Se le voci precedenti non esistono nel file, aggiungerle.

  2. Aggiornare il valore della voce SYS_GID_MAX in base a quanto consigliato dall'amministratore del sistema e salvare il file.

  3. Rimuovere l'installazione dell'agente non riuscita eseguendo: sudo rpm -e oracle.mgmt_agent.

  4. Logout della shell seguito dal login.

  5. Riprovare l'installazione dell'agente.

Risoluzione dei problemi: useradd: impossibile creare la directory /usr/share/mgmt_agent

Durante l'installazione di Management Agent, l'utente mgmt_agent viene creato con la posizione della directory home predefinita in /usr/share/mgmt_agent.

Causa: non sono disponibili autorizzazioni file sufficienti in /usr/share oppure il file system è di sola lettura.

Azioni possibili:

  • Impostare le autorizzazioni per concedere all'utente mgmt_agent l'accesso alla posizione della directory home utente predefinita: /usr/share.

  • Impostare una directory home diversa utilizzando la variabile di ambiente USER_HOME_DIR_ROOT se si desidera utilizzare una posizione diversa.

    Impostare la variabile di ambiente USER_HOME_DIR_ROOT con il percorso che si preferisce utilizzare come directory home per l'utente mgmt_agent e assicurarsi che l'utente del Management Agent disponga delle autorizzazioni file corrette per tale directory preferita.

Risoluzione dei problemi: Windows: impossibile trovare il percorso specificato. Installazione dell'agente non riuscita.

LIVELLO DI ERRORE=9009

Possibile causa: le variabili di ambiente non sono state impostate correttamente a causa degli spazi nel nome della directory o della cartella.

Gli ambienti Windows consentono di utilizzare spazi all'interno di un nome directory/cartella che causa un problema con l'installazione di Management Agent poiché le virgolette vengono aggiunte automaticamente al nome da Windows. Ad esempio, esiste una directory/cartella denominata: Program Files. In questo caso Windows inserisce automaticamente le virgolette poiché c'è uno spazio all'interno del nome della cartella e ora dirà: "Program Files".

Le virgolette aggiuntive possono causare un problema poiché il programma di installazione di Management Agent non consente virgolette per le variabili di ambiente, ad esempio JAVA_HOME e AGENT_INSTALL_BASEDIR.

Nota

Il programma di installazione di Management Agent non accetta i seguenti caratteri speciali nel percorso: [, ^^, ", ', & o ].

Azione:

Il metodo consigliato per impostare le variabili di ambiente in Windows è l'uso di Impostazioni di sistema avanzate.
  • Nella barra delle applicazioni di Windows, fare clic con il pulsante destro del mouse sull'icona Windows e selezionare Sistema.
  • Nella finestra Impostazioni, in Impostazioni correlate, fare clic su Impostazioni di sistema avanzate.

    Impostazioni avanzate di Windows

  • Nella scheda Avanzate fare clic su Variabili di ambiente.

    Variabili d'ambiente di Windows

  • Per creare una nuova variabile di ambiente, fare clic suNuovo. Fare clic su Modifica per modificare una variabile di ambiente esistente.
  • Dopo aver creato o modificato la variabile di ambiente, fare clic su Applica, quindi su OK per rendere effettiva la modifica.
    Nota

    L'interfaccia utente grafica per la creazione delle variabili di ambiente può variare leggermente, a seconda della versione di Windows in uso.

Risoluzione dei problemi: lo stato del Management Agent è "Non disponibile" nella console dopo l'installazione iniziale

Possibile causa n. 1: indicatore orario di sistema errato

Azione: verificare l'ora di sistema dell'host dell'agente e, se necessario, correggere l'ora.

Possibile causa n. 2: se si utilizza il file di risposta input.rsp per il Management Agent, è necessario definire le tag per il compartimento Management Agent.

Se i tag non sono definiti, è possibile che venga visualizzato un errore simile al seguente:

Attempts:
<--> Endpoint:       management-agent.us-ashburn-1.oci.oraclecloud.com
     opc-request-id: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXJ8
     StartTime:      2024-09-18 03:45:12,662 GMT
     Status:         400 Bad Request
     Headers:        Strict-Transport-Security=max-age=31536000; includeSubDomains;
                     Connection=close
                     Content-Length=63
                     opc-request-id=XXXXXXXXXXXXXXXXXXXXXXXX..................B25ADA8E
                     Date=Wed, 18 Sep 2024 03:45:12 GMT
                     Content-Type=application/json
     ErrorBody:      
{
  "code" : "InvalidParameter",
  "message" : "Invalid tags"
}

Azione: per definire le tag specifiche per l'ambiente in uso, nel file di risposta input.rsp aggiungere i parametri riportati di seguito e specificare le coppie chiave-valore per l'ambiente in uso. Per ulteriori informazioni, vedere Creare un file di risposta.

DefinedTags = [{"namespace1":{"<key1>":"<value1>"}},
      {"namespace2":{"<key2>":"<value2>"}}]

Risoluzione dei problemi: dopo la configurazione, il Management Agent non è visibile nella console o tramite l'API

Possibile causa: se dopo aver configurato il Management Agent o l'agente gateway di gestione, l'agente non viene visualizzato nella console di Oracle Cloud o tramite l'API, i criteri corretti potrebbero non essere impostati per l'utente o il gruppo di utenti.

Azione: verificare che l'utente o il gruppo di utenti disponga dei criteri necessari configurati per il Management Agent o l'agente gateway. Per impostare i criteri, vedere Creare criteri per il gruppo di utenti.

Risoluzione dei problemi: le metriche Prometheus o Kubernetes monitorate mediante Management Agent non sono disponibili

Possibili cause: il Management Agent non richiede gruppi dinamici o criteri per le proprie metriche, ma lo fa per le metriche Prometheus e Kubernetes. L'utente deve definire un gruppo dinamico e un criterio che consenta agli agenti di tale gruppo dinamico di inviare le metriche al monitoraggio OCI. Se le metriche non vengono visualizzate nel compartimento o nello spazio di nomi di monitoraggio OCI, è possibile controllare i criteri e il gruppo dinamico.
  • a) politiche mancanti

    Azione: verificare che i criteri vengano aggiunti a Management Agent come descritto nelle istruzioni di impostazione. Per i dettagli, vedere Impostazione di Oracle Cloud Infrastructure for Management Agent Service.

    Se mancano i criteri, aggiungerli come descritto in Impostazione di Oracle Cloud Infrastructure for Management Agent Service.

  • b) Typos nelle politiche

    Azione: rivedere la sintassi dei criteri per individuare eventuali errori confrontandoli con gli esempi di criteri. Per i dettagli, vedere Impostazione di Oracle Cloud Infrastructure for Management Agent Service.

    Ad esempio, assicurarsi che la definizione del gruppo dinamico venga definita correttamente in base alla sintassi seguente con le virgolette singole corrette intorno all'ID compartimento e al tipo di risorsa managementagent:

    ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
  • (c) ID compartimento errato nella definizione del gruppo dinamico

    Azione: verificare che l'ID compartimento della chiave di installazione sia uguale all'ID compartimento specificato nella definizione del gruppo dinamico dell'agente. Per impostazione predefinita, l'agente viene creato nel compartimento della chiave di installazione.

Risoluzione dei problemi: l'agente viene eseguito in OutOfMemoryException

Possibile causa: l'agente potrebbe esaurire la memoria heap se non viene sottoposta a tuning in modo appropriato per supportare il carico a cui è stata assegnata.

Azione: aggiornare le impostazioni della memoria heap per il Management Agent.

La configurazione predefinita per l'heap massimo per l'agente è la seguente:
  • 128 MB per Management Agent come plugin OCA.
  • 512 MB per Management Agent standalone. (Quello scaricato dalla console di Management Agent).
L'utente può aggiornare e assegnare più heap all'agente effettuando le operazioni riportate di seguito.
  • Aprire il file: agent_inst/config/java.options.
  • Modificare il file sopra riportato. Aggiornare l'impostazione heap modificando la riga seguente: -Xmx512m

    Ad esempio: la riga precedente imposta l'heap massimo per l'agente su 512 MB.

    Per modificare l'heap a 800 MB, aggiornare la riga precedente in modo che sia: -Xmx800m

  • Salvare il file e riavviare l'agente per rendere effettive le modifiche.

Risoluzione dei problemi: il Management Agent OCI non si avvia su un host Windows

Possibile causa: se l'agente viene avviato e non riesce con il seguente errore, ciò potrebbe essere dovuto al fatto che l'aggiornamento automatico del Management Agent non è riuscito. Potrebbero essere visualizzati gli errori seguenti.

C:\Oracle\mgmt_agent\agent_inst\log>NET START mgmt_agent
The Oracle Management Agent service is starting...................
The Oracle Management Agent service could not be started.

A service specific error occurred: 1.

More help is available by typing NET HELPMSG 3547.

In questo file di log, C:\Oracle\mgmt_agent\agent_inst\log\mgmt_agent.log potrebbe essere visualizzato il seguente errore.

[SysExecutor.0 (PrometheusEmitter.Agent-discovery)-131] INFO - DiscoveryItemTask PrometheusEmitter.Agent-discovery - autoPromote
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Cleaning up old files...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - On windows, skipping file owner check
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Starting agent upgrade from version [231002.2039] to version [231002.2040]...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Inserted RequestSigner associated with request SigningRequester[get([])] for signingKey:SigningKey[xxxxxxxxxxxx]
[SysExecutor.1 (ManagedAgent upgradechecker)-133] INFO - Package Stream size:99003892
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully unzipped agent upgrade package at: 
C:\Oracle\mgmt_agent\zip\unpack
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully copied C:\Oracle\mgmt_agent\agent_inst\bin\agentUpgrader.bat to 
C:\Oracle\mgmt_agent\agent_inst\bin\tmpAgentUpgrader.bat
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully deleted previous wrapper backup file:
C:\Oracle\mgmt_agent\agent_inst\config\wrapper.conf.backedUpForUpgrade
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Backed up wrapper.conf to attempt agent upgrade
[SysExecutor.1 (ManagedAgentupgrade checker)-133] INFO - Built macros for processing wrapper.conf as:{%SERVICE_TYPE%=mgmt_agent,%JAVA_HOME%=c:\Program 
Files\Java\jre-1.8,%EMSTATE%=C:\Oracle\mgmt_agent\agent_inst, %CORE_JAR%=agent-upgrader-1.0.3235.jar,%VERSION%=231002.2039, 
%ORACLE_HOME%=C:\Oracle\mgmt_agent\231002.2039}
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Processed wrapper.conf.template to point it to agent upgrader
[SysExecutor.1(ManagedAgent upgrade checker)-133] INFO - Exiting for wrapper to spin up the agent upgrader...

Azione: per risolvere il problema, effettuare le operazioni riportate di seguito.

  1. Arrestare il Management Agent nell'host Windows, quindi immettere i comandi riportati di seguito.
    NET STOP mgmt_agent
    cd C:\Oracle\mgmt_agent\agent_inst\config
    Backup wrapper.conf
    Rename wrapper.conf.backedUpForUpgrade to wrapper.conf
  2. Avviare il servizio del Management Agent.
  3. Aggiornare Management Agent (vedere Aggiornamento manuale di Windows).

Dopo l'aggiornamento, l'agente viene visualizzato come Attivo in Observability & Management.

Risoluzione dei problemi: l'aggiornamento automatico del Management Agent non funziona o alcuni agenti sono stati saltati

Possibile causa: se l'upgrade automatico del Management Agent OCI non funziona per alcuni Management Agent, è possibile che l'upgrade automatico del Management Agent abbia smesso di funzionare perché alcuni file o directory erano di proprietà di proprietari non validi nel file system dell'agente.

Ad esempio, se alcuni file o directory della seguente posizione non disponevano delle autorizzazioni corrette, l'aggiornamento automatico dell'agente non funzionava: /opt/oracle/mgmt_agent/agent_inst.

In questo file di log è possibile che venga visualizzato il seguente errore: /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log

ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/db00_cred.json,
/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.backup]
(ManagedAgent upgrade checker)-32] WARN - Files with invalid owners were found, skipping auto-upgrade

Azione: nell'host del Management Agent, confermare nel file system dell'agente, tutti i file e le directory sono di proprietà del proprietario mgmt_agent e del gruppo mgmt_agent:mgmt_agent in modo che l'upgrade automatico del Management Agent possa essere completato.

Risoluzione dei problemi: l'indirizzo IP visualizzato nella colonna host quando Management Agent è installato nell'host Windows

Problema: il Management Agent viene installato su un host Windows e la console del Management Agent visualizza l'indirizzo IP dell'host Windows nella console di Oracle Cloud anziché visualizzare il nome di dominio completo o il nome host di Windows.

Azione:
  1. Eseguire il login all'host Windows e aprire il pannello di controllo.
  2. Selezionare Sistema e sicurezza, quindi selezionare Sistema.
  3. Passare alla sezione Impostazioni nome computer, dominio e gruppo di lavoro, quindi fare clic su Modifica impostazioni.

    Viene visualizzata la finestra Proprietà di sistema.

  4. Se non è selezionato, fare clic su Nome computer.
  5. Andare al seguente messaggio: Per rinominare il computer o il relativo dominio o gruppo di lavoro, fare clic su Modifica.
  6. Selezionare Modifica, quindi viene visualizzata la finestra Modifiche nome computer/dominio.

    Ad esempio, se il nome FQDN dell'host Windows è: FOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.com, immettere il nome host Windows breveFOOBAR004 nella casella di testo Nome computer.

  7. Selezionare Altro, vengono visualizzate la finestra Suffisso DNS e NetBIOS Nome computer.
  8. Nella casella di testo Suffisso DNS primario di questo computer, immettere il nome DNS dell'host Windows.

    Ad esempio: subnet1ab2regsu.exampletenantreg1.abcvcn.com

  9. Selezionare OK o Applica, quindi chiudere tutte le finestre aperte.
  10. Riavviare l'host di Windows.
  11. Disinstallare il Management Agent esistente eseguendo lo script uninstaller.bat dal terminale Windows.
  12. Installare nuovamente Management Agent sul computer Windows.

L'installazione di Management Agent deve essere completata e nella colonna host verrà visualizzato il nome FQDN della pagina Agente dell'host Windows.

Risoluzione dei problemi: installazione di Management Agent non riuscita su SELinux quando si utilizza il volume esterno

Avvio del servizio agente non riuscito dopo l'esecuzione dell'installazione, con conseguente agente non funzionante che visualizza i seguenti messaggi:
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
Per confermare, controllare i log di Service Manager per i dettagli dell'errore.
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Controllare inoltre i log di audit.
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc:  denied  { read open } for  pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0           tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0

Tutti i messaggi di errore sopra riportati indicano che SELinux non consente di eseguire comandi nella cartella scelta.

Azione: contattare l'amministratore del sistema e creare i criteri necessari che consentono di installare ed eseguire il Management Agent.

Risoluzione dei problemi: installazione del Management Agent non riuscita su Red Hat Enterprise Linux 9.x

L'installazione di Management Agent non riesce e potrebbe essere visualizzato il seguente messaggio di errore: mgmt_agent service creation failed. Reason: Detected Linux .

Inoltre, i messaggi del log degli errori di installazione possono confermare l'errore e indicare che i tentativi di configurazione utilizzano un service manager non corretto per installare l'agente.

Causa: Red Hat ha rimosso il package chkconfig nella distribuzione Red Hat Enterprise Linux (RHEL) 9. Per ulteriori dettagli, vedere la Red Hat Knowledge base.

Azione:

Verifica del problema
  1. Verificare che l'ambiente utilizzi Red Hat Enterprise Linux 9.x eseguendo il seguente comando:
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. I messaggi riportati di seguito evidenziano il problema che il sistema operativo/famiglia non è stato identificato correttamente utilizzando le regole presenti nello script agentcore e l'installazione tenterà di impostare il servizio agente utilizzando init.d e non systemctl su RHEL 9x.
    $ rpm -ivh oracle.mgmt_agent.231118.1208.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous agent service exists
    Checking if OS has systemd or initd
    Checking available disk space for agent install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the agent will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_agent-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_agent' daemon
    mgmt_agent service creation failed. Reason: Detected Linux:
    Installing the mgmt_agent daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_agent': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_agent': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_agent-231118.1208-1.x86_64) scriptlet failed, exit status 1
  3. Verificare che il pacchetto chkconfig non sia presente, come descritto nel seguente articolo della base di conoscenza di Red Hat.

Soluzione 1: installare il pacchetto chkconfig

  1. Installare il pacchetto mancante eseguendo il seguente comando:
    $ dnf install chkconfig
  2. Verificare che il pacchetto esista nell'ambiente eseguendo il seguente comando:
    $ rpm -qa | grep chkconfig
  3. Installare di nuovo il Management Agent.

Soluzione 2 - Senza installare il pacchetto chkconfig

Nota

Questa è una soluzione alternativa. Utilizzare questa soluzione solo se il pacchetto chkconfig non può essere installato. La soluzione consigliata è installare il pacchetto chkconfig.

Se l'installazione del pacchetto chkconfig non è un'opzione come descritto nella sezione precedente della soluzione 1, completare i seguenti passaggi come soluzione alternativa per installare il software Management Agent.

Utilizzare i comandi seguenti per:
  1. Passare a una shell root.
  2. Impostare la variabile di ambiente DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Installare il software del Management Agent.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Risoluzione dei problemi: l'installazione di Management Agent non riesce nel valore RUN_AGENT_AS_USER previsto per Linux come root

Se si installa l'agente e viene visualizzato il seguente errore, è necessario modificare le autorizzazioni per l'utente che installa l'agente.

rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpm
Preparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is root
Current user group is rootroot is not the default user, checking if required environment variables are set
RUN_AGENT_AS_USER=mgmt_agent contains an unexpected value
Expected RUN_AGENT_AS_USER value to be root, exiting
error: %pre(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
error: oracle.mgmt_agent-240229.1733-1.x86_64: install failed

Soluzione:

  1. Impostare la variabile d'ambiente RUN_AGENT_AS_USER come root aggiungendo quanto segue alla configurazione dell'ambiente in uso:
    export RUN_AGENT_AS_USER=root
    export AGENT_USER_GROUP=<OS_primary_group_of_selected_OS_user>
  2. Installare l'agente utilizzando il comando seguente:
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

    Per ulteriori informazioni, vedere Utilizzare un utente del sistema operativo non predefinito per installare Management Agent.

Risoluzione dei problemi: accesso allo script non riuscito utilizzando un percorso assoluto. Autorizzazioni insufficienti

Se si verifica il seguente errore, è possibile modificare le autorizzazioni per risolvere i problemi.

Copying files to destination dir (/opt/oracle/mgmt_agent)Initializing software from templateChecking if JavaScript engine is available to useCreating mgmt_agent daemonmgmt_agent service creation failed. Reason: Failed to access the script using an
        absolute path. Insufficient permissions may prevent the user "mgmt_agent" from traversing
        one of the folders. Please check the following permissions

Soluzione: è possibile configurare la directory /opt/oralce con 755 autorizzazioni per consentire l'accesso al programma di installazione dell'agente.

Risoluzione dei problemi: tentativo di registrazione cloud non riuscito con stato HTTP 407, credenziali Gateway Server errate

Se si installa Management Agent e l'esecuzione di CloudRegistrationStep non riesce con il seguente errore HTTP Status 407 , le credenziali GatewayServerUser o GatewayServerPassword potrebbero essere errate.

CloudRegistrationStep: The registration attempt failed with HTTP Status 407
Additional details are available in the configure logs at /opt/oracle/mgmt_agent/configure-logs 

Soluzione: generare una nuova chiave di risposta con i valori corretti per GatewayServerUser e GatewayServerPassword, quindi per verificare i dettagli corretti di Gateway Server, riprovare a installare l'agente.

Risoluzione dei problemi: l'installazione dell'agente non riesce JAVA_HOME non è impostata per l'interruzione dell'installazione dell'agente

Quando si installa l'agente, se si verifica il seguente errore, durante l'installazione la posizione della home java non è stata trovata.
rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpmPreparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is rootCurrent user group is rootroot is not the default user, checking if required environment variables are set
Checking agent version
Updating / installing...
1:oracle.mgmt_agent-240229.xxxx-1################################# [100%]
Failed to get unit file state for mgmt_agent.service: No such file or directory
Executing install
JavaHome is not set aborting agent install
warning:%post(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1

Azione:

  1. Nel file di risposta, impostare il parametro JAVA_HOME aggiungendo quanto segue:
    export JAVA_HOME=path/to/jdk/directory
  2. Installare l'agente eseguendo il comando seguente.
    rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm

Risoluzione dei problemi: impossibile visualizzare lo spazio di nomi e le metriche Prometheus nel servizio di monitoraggio OCI

In OCI Console, se i criteri necessari vengono impostati correttamente e lo spazio di nomi e le metriche Prometheus non sono visibili da OCI Monitoring in Metric Explorer, potrebbe essere necessario confermare che l'utente del sistema operativo mgmt_agent disponga delle autorizzazioni di lettura per il file .properties.

Possibile causa: l'utente del sistema operativo mgmt_agent non dispone delle autorizzazioni per leggere il file .properties. Questo file può essere di proprietà dell'utente root del sistema operativo e dispone di 600 autorizzazioni.
agent_inst/discovery/PrometheusEmitter/compute_exporter.properties 
Azione: per risolvere il problema:
  1. Verificare che il file  .properties in agent_inst/discovery/PrometheusEmitter sia di proprietà dell'utente del sistema operativo mgmt_agent e che l'utente del sistema operativo mgmt_agent disponga delle autorizzazioni di lettura per questo file.
  2. Riavviare il Management Agent OCI.

Risoluzione dei problemi: flag fornito ma non definito

Errore: se viene visualizzato il seguente errore: flag fornito ma non definito: -trusted-certs-dir

Azione: per risolvere il problema, è possibile aggiornare OCA alla versione più recente utilizzando i comandi riportati di seguito.
$ sudo -u oracle-cloud-agent /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent -cli -trusted-certs-dir=/tmp/trustedcerts
flag provided but not defined: -trusted-certs-dir
Usage of /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent:
  -agent-config string
        agent config yml file
  -cli
        run the monitoring in cli mode
  -debug
        enable debug logging
  -dev
        enable dev runs
  -force-redeploy
        force redeploy image
  -metadata-config string
        metadata config json file
  -oci-config string
        oci config file
  -staging
        enable staging endpoint
  -upgrade-native-agent
        invoke native agent upgrade

Risoluzione dei problemi: impossibile aggiungere le credenziali SSH con errore: carattere non racchiuso tra virgolette non valido

Possibile causa: quando si aggiungono credenziali di origine a un agente, se viene visualizzato il seguente errore di carattere non racchiuso tra virgolette, il formato del file JSON non è corretto. Ad esempio, se la chiave SSH viene visualizzata come più righe, la chiave SSH potrebbe non essere riconosciuta e l'errore di carattere non racchiuso tra virgolette non valido. Ad esempio:

[root@host ociagent]# cat 2nd.json | sudo -u mgmt_agent
      /opt/oracle/mgmt_agent/agent_inst/bin/credential_mgmt.sh -o upsertCredentials -s
      logancom.fasterxml.jackson.databind.JsonMappingException: Illegal unquoted character ((CTRL-CHAR,
      code 10)): has to be escaped using backslash to be included in string valueat [Source: (BufferedInputStream); line: 7, column: 70] (through reference chain:
      oracle.polaris.core.source.metadata.impl.creds.CredentialFormat["properties"]->java.lang.Object[][1]->oracle.polaris.core.source.metadata.impl.creds.CredentialFormat$Property["value"])at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:402)at
      com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:361)at
Soluzione: sono disponibili due modi per risolvere il problema:
  • Aggiungere il carattere speciale \n prima di ogni riga della chiave. Ad esempio:
    {"source":"host.myvm.example.com", 
    "name":"OSCreds", 
    "type":"SSHKeyCreds", 
    "description":"SSH keys for a user", 
    "properties":[
    {"name":"SSHUserName","value":"username"},               
    {"name":"SSHPrivateKey","value":"-----BEGIN RSA PRIVATE KEY-----\n<private-key-value>
    \n-----END RSA PRIVATE KEY-----"},
    {"name":"SSHPublicKey","value":"-----BEGIN PUBLIC KEY-----\n<public-key-value>
    \n<public-key-value>
    \n-----END PUBLIC KEY-----"]}
  • In alternativa, aggiungere il valore chiave completo in un'unica riga.

Ora, il formato JSON è corretto ed è possibile riprovare l'operazione per aggiungere le credenziali di origine.

Risoluzione dei problemi: errore nel percorso del certificato

Possibile causa: se durante l'installazione dell'agente viene visualizzato il seguente errore, è possibile che sia presente un componente di rete che inserisce i propri certificati. In alternativa, se si verifica un errore durante l'installazione dell'agente e la connessione avviene tramite un proxy, è possibile che il proxy in uso inietti un certificato personalizzato. Sarà necessario consultare l'amministratore per ottenere il certificato personalizzato e seguire i passi riportati di seguito.

PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException 

Soluzione: per risolvere uno di questi problemi, è possibile effettuare le operazioni riportate di seguito.

  1. Fornire certificati personalizzati durante l'installazione dell'agente, vedere Importa certificati o Aggiorna certificati.
  2. Nel file delle chiavi di risposta, aggiungere il parametro importTrustedCertsDirectory incluso il percorso. Per informazioni, vedere l'esempio seguente e vedere Configurare un file di risposta.
importTrustedCertsDirectory=/tmp/crt

Risoluzione dei problemi: impossibile installare Oracle Management Agent nell'istanza di Windows

Quando si installa l'agente su un host Windows, se il JDK supportato non esiste e esiste un JDK che utilizza una versione Java diversa, ad esempio 1.8.0_51, l'installazione del Management Agent non riesce sullo stesso host con il seguente errore:

C:\Users\abc\Downloads\Latest-agent> .\installer.bat 
C:\Users\abc\Downloads\Latest-agent\Windows-input.rsp
64 bit Windows OS found.
Checking pre-requisites

Checking if previous agent service exists
Checking if C:\Oracle\mgmt_agent\agent_inst directory exists
Checking Java version

"Agent only supports 64 bit and 32 bit JDK 8 (with a minimum upgrade version JDK 8u281). 
Please set your preferred path in JAVA_HOME"
Soluzione: per correggere questo problema, procedere come segue.
  1. Scaricare il JDK in un formato di archivio compresso .zip.
  2. Estrarre il file JDK.zip in una directory dell'host Windows.
  3. Installare l'agente e specificare il valore JAVA_HOME che punta alla directory.

Risoluzione dei problemi: quando si installa Management Agent e si vedono messaggi di timeout della connessione di rete

Possibile causa: se vengono visualizzati messaggi con timeout della connessione di rete. Ad esempio:
http://Example.example.com:4480->https://management-agent.us-ashburn-1.oci.oraclecloud.com:443 : Connection timed out Read failed)
Quindi è probabile che il management agent non possa raggiungere i servizi Oracle Cloud Infrastructure.

Soluzione:

Verificare le regole di configurazione di rete e confermare che il Management Agent può connettersi ai servizi OCI dalla virtual machine su cui è installato il Management Agent. Se hai una configurazione firewall o NAT, conferma che consente la comunicazione in uscita sugli indirizzi IP consigliati da OCI, per ulteriori informazioni consulta gli intervalli di indirizzi IP per i servizi distribuiti in Oracle Cloud Infrastructure.

Risoluzione dei problemi: CloudRegistrationStep: tentativo di registrazione non riuscito con stato HTTP 401 (le informazioni necessarie per completare l'autenticazione non sono state fornite o non sono corrette)

Causa: questo problema può verificarsi a causa di una chiave di risposta non valida o errata.

Azione: assicurarsi di disporre di una chiave valida. Per ulteriori informazioni, vedere Gestisci chiavi di installazione.

Troubleshoot: "code": "NotAuthenticated","message": "The required information to complete authentication was not provided or was incorrect.

Causa: questo problema può verificarsi a causa di una chiave di risposta scaduta.

Azione: assicurarsi di disporre di una chiave valida. Per ulteriori informazioni, vedere Gestisci chiavi di installazione.

Risoluzione dei problemi di disinstallazione dei Management Agent

Questo argomento descrive i problemi tipici e le relative risoluzioni correlati alla disinstallazione degli Oracle Management Agent.

Errore:... specifica più pacchetti

Causa: il registro rpm dispone di più package con il nome specificato.

Azione: utilizzare il flag --allmatches quando si esegue il comando rpm -e:
rpm -e oracle.mgmt_agent --allmatches

Errore: scriptlet non riuscito con codice di uscita

Causa: rpm non è stato in grado di arrestare l'agente in esecuzione o di rimuovere il file del servizio agente dal sistema.

Azione: per risolverlo, provare a rimuovere l'agente manualmente.
  • Controlla se il tuo agente è in esecuzione:

    Per OL7: systemctl status mgmt_agent

    Per OL6: /sbin/initctl status mgmt_agent

    Se l'agente è in esecuzione, arrestarlo:

    Per OL7: systemctl stop mgmt_agent

    Per OL6: /sbin/initctl stop mgmt_agent

  • Rimuovere rpm eseguendo rpm -e oracle.mgmt_agent --noscripts. Questo comando salterà tutti gli script rpm e tenterà di rimuovere il pacchetto dal registro.
  • Rimuovere tutti i file dell'agente eseguendo rm -rf /opt/oracle/mgmt_agent. Eseguire anche quanto segue:

    Per OL7: rm -rf /etc/systemd/system/mgmt_agent.service

    Per OL6: rm -rf /etc/init/mgmt_agent.conf

Risolvere i problemi di aggiornamento del Management Agent

Quando si aggiorna Oracle Management Agent, è possibile utilizzare la lista riportata di seguito per risolvere gli errori comuni.

Risoluzione dei problemi: l'aggiornamento automatico è abilitato, ma l'agente non viene aggiornato automaticamente a causa del proprietario del file non valido

Causa: è possibile configurare i Management Agent per eseguire l'upgrade automatico. L'opzione di upgrade automatico è disponibile a livello di tenancy, pertanto se si seleziona l'opzione di upgrade automatico nella console di Oracle Cloud, tutti gli agenti nella tenancy OCI eseguiranno l'upgrade automatico. L'aggiornamento automatico dell'agente potrebbe richiedere fino a 24 ore dopo la disponibilità di una nuova versione dell'agente in Management Agent Cloud Service.

Se la versione dell'agente non viene aggiornata dopo 24 ore di attesa, alcuni problemi sul disco potrebbero impedire l'aggiornamento automatico dell'agente.

La causa più comune di questo errore è che i file sono di proprietà di un utente del sistema operativo diverso dall'utente che ha installato Management Agent. Il processo di aggiornamento viene eseguito come lo stesso utente del sistema operativo del processo in esecuzione corrente e non ha la possibilità di passare alla radice. Qualsiasi file nella directory mgmt_agent creato manualmente dall'utente può interferire con la capacità dell'agente di eseguire l'aggiornamento automaticamente.

Il file mgmt_agent.log si trova nelle seguenti posizioni:
  • Per il Management Agent standalone:
    /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
  • Per il plugin Management Agent su Oracle Cloud Agent (OCA) nelle istanze di OCI Compute:
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log

    Nel file mgmt_agent.log, è possibile che venga visualizzato il seguente errore che indica i file problematici:

    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.oldbackup]
    2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] WARN  - Files with invalid owners were found, skippingauto-upgrade
Azione: per questo problema è possibile utilizzare la soluzione alternativa riportata di seguito.
  1. L'utente deve modificare la proprietà e il gruppo dei file interessati nell'account utente che originariamente ha installato Management Agent.
  2. Se è stato creato un file con il proprietario errato, è possibile eliminare il file o spostarlo in un'altra directory esterna alla directory di Management Agent. A seconda dell'installazione, è possibile trovare la directory Management Agent in una delle posizioni riportate di seguito.
    • Per il Management Agent standalone: /opt/oracle/mgmt_agent/
    • Per il plugin Management Agent per un agente Oracle Cloud in un'istanza di OCI Compute: /var/lib/oracle-cloud-agent
    Nota

    Per evitare questi problemi, non creare manualmente alcun file nella directory Management Agent.

Risoluzione dei problemi relativi ai Management Agent nelle istanze di computazione

Gli utenti possono riscontrare vari errori durante la distribuzione di Oracle Management Agent nelle istanze di computazione. Di seguito sono elencate le cause e le azioni consigliate per alcuni errori comuni.

Risoluzione dei problemi: l'agente si trova nello stato Non disponibile e il file di log dell'agente riporta "Tag non valide"

La pagina Management Agent mostra l'agente in stato 'Non disponibile' e il file mgmt_agent.log (situato nella directory <Agent_Inst>/logs) riporta il seguente messaggio:

ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s). Aggiungere un valore a ciascuna delle seguenti definizioni di tag: \nGLOBAL.ComponentType, GLOBAL.ApplicationName,

Causa:

Questo problema può verificarsi quando il compartimento richiede tag obbligatorie per ogni risorsa e la richiesta di creazione della risorsa non include le tag, quindi la richiesta di attivazione non riuscirà con il messaggio:"Tag non valide: creazione della risorsa non riuscita perché la risorsa richiede valori di tag" e lo stato dell'agente viene visualizzato come 'Non disponibile'.

Azione:

  • Management Agent

    Se si dispone di un Management Agent standalone, è necessario disinstallarlo.

    Se il Management Agent è stato installato utilizzando un RPM o un file ZIP, è necessario disinstallarlo e reinstallarlo fornendo un file di risposta utilizzando il parametro DefinedTags come descritto nella sezione Rivedi parametri agente.

  • Management Agent nelle istanze di calcolo
    Se il Management Agent viene abilitato mediante OCI Console mediante il plugin OCA, non esiste alcun file di risposta poiché non viene utilizzato per le istanze di computazione. In questo caso:
    1. Eseguire il login all'istanza in cui viene distribuito Management Agent e sudo come utente oracle-cloud-agent utilizzando il comando seguente:
      sudo -u oracle-cloud-agent sh
    2. Creare un file agent.definedtags nella seguente posizione:/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/
    3. Aggiungere le tag definite necessarie per la creazione della risorsa nel file agent.definedtags.

      Ad esempio, se sono presenti 2 spazi di nomi admin_namespace e finance_namespace

      e ogni spazio di nomi utilizza 2 chiavi e 2 valori environment_type=non-prod, sensitivity=restricted, è possibile utilizzare quanto segue:
      DefinedTags = [{"admin_namespace": {"environment_type": "non-prod",
          "sensitivity": "restricted"}, "finance_namespace": {"environment_type":
          "non-prod","sensitivity": "restricted"}}]
    4. Riavviare oracle-cloud-agent utilizzando il comando:
      sudo systemctl restart oracle-cloud-agent

Risoluzione dei problemi: impostazione del Management Agent non riuscita con fork/exec oracle.polaris.oca.main: autorizzazione negata

Gli utenti possono riscontrare questo errore che causa l'impossibilità di installare o avviare il Management Agent.

Il messaggio di errore visualizzato nella vista Plugin dell'istanza di computazione per il plugin Management Agent è simile al seguente:

workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]

Causa possibile:

Questo problema può verificarsi quando un'istanza di computazione non consente le operazioni di fork/esecuzione dalla directory /tmp attivando tmpfs con il flag noexec.

Per confermare questa possibile causa, eseguire le operazioni riportate di seguito.
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)

L'output deve indicare il flag noexec.

Azione:

  1. Arrestare l'agente Oracle Cloud.
     sudo systemctl stop oracle-cloud-agent
  2. Aggiungere la seguente impostazione al file: /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
    overrideTmpDir: true
  3. Avviare l'agente Oracle Cloud.
    $ sudo systemctl start oracle-cloud-agent

Risoluzione dei problemi: errore di autenticazione del Management Agent a causa del disallineamento del clock, un'ora diversa nell'istanza di computazione rispetto all'ora sul server

Causa: se tra l'istanza di computazione in cui è in esecuzione l'agente e il servizio Oracle Cloud Infrastructure Identity è presente un disallineamento di clock di più di 5 minuti, le richieste verranno rifiutate con un protocollo HTTP 401.

Se vengono rilevati i seguenti errori:

Nell'istanza di OCI Compute, andare alla scheda Agente Oracle Cloud e il Management Agent visualizza un errore nella colonna Messaggio:

rpc error: code = Unavailable desc = connection error: desc = "transport: error while
      dialing: dial unix /var/lib/oracle-cloud-agent/tmp/plugin1825606937: connect: connection
      refused"

Oppure nei log potresti trovare il seguente errore:

2022-12-09 07:41:22,144 [SysExecutor.0 (Resource Principal Token Refresher)-47] WARN  - #-#  invocation access log [request-id-prefix: K9YBE4AY] #-#
Service: OCI
Method:  GET
Path:    /20200202/managementAgents/ocid1.managementagent.....rvf6i3ba/resourcePrincipalToken
Headers:opc-rpt-request-token=********************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        date=Fri, 09 Dec 2022 07:41:19 GMT         
        host=management-agent.ap-tokyo-1.oci.oraclecloud.com         
        Authorization=******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************         
        opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO         
        User-Agent=Jersey/2.34 (Apache HttpClient 4.5.13)Attempts:
<--> Endpoint:       management-agent.ap-tokyo-1.oci.oraclecloud.com     
     opc-request-id: K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO     
     StartTime:      2022-12-09 07:41:19,976 GMT     
     Status:         401 Unauthorized     
     Headers:        X-Content-Type-Options=nosniff                     
                     Content-Length=187                         
                     opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO/E4356B68C6C541BAD867E46760316D35/4118B130EE46A8E25F90DC91AB7F12D7                     
                     Date=Fri, 09 Dec 2022 07:41:21 GMT                     
                     Content-Type=application/json     
      ErrorBody:
{  
    "code" : "NotAuthenticated",  
    "message" : "Unable to authenticate the request for ocid1.managementagent.oc1.ap-tokyo-1.amaaaa...6frjnrbvqrvf6i3ba"}

Azione

Correggere il disallineamento dell'orologio e riavviare. Se l'agente è rimasto inattivo per giorni a causa di questo errore, è necessario eseguire il cleanup del file donotrestart prima di riavviare l'agente.

Inoltre, Oracle consiglia di impostare la data/ora del sistema operativo per la sincronizzazione automatica con i server NTP in modo da evitare tempi di inattività in futuro. Se sul computer sono in esecuzione servizi aggiuntivi, è consigliabile riavviare il computer dopo la modifica dell'ora in modo che i servizi possano essere reimpostati con il nuovo orario.

Per correggere la data/ora del sistema operativo in cui l'agente è in esecuzione e quindi riavviare l'agente, effettuare le operazioni riportate di seguito.

  1. Per arrestare l'agente eseguire il comando seguente:
    sudo systemctl stop oracle-cloud-agent
  2. Correggere la data e l'ora.
  3. Eseguire il comando seguente per eliminare il file configure.donotrestart.
    sudo rm /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/configure.donotrestart
  4. Avviare l'agente.
    sudo systemctl start oracle-cloud-agent

Risoluzione dei problemi: servizio Management Agent OCI: agente non visibile nella console OCI in osservabilità e gestione

Installazione di OCI Management Agent riuscita in un'istanza di computazione. L'agente è in esecuzione sull'host. Tuttavia, l'agente non viene visualizzato nella console di Oracle Cloud se si passa al menu Navigazione, si seleziona Osservabilità e gestione, si passa ai Management Agent e si seleziona Agenti.

Possibile causa: i compartimenti dell'istanza di computazione e della chiave di installazione dell'agente sono diversi.  

Azione:
  1. Arrestare e disinstallare il Management Agent nell'istanza di computazione.
  2. Crea chiave di installazione agente nello stesso compartimento dell'istanza di computazione.
  3. Usare questa nuova chiave di installazione appena creata e installare Management Agent.
A questo punto, il Management Agent viene visualizzato come attivo in Observability & Management, andare a Management Agent, quindi selezionare Agenti.

Risoluzione dei problemi relativi ai gateway di gestione

Questo argomento descrive i problemi e le soluzioni comuni correlati ai gateway di gestione.

Risoluzione dei problemi: rimozione del gateway di gestione

Causa: in alcuni casi potrebbe essere necessario rimuovere un'installazione di Management Gateway esistente per reinstallarla.

Action:
  1. Verificare se il gateway è in esecuzione:

    Per OL7: systemctl status mgmt_gateway

    Per OL6: /sbin/initctl status mgmt_gateway

    Se il gateway è in esecuzione, arrestarlo:

    Per OL7: systemctl stop mgmt_gateway

    Per OL6: /sbin/initctl stop mgmt_gateway

  2. Rimuovere l'RPM Gateway installato utilizzando il seguente comando: rpm -e oracle.mgmt_gateway --noscripts

  3. Rimuovere i file gateway rimanenti utilizzando il comando seguente:

    rm -rf /opt/oracle/mgmt_agent

  4. Eseguire il seguente codice:

    For OL7: rm -rf /etc/systemd/system/mgmt_gateway.service

    For OL6: rm -rf /etc/init/mgmt_agent.conf

Risoluzione dei problemi: Configura Management Gateway

Causa: in alcuni casi, il nome host potrebbe non essere risolto nell'ambiente di installazione che potrebbe causare l'errore dell'installazione con il seguente messaggio di errore:

Risoluzione dei problemi: "Impossibile risolvere il valore del nome host <hostname> nell'ambiente di installazione. Risolvere il nome host o fornire GatewayCertCommonName nel file di risposta ed eseguire di nuovo lo script di impostazione del gateway."

Azione:

  • Controllare e risolvere il nome host dell'ambiente per ottenere il valore FQDN (Full Qualified Doamin Name) dopo l'esecuzione del comando: hostname -f
  • Facoltativamente, un utente può fornire un nome di dominio completamente qualificato personalizzato per la configurazione del gateway mediante il popolamento della proprietà GatewayCertCommonName nel file di risposta di input. Vedere Parametri file di risposta
  • Rieseguire lo script del gateway di configurazione.
    sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

Causa: in alcuni casi l'installazione di Management Gateway potrebbe non riuscire con il seguente messaggio di errore a causa dell'assenza di criteri in OCI o a causa di problemi di limite delle risorse nella tenancy. Se viene visualizzato il seguente errore, attenersi alla procedura riportata di seguito.

Risoluzione dei problemi: "Impossibile avviare Management Gateway perché non è stato possibile creare, inizializzare o recuperare i certificati in OCI. Per ulteriori dettagli, controllare i log."

Azione:

  • Aprire il file di log nella directory di installazione di Management Gateway, ad esempio: /opt/oracle/mgmt_agent/plugins/GatewayProxy/statedir/log/mgmt_gateway.log
  • Se il file di log contiene uno dei seguenti 404 codici di errore, scegliere una delle seguenti opzioni per risolvere il problema:
    2023-07-25 15:38:06.694/CEST [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "NotAuthorizedOrNotFound",  "message" : "Authorization failed or requested resource not found."}
    2023-07-25 15:38:06.696/CEST [pool-3-thread-1] ERROR com.oracle.mgmtagent.proxy.ProxyServer - Error while initializing and loading certificate bundlescom.oracle.mgmtagent.proxy.exception.CertificateFailureException: The response status is 404 after multiple retries at com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility.executeRequest(CertificateUtility.java:293) ~
  • Se il file di log contiene uno dei 400 codici di errore riportati di seguito, esaminare le opzioni riportate di seguito per risolvere il problema.
    2023-09-20 18:51:32.772/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateCreationUtil - Create Vault Service Url invoked https://kms.us-ashburn-1.oraclecloud.com/20180608/vaults
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Received response code 400
    2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Header name opc-request-id , value /5704D03441842D3818B824B2D6B2712E/1D1FED893474FDA900188E24F3DEE59B
    2023-09-20 18:51:33.401/GMT [pool-3-thread-1] INFO  com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String {  "code" : "LimitExceeded",  "message" : "The limit for this tenancy has been exceeded."}
    • Controllare il limite per la risorsa Conteggio vault predefinito per il servizio di gestione delle chiavi in OCI Console. È possibile inviare una richiesta per aumentare i limiti delle risorse. Per ulteriori informazioni, vedere Gestione delle chiavi e Gestione dei vault.
    • È possibile impostare i certificati manualmente. Per i dettagli, vedere Eseguire i prerequisiti per la distribuzione di Management Gateway e andare alla sezione Gestione manuale dei certificati.
      Nota

      Quando si creano i certificati Emessi dalla CA interna , il profilo del certificato deve essere Server TLS o Client TLS e sono supportati solo gli algoritmi di firma RSA.
  • In caso di altri errori correlati al vault o alle API del servizio di chiavi nei log, è possibile inviare una richiesta e contattare il team oci_kms fornendo il corpo della risposta e opc-request-id.
  • In caso di altri errori relativi alle autorità di certificazione o alle API del servizio di certificazione nei log, inviare una richiesta e contattare il team oci_certificates fornendo il corpo della risposta e opc-request-id.

Risoluzione dei problemi: installazione di Management Gateway non riuscita su Red Hat Enterprise Linux 9.x

L'installazione di Management Gateway non riesce e potrebbe essere visualizzato il seguente messaggio di errore: mgmt_gateway service creation failed. Reason: Detected Linux.

Inoltre, i messaggi del log degli errori di installazione possono confermare l'errore e indicare che i tentativi di configurazione utilizzano un service manager errato per installare il gateway.

Causa: Red Hat ha rimosso il package chkconfig nella distribuzione Red Hat Enterprise Linux (RHEL) 9. Per ulteriori dettagli, vedere la Red Hat Knowledge base.

Azione:

Verifica del problema
  1. Verificare che l'ambiente utilizzi Red Hat Enterprise Linux 9.x eseguendo il seguente comando:
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. I messaggi riportati di seguito evidenziano il problema che il sistema operativo/famiglia non è stato identificato correttamente utilizzando le regole presenti nello script agentcore e l'installazione tenterà di impostare il servizio agente utilizzando init.d e non systemctl su RHEL 9x.
    $ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm
    Verifying... ################################# [100%]
    Preparing... ################################# [100%]
    Checking pre-requisites
    Checking if any previous gateway service exists
    Checking if OS has systemd or initd
    Checking available disk space for gateway install
    Checking if /opt/oracle/mgmt_agent directory exists
    Checking if 'mgmt_agent' user exists
    'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one.
    Checking Java version
    Trying /omc/java/jdk1.8.0_391
    Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
    Checking agent version
    Updating / installing...
    1:oracle.mgmt_gateway-231118.1208.1################################# [100%]
    
    Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent)
    Initializing software from template
    Checking if JavaScript engine is available to use
    Creating 'mgmt_gateway' daemon
    mgmt_gateway service creation failed. Reason: Detected Linux:
    Installing the mgmt_gateway daemon...
    ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory
    ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory
    Service not installed.
    warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
  3. Verificare che il pacchetto chkconfig non sia presente, come descritto nel seguente articolo della base di conoscenza di Red Hat.
Soluzione 1: installare il pacchetto chkconfig
  1. Installare il pacchetto mancante eseguendo il seguente comando:
    $ dnf install chkconfig
  2. Verificare che il pacchetto esista nell'ambiente eseguendo il seguente comando:
    $ rpm -qa | grep chkconfig
  3. Installare nuovamente Management Gateway.
Soluzione 2 - Senza installare il pacchetto chkconfig
Nota

Questa è una soluzione alternativa. Utilizzare questa soluzione solo se il pacchetto chkconfig non può essere installato. La soluzione consigliata è installare il pacchetto chkconfig.

Se l'installazione del pacchetto chkconfig non è un'opzione come descritto nella sezione Soluzione 1 sopra, completare i seguenti passaggi come soluzione alternativa per installare il software Management Gateway.

Utilizzare i comandi seguenti per:
  1. Passare a una shell root.
  2. Impostare la variabile di ambiente DIST_LINUX_FAMILY_OVERRIDE="Red Hat".
  3. Installare il software Management Gateway.
$ sudo /bin/bash

$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"

# RPM install
$ rpm -ivh <rpm_file_name.rpm>

# ZIP install
$ ./installer.sh <full_path_of_response_file>

Risoluzione dei problemi: installazione del gateway di gestione non riuscita con errore: impossibile creare i certificati e il report dei log delle identità: autenticazione non riuscita: DATE_OUTSIDE_CLOCK_SKEW

Causa:

Autenticazione del report dei log delle identità non riuscita: DATE_OUTSIDE_CLOCK_SKEW

# /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<PATH>/gateway_agent.rsp/opt/oracle/mgmt_agent/agent_inst/bin/setupAgent.sh
    opts=<PATH>/gateway_agent.rsp

Executing configure

Parsing input response file
Validating install key
Generating communication wallet
Generating security artifactsRegistering Management Gateway
Found service plugin(s):[GatewayProxy]

Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...Done.
GatewayProxy : Successfully deployed external plugin

Gateway setup completed and the gateway is running.
In the future gateway can be started by directly running: sudo systemctl start mgmt_gateway

Please make sure that you delete <PATH>/gateway_agent.rsp or store it in secure location.

Creating gateway system properties file
Creating properties fileCreating or validating certificates
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Failed to start Management Gateway as certificates could not be created, initialized or retrieved in OCI. Please check the logs for more details.
Management Gateway stopped

Azione:

Nell'host in cui è installato Management Gateway, assicurarsi che l'ora dell'host sia corretta, quindi installare Management Gateway.

Risoluzione dei problemi: durante l'installazione o la configurazione di Management Gateway, si è verificato un errore di timeout

Se si verifica che OCI Console visualizzi Management Gateway come attivo, ma le metriche non vengono popolate.

Se il timeout del servizio si verifica il seguente errore:

/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Starting gateway...
Gateway started successfully

Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...............Timed out.

Agent is unable to check if it deployed requested service plugin(s) successfully or not. 
Please check back later on the console.

Causa: il tempo di completamento del task di impostazione di Management Gateway più lungo del previsto potrebbe causare un problema di comunicazione di rete e il timeout di Management Gateway.

Azione: per completare l'impostazione, effettuare le operazioni riportate di seguito.
  1. Conferma che non ci sono problemi di comunicazione di rete.
  2. Verificare se i seguenti dettagli proxy sono stati aggiornati nel file di risposta per determinare se esiste un problema proxy. Ad esempio, confermare che i dettagli corretti di host e porta proxy siano stati aggiornati nel file di risposta:

    ProxyHost = my.proxyhost.com

    ProxyPort = 80

  3. Arrestare Management Gateway utilizzando il comando seguente:

    systemctl stop mgmt_gateway

  4. Eseguire nuovamente l'impostazione di Management Gateway utilizzando il comando seguente:

    /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp

  5. L'impostazione di Management Gateway deve essere completata correttamente e le metriche devono essere popolate.

Raccogli log Management Agent

Se è necessario inviare un ticket di supporto per coinvolgere il Supporto Oracle, è utile raccogliere i log del Management Agent e allegare i log al ticket di supporto. La posizione del log dipende dal modo in cui viene installato e abilitato il Management Agent.

Trova la posizione del log

È possibile .zip o .tar manualmente per tutti i file di log in una delle seguenti posizioni:

  • Se è stato abilitato il plugin Management Agent utilizzando l'agente Oracle Cloud (OCA), è possibile trovare i log in questa posizione:
    /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log
  • Se è stato installato Management Agent utilizzando un grafico helm .rpm, zip, o un'immagine contenitore, la posizione di log predefinita è la seguente:
    /opt/oracle/mgmt_agent/agent_inst/log
Nota

Se l'agente è stato installato in Windows, le posizioni dei log dipendono dalla posizione in cui sono installati gli agenti. Le posizioni dei log si trovano in genere nella directory di installazione nella seguente posizione: agent_inst/log

Crea un bundle di diagnostica

È possibile eseguire manualmente .zip o .tar per tutti i file di log nelle posizioni sopra indicate oppure generare un bundle di diagnostica.

L'agente deve essere in esecuzione e in buono stato per generare il bundle di diagnostica. Se la generazione dell'archivio di diagnostica non riesce, eseguire manualmente .zip o .tar tutti i file di log sopra menzionati.

Nota

È necessario creare questi archivi .zip o .tar come utente del sistema operativo Management Agent in /tmp o in un'altra directory esterna alla directory di installazione dell'agente.

Per generare un bundle di diagnostica:

  • Per un plugin Management Agent che utilizza l'agente Oracle Cloud (OCA) utilizzare il comando seguente:
    $ sudo -u oracle-cloud-agent /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/bin/generateDiagnosticBundle.sh
  • Per un Management Agent installato utilizzando un'immagine scaricata, ad esempio un grafico helm .rpm, .zip, o un'immagine contenitore, è possibile utilizzare il comando seguente:
    $ sudo -u mgmt_agent /opt/oracle/mgmt_agent/agent_inst/bin/generateDiagnosticBundle.sh