Risoluzione dei problemi relativi al servizio dei Management Agent
In questa sezione vengono descritti alcuni problemi e risoluzioni tipici correlati al servizio Management Agent, ad esempio l'installazione e la disinstallazione con i Management Agent e i Management Gateway.
argomenti:
-
Risolvere i problemi di installazione e configurazione dei Management Agent
- Risoluzione dei problemi: disinstallare l'agente e rimuovere il file del servizio prima di installare il nuovo agente.
- Risoluzione dei problemi: Java non è una JVM a 64 bit. Impostare il percorso di una JVM a 64 bit nella variabile di ambiente JAVA_HOME o Java non trovato. Impostare il percorso preferito in JAVA_HOME.
- Risoluzione dei problemi: installazione dell'agente non riuscita con messaggio: useradd: impossibile ottenere un GID univoco (nessun altro GID disponibile)
- Risoluzione dei problemi: useradd: impossibile creare la directory /usr/share/mgmt_agent
- Risoluzione dei problemi: Windows: impossibile trovare il percorso specificato. Installazione dell'agente non riuscita.
- Risoluzione dei problemi: lo stato di Management Agent è "Non disponibile" nella console dopo l'installazione iniziale
- Risoluzione dei problemi: l'agente viene eseguito in OutOfMemoryException
- Risoluzione dei problemi: il Management Agent OCI non si avvia sull'host Windows
- Risoluzione dei problemi: l'aggiornamento automatico del Management Agent non funziona o alcuni agenti sono stati saltati
- Risoluzione dei problemi: indirizzo IP visualizzato nella colonna host quando Management Agent è installato nell'host di Windows
- Risoluzione dei problemi: l'installazione di Management Agent non riesce su SELinux quando si utilizza un volume esterno
- Risoluzione dei problemi: installazione del Management Agent non riuscita su Red Hat Enterprise Linux 9.x
- Risoluzione dei problemi: installazione dell'agente non riuscita - JavaHome non è impostato per l'interruzione dell'installazione dell'agente
- Risoluzione dei problemi: l'installazione di Management Agent non riesce nel valore RUN_AGENT_AS_USER previsto per Linux come root
- Risoluzione dei problemi: tentativo di registrazione cloud non riuscito con stato HTTP 407, credenziali Gateway Server errate
- Risoluzione dei problemi: impossibile visualizzare lo spazio di nomi e le metriche Prometheus nel servizio di monitoraggio
- Risoluzione dei problemi: flag fornito ma non definito
- Risoluzione dei problemi: impossibile aggiungere le credenziali SSH con errore: carattere non racchiuso tra virgolette non valido
- Risoluzione dei problemi: errore nel percorso del certificato
- Risoluzione dei problemi: impossibile installare Oracle Management Agent nell'istanza di Windows
- Risoluzione dei problemi: quando si installa Management Agent e si vedono messaggi di timeout della connessione di rete
- Risoluzione dei problemi: CloudRegistrationStep: tentativo di registrazione non riuscito con stato HTTP 401 (le informazioni necessarie per completare l'autenticazione non sono state fornite o non sono corrette)
- Troubleshoot: "code": "NotAuthenticated","message": "The required information to complete authentication was not provided or was incorrect.
-
Risoluzione dei problemi di disinstallazione dei Management Agent
-
Risoluzione dei problemi relativi ai Management Agent nelle istanze di computazione
- Risoluzione dei problemi: l'agente è in stato Non disponibile e il file di log dell'agente segnala "Tag non valide"
- Risoluzione dei problemi: impostazione del Management Agent non riuscita con fork/exec oracle.polaris.oca.main: autorizzazione negata
- Risoluzione dei problemi: errore di autenticazione del Management Agent a causa del disallineamento del clock, un'ora diversa nell'istanza di computazione rispetto all'ora sul server
- Risoluzione dei problemi: servizio Management Agent OCI: agente non visibile nella console OCI in osservabilità e gestione
- Risolvere i problemi di aggiornamento dei Management Agent
-
Risoluzione dei problemi relativi ai gateway di gestione
- Risoluzione dei problemi: Rimuovi Management Gateway
- Risoluzione dei problemi: Configura Management Gateway
- Risoluzione dei problemi: l'installazione di Management Gateway non riesce su Red Hat Enterprise Linux 9.x
- Risoluzione dei problemi: l'installazione di Management Gateway non riesce con l'errore: impossibile creare i certificati e il report dei log delle identità: autenticazione non riuscita: DATE_OUTSIDE_CLOCK_SKEW
- Risoluzione dei problemi: durante l'installazione e la configurazione di Management Agent, timeout dell'errore
Risolvere i problemi di installazione e configurazione dei Management Agent
Gli utenti possono riscontrare vari errori durante il processo di installazione e configurazione di Oracle Management Agent. Di seguito sono elencate le cause e le azioni consigliate per alcuni errori comuni.
- Risoluzione dei problemi: disinstallare l'agente e rimuovere il file del servizio prima di installare il nuovo agente.
- Risoluzione dei problemi: Java non è una JVM a 64 bit. Impostare il percorso di una JVM a 64 bit nella variabile di ambiente JAVA_HOME o Java non trovato. Impostare il percorso preferito in JAVA_HOME.
- Risoluzione dei problemi: installazione dell'agente non riuscita con messaggio: useradd: impossibile ottenere un GID univoco (nessun altro GID disponibile).
- Risoluzione dei problemi: useradd: impossibile creare la directory /usr/share/mgmt_agent
- Risoluzione dei problemi: Windows: impossibile trovare il percorso specificato. Installazione dell'agente non riuscita.
- Risoluzione dei problemi: lo stato di Management Agent è "Non disponibile" nella console dopo l'installazione iniziale
- Risoluzione dei problemi: dopo la configurazione, il Management Agent non è visibile nella console o tramite l'API
- Risoluzione dei problemi: le metriche Prometheus o Kubernetes monitorate mediante Management Agent non sono disponibili
- Risoluzione dei problemi: l'agente viene eseguito in OutOfMemoryException
- Risoluzione dei problemi: il Management Agent OCI non si avvia sull'host Windows
- Risoluzione dei problemi: l'aggiornamento automatico del Management Agent non funziona o alcuni agenti sono stati saltati
- Risoluzione dei problemi: indirizzo IP visualizzato nella colonna host quando Management Agent è installato nell'host di Windows
- Risoluzione dei problemi: l'installazione di Management Agent non riesce su SELinux quando si utilizza un volume esterno
- Risoluzione dei problemi: installazione del Management Agent non riuscita su Red Hat Enterprise Linux 9.x
- Risoluzione dei problemi: installazione dell'agente non riuscita - JavaHome non è impostato per l'interruzione dell'installazione dell'agente
- Risoluzione dei problemi: l'installazione di Management Agent non riesce nel valore RUN_AGENT_AS_USER previsto per Linux come root
- Risoluzione dei problemi: accesso allo script non riuscito utilizzando un percorso assoluto. Autorizzazioni insufficienti
- Risoluzione dei problemi: tentativo di registrazione cloud non riuscito con stato HTTP 407, credenziali Gateway Server errate
- Risoluzione dei problemi: impossibile visualizzare lo spazio di nomi e le metriche Prometheus nel servizio di monitoraggio
- Risoluzione dei problemi: flag fornito ma non definito
- Risoluzione dei problemi: impossibile aggiungere le credenziali SSH con errore: carattere non racchiuso tra virgolette non valido
- Risoluzione dei problemi: errore nel percorso del certificato
- Risoluzione dei problemi: impossibile installare Oracle Management Agent nell'istanza di Windows
- Risoluzione dei problemi: durante l'installazione del Management Agent e la visualizzazione dei messaggi con timeout della connessione di rete
- Risoluzione dei problemi: CloudRegistrationStep: tentativo di registrazione non riuscito con stato HTTP 401 (le informazioni necessarie per completare l'autenticazione non sono state fornite o non sono corrette)
- Troubleshoot: "code": "NotAuthenticated","message": "The required information to complete authentication was not provided or was incorrect.
Risoluzione dei problemi: disinstallare l'agente e rimuovere il file del servizio prima di installare il nuovo agente.
Causa: sull'host è già installato un agente. Un processo di disinstallazione precedente non ha rimosso correttamente il file del servizio agente.
- Eseguire
rpm -e oracle.mgmt_agent
per disinstallare l'agente. Se il comando riesce, provare a installare il nuovo agente. Se il comando non funziona, provare l'azione consigliata successiva. - Eseguire
ls /opt/oracle/mgmt_agent
per verificare se sono presenti residui dell'installazione dell'agente precedente. Se lo si trova, eliminarlo eseguendo:rm -rf /opt/oracle/mgmt_agent
. - Verificare se il file del servizio agente è già disponibile nella posizione seguente, a seconda della versione di Linux in uso:
- Per OL7 (se si utilizza systemd):
/etc/systemd/system/mgmt_agent.service
- Per OL6 (se si utilizza init):
/etc/init/mgmt_agent.conf
.Se si dispone di questo file di servizio, rimuoverlo eseguendo:
rm -rf /etc/init/mgmt_agent.conf
e riprovare a installare il nuovo agente.
- Per OL7 (se si utilizza systemd):
Risoluzione dei problemi: Java non è una JVM a 64 bit. Impostare il percorso di una JVM a 64 bit nella variabile di ambiente JAVA_HOME oppure Java non trovato. Impostare il percorso preferito in JAVA_HOME.
Causa: la variabile di ambiente JAVA_HOME
non è impostata oppure non punta a una posizione JDK a 64 bit.
Azione: impostare la variabile di ambiente JAVA_HOME
sulla versione JDK corretta e riprovare a installare l'agente. Attualmente è supportato solo il JDK a 64 bit.
Risoluzione dei problemi: installazione dell'agente non riuscita con messaggio: useradd: impossibile ottenere un GID univoco (nessun altro GID disponibile)
Causa: lo script di installazione non può aggiungere un utente e un gruppo durante il processo di installazione del Management Agent poiché gli ID gruppo disponibili nel sistema Linux sono già in uso.
Executing install
Unpacking software zip
Copying files to destination dir (/opt/oracle/mgmt_agent)
useradd: Can't get unique GID (no more available GIDs)
useradd: can't create group
Agent installation failed, please check log file
Azione: rivolgersi all'amministratore di sistema prima di procedere con quanto riportato di seguito.
-
Modificare il file
/etc/login.defs
. Per modificare il file sono necessari i privilegisudo
.Cercare le voci riportate di seguito.
DoveSYS_GID_MIN nnnn SYS_GID_MAX mmmm SYS_UID_MIN pppp SYS_UID_MAX qqqq
nnnn
epppp
sono il valore minimo emmmm
eqqqq
sono il valore massimo.Se le voci precedenti non esistono nel file, aggiungerle.
-
Aggiornare il valore della voce
SYS_GID_MAX
in base a quanto consigliato dall'amministratore del sistema e salvare il file. -
Rimuovere l'installazione dell'agente non riuscita eseguendo:
sudo rpm -e oracle.mgmt_agent
. -
Logout della shell seguito dal login.
-
Riprovare l'installazione dell'agente.
Risoluzione dei problemi: useradd: impossibile creare la directory /usr/share/mgmt_agent
Durante l'installazione di Management Agent, l'utente mgmt_agent
viene creato con la posizione della directory home predefinita in /usr/share/mgmt_agent
.
Causa: non sono disponibili autorizzazioni file sufficienti in /usr/share
oppure il file system è di sola lettura.
Azioni possibili:
-
Impostare le autorizzazioni per concedere all'utente
mgmt_agent
l'accesso alla posizione della directory home utente predefinita:/usr/share
. -
Impostare una directory home diversa utilizzando la variabile di ambiente
USER_HOME_DIR_ROOT
se si desidera utilizzare una posizione diversa.Impostare la variabile di ambiente
USER_HOME_DIR_ROOT
con il percorso che si preferisce utilizzare come directory home per l'utentemgmt_agent
e assicurarsi che l'utente del Management Agent disponga delle autorizzazioni file corrette per tale directory preferita.
Risoluzione dei problemi: Windows: impossibile trovare il percorso specificato. Installazione dell'agente non riuscita.
LIVELLO DI ERRORE=9009
Possibile causa: le variabili di ambiente non sono state impostate correttamente a causa degli spazi nel nome della directory o della cartella.
Gli ambienti Windows consentono di utilizzare spazi all'interno di un nome directory/cartella che causa un problema con l'installazione di Management Agent poiché le virgolette vengono aggiunte automaticamente al nome da Windows. Ad esempio, esiste una directory/cartella denominata: Program Files
. In questo caso Windows inserisce automaticamente le virgolette poiché c'è uno spazio all'interno del nome della cartella e ora dirà: "Program Files"
.
Le virgolette aggiuntive possono causare un problema poiché il programma di installazione di Management Agent non consente virgolette per le variabili di ambiente, ad esempio JAVA_HOME
e AGENT_INSTALL_BASEDIR
.
Il programma di installazione di Management Agent non accetta i seguenti caratteri speciali nel percorso: [
, ^^
, "
, '
, &
o ]
.
Azione:
- Nella barra delle applicazioni di Windows, fare clic con il pulsante destro del mouse sull'icona Windows e selezionare Sistema.
- Nella finestra Impostazioni, in Impostazioni correlate, fare clic su Impostazioni di sistema avanzate.
- Nella scheda Avanzate fare clic su Variabili di ambiente.
- Per creare una nuova variabile di ambiente, fare clic suNuovo. Fare clic su Modifica per modificare una variabile di ambiente esistente.
- Dopo aver creato o modificato la variabile di ambiente, fare clic su Applica, quindi su OK per rendere effettiva la modifica.
Nota
L'interfaccia utente grafica per la creazione delle variabili di ambiente può variare leggermente, a seconda della versione di Windows in uso.
Risoluzione dei problemi: lo stato del Management Agent è "Non disponibile" nella console dopo l'installazione iniziale
Possibile causa n. 1: indicatore orario di sistema errato
Azione: verificare l'ora di sistema dell'host dell'agente e, se necessario, correggere l'ora.
Possibile causa n. 2: se si utilizza il file di risposta input.rsp
per il Management Agent, è necessario definire le tag per il compartimento Management Agent.
Se i tag non sono definiti, è possibile che venga visualizzato un errore simile al seguente:
Attempts:
<--> Endpoint: management-agent.us-ashburn-1.oci.oraclecloud.com
opc-request-id: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXJ8
StartTime: 2024-09-18 03:45:12,662 GMT
Status: 400 Bad Request
Headers: Strict-Transport-Security=max-age=31536000; includeSubDomains;
Connection=close
Content-Length=63
opc-request-id=XXXXXXXXXXXXXXXXXXXXXXXX..................B25ADA8E
Date=Wed, 18 Sep 2024 03:45:12 GMT
Content-Type=application/json
ErrorBody:
{
"code" : "InvalidParameter",
"message" : "Invalid tags"
}
Azione: per definire le tag specifiche per l'ambiente in uso, nel file di risposta input.rsp
aggiungere i parametri riportati di seguito e specificare le coppie chiave-valore per l'ambiente in uso. Per ulteriori informazioni, vedere Creare un file di risposta.
DefinedTags = [{"namespace1":{"<key1>":"<value1>"}},
{"namespace2":{"<key2>":"<value2>"}}]
Risoluzione dei problemi: dopo la configurazione, il Management Agent non è visibile nella console o tramite l'API
Possibile causa: se dopo aver configurato il Management Agent o l'agente gateway di gestione, l'agente non viene visualizzato nella console di Oracle Cloud o tramite l'API, i criteri corretti potrebbero non essere impostati per l'utente o il gruppo di utenti.
Azione: verificare che l'utente o il gruppo di utenti disponga dei criteri necessari configurati per il Management Agent o l'agente gateway. Per impostare i criteri, vedere Creare criteri per il gruppo di utenti.
Risoluzione dei problemi: le metriche Prometheus o Kubernetes monitorate mediante Management Agent non sono disponibili
-
a) politiche mancanti
Azione: verificare che i criteri vengano aggiunti a Management Agent come descritto nelle istruzioni di impostazione. Per i dettagli, vedere Impostazione di Oracle Cloud Infrastructure for Management Agent Service.
Se mancano i criteri, aggiungerli come descritto in Impostazione di Oracle Cloud Infrastructure for Management Agent Service.
-
b) Typos nelle politiche
Azione: rivedere la sintassi dei criteri per individuare eventuali errori confrontandoli con gli esempi di criteri. Per i dettagli, vedere Impostazione di Oracle Cloud Infrastructure for Management Agent Service.
Ad esempio, assicurarsi che la definizione del gruppo dinamico venga definita correttamente in base alla sintassi seguente con le virgolette singole corrette intorno all'ID compartimento e al tipo di risorsa
managementagent
:ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
-
(c) ID compartimento errato nella definizione del gruppo dinamico
Azione: verificare che l'ID compartimento della chiave di installazione sia uguale all'ID compartimento specificato nella definizione del gruppo dinamico dell'agente. Per impostazione predefinita, l'agente viene creato nel compartimento della chiave di installazione.
Risoluzione dei problemi: l'agente viene eseguito in OutOfMemoryException
Possibile causa: l'agente potrebbe esaurire la memoria heap se non viene sottoposta a tuning in modo appropriato per supportare il carico a cui è stata assegnata.
Azione: aggiornare le impostazioni della memoria heap per il Management Agent.
- 128 MB per Management Agent come plugin OCA.
- 512 MB per Management Agent standalone. (Quello scaricato dalla console di Management Agent).
- Aprire il file:
agent_inst/config/java.options
. - Modificare il file sopra riportato. Aggiornare l'impostazione heap modificando la riga seguente:
-Xmx512m
Ad esempio: la riga precedente imposta l'heap massimo per l'agente su 512 MB.
Per modificare l'heap a 800 MB, aggiornare la riga precedente in modo che sia:
-Xmx800m
- Salvare il file e riavviare l'agente per rendere effettive le modifiche.
Risoluzione dei problemi: il Management Agent OCI non si avvia su un host Windows
Possibile causa: se l'agente viene avviato e non riesce con il seguente errore, ciò potrebbe essere dovuto al fatto che l'aggiornamento automatico del Management Agent non è riuscito. Potrebbero essere visualizzati gli errori seguenti.
C:\Oracle\mgmt_agent\agent_inst\log>NET START mgmt_agent
The Oracle Management Agent service is starting...................
The Oracle Management Agent service could not be started.
A service specific error occurred: 1.
More help is available by typing NET HELPMSG 3547.
In questo file di log, C:\Oracle\mgmt_agent\agent_inst\log\mgmt_agent.log
potrebbe essere visualizzato il seguente errore.
[SysExecutor.0 (PrometheusEmitter.Agent-discovery)-131] INFO - DiscoveryItemTask PrometheusEmitter.Agent-discovery - autoPromote
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Cleaning up old files...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - On windows, skipping file owner check
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Starting agent upgrade from version [231002.2039] to version [231002.2040]...
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Inserted RequestSigner associated with request SigningRequester[get([])] for signingKey:SigningKey[xxxxxxxxxxxx]
[SysExecutor.1 (ManagedAgent upgradechecker)-133] INFO - Package Stream size:99003892
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully unzipped agent upgrade package at:
C:\Oracle\mgmt_agent\zip\unpack
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully copied C:\Oracle\mgmt_agent\agent_inst\bin\agentUpgrader.bat to
C:\Oracle\mgmt_agent\agent_inst\bin\tmpAgentUpgrader.bat
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Successfully deleted previous wrapper backup file:
C:\Oracle\mgmt_agent\agent_inst\config\wrapper.conf.backedUpForUpgrade
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Backed up wrapper.conf to attempt agent upgrade
[SysExecutor.1 (ManagedAgentupgrade checker)-133] INFO - Built macros for processing wrapper.conf as:{%SERVICE_TYPE%=mgmt_agent,%JAVA_HOME%=c:\Program
Files\Java\jre-1.8,%EMSTATE%=C:\Oracle\mgmt_agent\agent_inst, %CORE_JAR%=agent-upgrader-1.0.3235.jar,%VERSION%=231002.2039,
%ORACLE_HOME%=C:\Oracle\mgmt_agent\231002.2039}
[SysExecutor.1 (ManagedAgent upgrade checker)-133] INFO - Processed wrapper.conf.template to point it to agent upgrader
[SysExecutor.1(ManagedAgent upgrade checker)-133] INFO - Exiting for wrapper to spin up the agent upgrader...
Azione: per risolvere il problema, effettuare le operazioni riportate di seguito.
- Arrestare il Management Agent nell'host Windows, quindi immettere i comandi riportati di seguito.
NET STOP mgmt_agent cd C:\Oracle\mgmt_agent\agent_inst\config Backup wrapper.conf Rename wrapper.conf.backedUpForUpgrade to wrapper.conf
- Avviare il servizio del Management Agent.
- Aggiornare Management Agent (vedere Aggiornamento manuale di Windows).
Dopo l'aggiornamento, l'agente viene visualizzato come Attivo in Observability & Management.
Risoluzione dei problemi: l'aggiornamento automatico del Management Agent non funziona o alcuni agenti sono stati saltati
Possibile causa: se l'upgrade automatico del Management Agent OCI non funziona per alcuni Management Agent, è possibile che l'upgrade automatico del Management Agent abbia smesso di funzionare perché alcuni file o directory erano di proprietà di proprietari non validi nel file system dell'agente.
Ad esempio, se alcuni file o directory della seguente posizione non disponevano delle autorizzazioni corrette, l'aggiornamento automatico dell'agente non funzionava: /opt/oracle/mgmt_agent/agent_inst
.
In questo file di log è possibile che venga visualizzato il seguente errore: /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/db00_cred.json,
/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.backup]
(ManagedAgent upgrade checker)-32] WARN - Files with invalid owners were found, skipping auto-upgrade
Azione: nell'host del Management Agent, confermare nel file system dell'agente, tutti i file e le directory sono di proprietà del proprietario mgmt_agent
e del gruppo mgmt_agent:mgmt_agent
in modo che l'upgrade automatico del Management Agent possa essere completato.
Risoluzione dei problemi: l'indirizzo IP visualizzato nella colonna host quando Management Agent è installato nell'host Windows
Problema: il Management Agent viene installato su un host Windows e la console del Management Agent visualizza l'indirizzo IP dell'host Windows nella console di Oracle Cloud anziché visualizzare il nome di dominio completo o il nome host di Windows.
- Eseguire il login all'host Windows e aprire il pannello di controllo.
- Selezionare Sistema e sicurezza, quindi selezionare Sistema.
- Passare alla sezione Impostazioni nome computer, dominio e gruppo di lavoro, quindi fare clic su Modifica impostazioni.
Viene visualizzata la finestra Proprietà di sistema.
- Se non è selezionato, fare clic su Nome computer.
- Andare al seguente messaggio: Per rinominare il computer o il relativo dominio o gruppo di lavoro, fare clic su Modifica.
- Selezionare Modifica, quindi viene visualizzata la finestra Modifiche nome computer/dominio.
Ad esempio, se il nome FQDN dell'host Windows è:
FOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.com
, immettere il nome host Windows breveFOOBAR004
nella casella di testo Nome computer. - Selezionare Altro, vengono visualizzate la finestra Suffisso DNS e NetBIOS Nome computer.
- Nella casella di testo Suffisso DNS primario di questo computer, immettere il nome DNS dell'host Windows.
Ad esempio:
subnet1ab2regsu.exampletenantreg1.abcvcn.com
- Selezionare OK o Applica, quindi chiudere tutte le finestre aperte.
- Riavviare l'host di Windows.
- Disinstallare il Management Agent esistente eseguendo lo script uninstaller.bat dal terminale Windows.
- Installare nuovamente Management Agent sul computer Windows.
L'installazione di Management Agent deve essere completata e nella colonna host verrà visualizzato il nome FQDN della pagina Agente dell'host Windows.
Risoluzione dei problemi: installazione di Management Agent non riuscita su SELinux quando si utilizza il volume esterno
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc: denied { read open } for pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0 tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0
Tutti i messaggi di errore sopra riportati indicano che SELinux non consente di eseguire comandi nella cartella scelta.
Azione: contattare l'amministratore del sistema e creare i criteri necessari che consentono di installare ed eseguire il Management Agent.
Risoluzione dei problemi: installazione del Management Agent non riuscita su Red Hat Enterprise Linux 9.x
L'installazione di Management Agent non riesce e potrebbe essere visualizzato il seguente messaggio di errore: mgmt_agent service creation failed. Reason: Detected Linux
.
Inoltre, i messaggi del log degli errori di installazione possono confermare l'errore e indicare che i tentativi di configurazione utilizzano un service manager non corretto per installare l'agente.
Causa: Red Hat ha rimosso il package chkconfig
nella distribuzione Red Hat Enterprise Linux (RHEL) 9. Per ulteriori dettagli, vedere la Red Hat Knowledge base.
Azione:
- Verificare che l'ambiente utilizzi Red Hat Enterprise Linux 9.x eseguendo il seguente comando:
$ cat /etc/redhat-release Red Hat Enterprise Linux release 9.3 (Plow)
- I messaggi riportati di seguito evidenziano il problema che il sistema operativo/famiglia non è stato identificato correttamente utilizzando le regole presenti nello script agentcore e l'installazione tenterà di impostare il servizio agente utilizzando
init.d
e nonsystemctl
su RHEL 9x.$ rpm -ivh oracle.mgmt_agent.231118.1208.Linux-x86_64.rpm Verifying... ################################# [100%] Preparing... ################################# [100%] Checking pre-requisites Checking if any previous agent service exists Checking if OS has systemd or initd Checking available disk space for agent install Checking if /opt/oracle/mgmt_agent directory exists Checking if 'mgmt_agent' user exists 'mgmt_agent' user already exists, the agent will proceed installation without creating a new one. Checking Java version Trying /omc/java/jdk1.8.0_391 Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java Checking agent version Updating / installing... 1:oracle.mgmt_agent-231118.1208.1################################# [100%] Executing install Unpacking software zip Copying files to destination dir (/opt/oracle/mgmt_agent) Initializing software from template Checking if JavaScript engine is available to use Creating 'mgmt_agent' daemon mgmt_agent service creation failed. Reason: Detected Linux: Installing the mgmt_agent daemon... ln: failed to create symbolic link '/etc/init.d/mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_agent': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_agent': No such file or directory Service not installed. warning: %post(oracle.mgmt_agent-231118.1208-1.x86_64) scriptlet failed, exit status 1
- Verificare che il pacchetto
chkconfig
non sia presente, come descritto nel seguente articolo della base di conoscenza di Red Hat.
Soluzione 1: installare il pacchetto chkconfig
- Installare il pacchetto mancante eseguendo il seguente comando:
$ dnf install chkconfig
- Verificare che il pacchetto esista nell'ambiente eseguendo il seguente comando:
$ rpm -qa | grep chkconfig
- Installare di nuovo il Management Agent.
Soluzione 2 - Senza installare il pacchetto chkconfig
Questa è una soluzione alternativa. Utilizzare questa soluzione solo se il pacchetto
chkconfig
non può essere installato. La soluzione consigliata è installare il pacchetto chkconfig
.
Se l'installazione del pacchetto chkconfig
non è un'opzione come descritto nella sezione precedente della soluzione 1, completare i seguenti passaggi come soluzione alternativa per installare il software Management Agent.
- Passare a una shell root.
- Impostare la variabile di ambiente
DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
. - Installare il software del Management Agent.
$ sudo /bin/bash
$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
# RPM install
$ rpm -ivh <rpm_file_name.rpm>
# ZIP install
$ ./installer.sh <full_path_of_response_file>
Risoluzione dei problemi: l'installazione di Management Agent non riesce nel valore RUN_AGENT_AS_USER previsto per Linux come root
Se si installa l'agente e viene visualizzato il seguente errore, è necessario modificare le autorizzazioni per l'utente che installa l'agente.
rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpm
Preparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is root
Current user group is rootroot is not the default user, checking if required environment variables are set
RUN_AGENT_AS_USER=mgmt_agent contains an unexpected value
Expected RUN_AGENT_AS_USER value to be root, exiting
error: %pre(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
error: oracle.mgmt_agent-240229.1733-1.x86_64: install failed
Soluzione:
- Impostare la variabile d'ambiente
RUN_AGENT_AS_USER
come root aggiungendo quanto segue alla configurazione dell'ambiente in uso:export RUN_AGENT_AS_USER=root export AGENT_USER_GROUP=<OS_primary_group_of_selected_OS_user>
- Installare l'agente utilizzando il comando seguente:
rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm
Per ulteriori informazioni, vedere Utilizzare un utente del sistema operativo non predefinito per installare Management Agent.
Risoluzione dei problemi: accesso allo script non riuscito utilizzando un percorso assoluto. Autorizzazioni insufficienti
Se si verifica il seguente errore, è possibile modificare le autorizzazioni per risolvere i problemi.
Copying files to destination dir (/opt/oracle/mgmt_agent)Initializing software from templateChecking if JavaScript engine is available to useCreating mgmt_agent daemonmgmt_agent service creation failed. Reason: Failed to access the script using an
absolute path. Insufficient permissions may prevent the user "mgmt_agent" from traversing
one of the folders. Please check the following permissions
Soluzione: è possibile configurare la directory /opt/oralce
con 755 autorizzazioni per consentire l'accesso al programma di installazione dell'agente.
Risoluzione dei problemi: tentativo di registrazione cloud non riuscito con stato HTTP 407, credenziali Gateway Server errate
Se si installa Management Agent e l'esecuzione di CloudRegistrationStep
non riesce con il seguente errore HTTP Status 407
, le credenziali GatewayServerUser o GatewayServerPassword potrebbero essere errate.
CloudRegistrationStep: The registration attempt failed with HTTP Status 407
Additional details are available in the configure logs at /opt/oracle/mgmt_agent/configure-logs
Soluzione: generare una nuova chiave di risposta con i valori corretti per GatewayServerUser e GatewayServerPassword, quindi per verificare i dettagli corretti di Gateway Server, riprovare a installare l'agente.
Risoluzione dei problemi: l'installazione dell'agente non riesce JAVA_HOME non è impostata per l'interruzione dell'installazione dell'agente
Quando si installa l'agente, se si verifica il seguente errore, durante l'installazione la posizione della home java non è stata trovata.rpm -ivh oracle.mgmt_agent.240229.1733.Linux-x86_64.rpmPreparing...################################# [100%]
Checking pre-requisites
Checking available disk space for agent upgrade
Current agent run-as-user is rootCurrent user group is rootroot is not the default user, checking if required environment variables are set
Checking agent version
Updating / installing...
1:oracle.mgmt_agent-240229.xxxx-1################################# [100%]
Failed to get unit file state for mgmt_agent.service: No such file or directory
Executing install
JavaHome is not set aborting agent install
warning:%post(oracle.mgmt_agent-240229.1733-1.x86_64) scriptlet failed, exit status 1
Azione:
- Nel file di risposta, impostare il parametro
JAVA_HOME
aggiungendo quanto segue:export JAVA_HOME=path/to/jdk/directory
- Installare l'agente eseguendo il comando seguente.
rpm -ivh oracle.mgmt_agent.<Agent Version>.Linux-x86_64.rpm
Risoluzione dei problemi: impossibile visualizzare lo spazio di nomi e le metriche Prometheus nel servizio di monitoraggio OCI
In OCI Console, se i criteri necessari vengono impostati correttamente e lo spazio di nomi e le metriche Prometheus non sono visibili da OCI Monitoring in Metric Explorer, potrebbe essere necessario confermare che l'utente del sistema operativo mgmt_agent disponga delle autorizzazioni di lettura per il file .properties
.
.properties
. Questo file può essere di proprietà dell'utente root del sistema operativo e dispone di 600 autorizzazioni.
agent_inst/discovery/PrometheusEmitter/compute_exporter.properties
- Verificare che il file
.properties
inagent_inst/discovery/PrometheusEmitter
sia di proprietà dell'utente del sistema operativo mgmt_agent e che l'utente del sistema operativo mgmt_agent disponga delle autorizzazioni di lettura per questo file. - Riavviare il Management Agent OCI.
Risoluzione dei problemi: flag fornito ma non definito
Errore: se viene visualizzato il seguente errore: flag fornito ma non definito: -trusted-certs-dir
$ sudo -u oracle-cloud-agent /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent -cli -trusted-certs-dir=/tmp/trustedcerts
flag provided but not defined: -trusted-certs-dir
Usage of /usr/libexec/oracle-cloud-agent/plugins/oci-managementagent/oci-managementagent:
-agent-config string
agent config yml file
-cli
run the monitoring in cli mode
-debug
enable debug logging
-dev
enable dev runs
-force-redeploy
force redeploy image
-metadata-config string
metadata config json file
-oci-config string
oci config file
-staging
enable staging endpoint
-upgrade-native-agent
invoke native agent upgrade
Risoluzione dei problemi: impossibile aggiungere le credenziali SSH con errore: carattere non racchiuso tra virgolette non valido
Possibile causa: quando si aggiungono credenziali di origine a un agente, se viene visualizzato il seguente errore di carattere non racchiuso tra virgolette, il formato del file JSON non è corretto. Ad esempio, se la chiave SSH viene visualizzata come più righe, la chiave SSH potrebbe non essere riconosciuta e l'errore di carattere non racchiuso tra virgolette non valido. Ad esempio:
[root@host ociagent]# cat 2nd.json | sudo -u mgmt_agent
/opt/oracle/mgmt_agent/agent_inst/bin/credential_mgmt.sh -o upsertCredentials -s
logancom.fasterxml.jackson.databind.JsonMappingException: Illegal unquoted character ((CTRL-CHAR,
code 10)): has to be escaped using backslash to be included in string valueat [Source: (BufferedInputStream); line: 7, column: 70] (through reference chain:
oracle.polaris.core.source.metadata.impl.creds.CredentialFormat["properties"]->java.lang.Object[][1]->oracle.polaris.core.source.metadata.impl.creds.CredentialFormat$Property["value"])at
com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:402)at
com.fasterxml.jackson.databind.JsonMappingException.wrapWithPath(JsonMappingException.java:361)at
- Aggiungere il carattere speciale
\n
prima di ogni riga della chiave. Ad esempio:{"source":"host.myvm.example.com", "name":"OSCreds", "type":"SSHKeyCreds", "description":"SSH keys for a user", "properties":[ {"name":"SSHUserName","value":"username"}, {"name":"SSHPrivateKey","value":"-----BEGIN RSA PRIVATE KEY-----\n<private-key-value> \n-----END RSA PRIVATE KEY-----"}, {"name":"SSHPublicKey","value":"-----BEGIN PUBLIC KEY-----\n<public-key-value> \n<public-key-value> \n-----END PUBLIC KEY-----"]}
- In alternativa, aggiungere il valore chiave completo in un'unica riga.
Ora, il formato JSON è corretto ed è possibile riprovare l'operazione per aggiungere le credenziali di origine.
Possibile causa: se durante l'installazione dell'agente viene visualizzato il seguente errore, è possibile che sia presente un componente di rete che inserisce i propri certificati. In alternativa, se si verifica un errore durante l'installazione dell'agente e la connessione avviene tramite un proxy, è possibile che il proxy in uso inietti un certificato personalizzato. Sarà necessario consultare l'amministratore per ottenere il certificato personalizzato e seguire i passi riportati di seguito.
PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException
Soluzione: per risolvere uno di questi problemi, è possibile effettuare le operazioni riportate di seguito.
- Fornire certificati personalizzati durante l'installazione dell'agente, vedere Importa certificati o Aggiorna certificati.
- Nel file delle chiavi di risposta, aggiungere il parametro
importTrustedCertsDirectory
incluso il percorso. Per informazioni, vedere l'esempio seguente e vedere Configurare un file di risposta.
importTrustedCertsDirectory=/tmp/crt
Risoluzione dei problemi: impossibile installare Oracle Management Agent nell'istanza di Windows
Quando si installa l'agente su un host Windows, se il JDK supportato non esiste e esiste un JDK che utilizza una versione Java diversa, ad esempio 1.8.0_51
, l'installazione del Management Agent non riesce sullo stesso host con il seguente errore:
C:\Users\abc\Downloads\Latest-agent> .\installer.bat
C:\Users\abc\Downloads\Latest-agent\Windows-input.rsp
64 bit Windows OS found.
Checking pre-requisites
Checking if previous agent service exists
Checking if C:\Oracle\mgmt_agent\agent_inst directory exists
Checking Java version
"Agent only supports 64 bit and 32 bit JDK 8 (with a minimum upgrade version JDK 8u281).
Please set your preferred path in JAVA_HOME"
Soluzione: per correggere questo problema, procedere come segue.
- Scaricare il JDK in un formato di archivio compresso .zip.
- Estrarre il file JDK.zip in una directory dell'host Windows.
- Installare l'agente e specificare il valore JAVA_HOME che punta alla directory.
Risoluzione dei problemi: quando si installa Management Agent e si vedono messaggi di timeout della connessione di rete
http://Example.example.com:4480->https://management-agent.us-ashburn-1.oci.oraclecloud.com:443 : Connection timed out Read failed)
Quindi è probabile che il management agent non possa raggiungere i servizi Oracle Cloud Infrastructure. Soluzione:
Verificare le regole di configurazione di rete e confermare che il Management Agent può connettersi ai servizi OCI dalla virtual machine su cui è installato il Management Agent. Se hai una configurazione firewall o NAT, conferma che consente la comunicazione in uscita sugli indirizzi IP consigliati da OCI, per ulteriori informazioni consulta gli intervalli di indirizzi IP per i servizi distribuiti in Oracle Cloud Infrastructure.
Risoluzione dei problemi: CloudRegistrationStep: tentativo di registrazione non riuscito con stato HTTP 401 (le informazioni necessarie per completare l'autenticazione non sono state fornite o non sono corrette)
Causa: questo problema può verificarsi a causa di una chiave di risposta non valida o errata.
Azione: assicurarsi di disporre di una chiave valida. Per ulteriori informazioni, vedere Gestisci chiavi di installazione.
Troubleshoot: "code": "NotAuthenticated","message": "The required information to complete authentication was not provided or was incorrect.
Causa: questo problema può verificarsi a causa di una chiave di risposta scaduta.
Azione: assicurarsi di disporre di una chiave valida. Per ulteriori informazioni, vedere Gestisci chiavi di installazione.
Risoluzione dei problemi di disinstallazione dei Management Agent
Questo argomento descrive i problemi tipici e le relative risoluzioni correlati alla disinstallazione degli Oracle Management Agent.
Errore:... specifica più pacchetti
Causa: il registro rpm dispone di più package con il nome specificato.
--allmatches
quando si esegue il comando rpm -e
:
rpm -e oracle.mgmt_agent --allmatches
Errore: scriptlet non riuscito con codice di uscita
Causa: rpm non è stato in grado di arrestare l'agente in esecuzione o di rimuovere il file del servizio agente dal sistema.
- Controlla se il tuo agente è in esecuzione:
Per OL7:
systemctl status mgmt_agent
Per OL6:
Se l'agente è in esecuzione, arrestarlo:/sbin/initctl status mgmt_agent
Per OL7:
systemctl stop mgmt_agent
Per OL6:
/sbin/initctl stop mgmt_agent
- Rimuovere rpm eseguendo
rpm -e oracle.mgmt_agent --noscripts
. Questo comando salterà tutti gli script rpm e tenterà di rimuovere il pacchetto dal registro. - Rimuovere tutti i file dell'agente eseguendo
rm -rf /opt/oracle/mgmt_agent
. Eseguire anche quanto segue:Per OL7:
rm -rf /etc/systemd/system/mgmt_agent.service
Per OL6:
rm -rf /etc/init/mgmt_agent.conf
Risolvere i problemi di aggiornamento del Management Agent
Quando si aggiorna Oracle Management Agent, è possibile utilizzare la lista riportata di seguito per risolvere gli errori comuni.
Risoluzione dei problemi: l'aggiornamento automatico è abilitato, ma l'agente non viene aggiornato automaticamente a causa del proprietario del file non valido
Causa: è possibile configurare i Management Agent per eseguire l'upgrade automatico. L'opzione di upgrade automatico è disponibile a livello di tenancy, pertanto se si seleziona l'opzione di upgrade automatico nella console di Oracle Cloud, tutti gli agenti nella tenancy OCI eseguiranno l'upgrade automatico. L'aggiornamento automatico dell'agente potrebbe richiedere fino a 24 ore dopo la disponibilità di una nuova versione dell'agente in Management Agent Cloud Service.Se la versione dell'agente non viene aggiornata dopo 24 ore di attesa, alcuni problemi sul disco potrebbero impedire l'aggiornamento automatico dell'agente.
La causa più comune di questo errore è che i file sono di proprietà di un utente del sistema operativo diverso dall'utente che ha installato Management Agent. Il processo di aggiornamento viene eseguito come lo stesso utente del sistema operativo del processo in esecuzione corrente e non ha la possibilità di passare alla radice. Qualsiasi file nella directory mgmt_agent
creato manualmente dall'utente può interferire con la capacità dell'agente di eseguire l'aggiornamento automaticamente.
mgmt_agent.log
si trova nelle seguenti posizioni:
- Per il Management Agent standalone:
/opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
- Per il plugin Management Agent su Oracle Cloud Agent (OCA) nelle istanze di OCI Compute:
/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log
Nel file
mgmt_agent.log
, è possibile che venga visualizzato il seguente errore che indica i file problematici:2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] ERROR - Following files are owned by invalid owners: [/opt/oracle/mgmt_agent/agent_inst/config/emd.properties.oldbackup] 2024-08-14 18:13:31,857 [SysExecutor.7 (ManagedAgent upgrade checker)-36] WARN - Files with invalid owners were found, skippingauto-upgrade
- L'utente deve modificare la proprietà e il gruppo dei file interessati nell'account utente che originariamente ha installato Management Agent.
- Se è stato creato un file con il proprietario errato, è possibile eliminare il file o spostarlo in un'altra directory esterna alla directory di Management Agent. A seconda dell'installazione, è possibile trovare la directory Management Agent in una delle posizioni riportate di seguito.
- Per il Management Agent standalone:
/opt/oracle/mgmt_agent/
- Per il plugin Management Agent per un agente Oracle Cloud in un'istanza di OCI Compute:
/var/lib/oracle-cloud-agent
Nota
Per evitare questi problemi, non creare manualmente alcun file nella directory Management Agent. - Per il Management Agent standalone:
Risoluzione dei problemi relativi ai Management Agent nelle istanze di computazione
Gli utenti possono riscontrare vari errori durante la distribuzione di Oracle Management Agent nelle istanze di computazione. Di seguito sono elencate le cause e le azioni consigliate per alcuni errori comuni.
- Risoluzione dei problemi: lo stato dell'agente è 'Non disponibile'
- Risoluzione dei problemi: impostazione del Management Agent non riuscita con fork/exec oracle.polaris.oca.main: autorizzazione negata
- Risoluzione dei problemi: errore di autenticazione del Management Agent a causa del disallineamento del clock, un'ora diversa nell'istanza di computazione rispetto all'ora sul server
- Risoluzione dei problemi: servizio Management Agent OCI: agente non visibile nella console OCI in osservabilità e gestione
Risoluzione dei problemi: l'agente si trova nello stato Non disponibile e il file di log dell'agente riporta "Tag non valide"
La pagina Management Agent mostra l'agente in stato 'Non disponibile' e il file mgmt_agent.log
(situato nella directory <Agent_Inst>/logs
) riporta il seguente messaggio:
ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s). Aggiungere un valore a ciascuna delle seguenti definizioni di tag: \nGLOBAL.ComponentType, GLOBAL.ApplicationName,
Causa:
Questo problema può verificarsi quando il compartimento richiede tag obbligatorie per ogni risorsa e la richiesta di creazione della risorsa non include le tag, quindi la richiesta di attivazione non riuscirà con il messaggio:"Tag non valide: creazione della risorsa non riuscita perché la risorsa richiede valori di tag" e lo stato dell'agente viene visualizzato come 'Non disponibile'.
Azione:
- Management Agent
Se si dispone di un Management Agent standalone, è necessario disinstallarlo.
Se il Management Agent è stato installato utilizzando un RPM o un file ZIP, è necessario disinstallarlo e reinstallarlo fornendo un file di risposta utilizzando il parametro
DefinedTags
come descritto nella sezione Rivedi parametri agente. - Management Agent nelle istanze di calcoloSe il Management Agent viene abilitato mediante OCI Console mediante il plugin OCA, non esiste alcun file di risposta poiché non viene utilizzato per le istanze di computazione. In questo caso:
- Eseguire il login all'istanza in cui viene distribuito Management Agent e sudo come utente
oracle-cloud-agent
utilizzando il comando seguente:sudo -u oracle-cloud-agent sh
- Creare un file
agent.definedtags
nella seguente posizione:/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/
- Aggiungere le tag definite necessarie per la creazione della risorsa nel file
agent.definedtags
.Ad esempio, se sono presenti 2 spazi di nomi
admin_namespace
efinance_namespace
e ogni spazio di nomi utilizza 2 chiavi e 2 valorienvironment_type=non-prod
,sensitivity=restricted
, è possibile utilizzare quanto segue:DefinedTags = [{"admin_namespace": {"environment_type": "non-prod", "sensitivity": "restricted"}, "finance_namespace": {"environment_type": "non-prod","sensitivity": "restricted"}}]
- Riavviare oracle-cloud-agent utilizzando il comando:
sudo systemctl restart oracle-cloud-agent
- Eseguire il login all'istanza in cui viene distribuito Management Agent e sudo come utente
Risoluzione dei problemi: impostazione del Management Agent non riuscita con fork/exec oracle.polaris.oca.main: autorizzazione negata
Gli utenti possono riscontrare questo errore che causa l'impossibilità di installare o avviare il Management Agent.
Il messaggio di errore visualizzato nella vista Plugin dell'istanza di computazione per il plugin Management Agent è simile al seguente:
workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
Causa possibile:
Questo problema può verificarsi quando un'istanza di computazione non consente le operazioni di fork/esecuzione dalla directory /tmp
attivando tmpfs
con il flag noexec
.
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)
L'output deve indicare il flag noexec.
Azione:
- Arrestare l'agente Oracle Cloud.
sudo systemctl stop oracle-cloud-agent
- Aggiungere la seguente impostazione al file: /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
overrideTmpDir: true
- Avviare l'agente Oracle Cloud.
$ sudo systemctl start oracle-cloud-agent
Risoluzione dei problemi: errore di autenticazione del Management Agent a causa del disallineamento del clock, un'ora diversa nell'istanza di computazione rispetto all'ora sul server
Causa: se tra l'istanza di computazione in cui è in esecuzione l'agente e il servizio Oracle Cloud Infrastructure Identity è presente un disallineamento di clock di più di 5 minuti, le richieste verranno rifiutate con un protocollo HTTP 401.
Se vengono rilevati i seguenti errori:Nell'istanza di OCI Compute, andare alla scheda Agente Oracle Cloud e il Management Agent visualizza un errore nella colonna Messaggio:
rpc error: code = Unavailable desc = connection error: desc = "transport: error while
dialing: dial unix /var/lib/oracle-cloud-agent/tmp/plugin1825606937: connect: connection
refused"
Oppure nei log potresti trovare il seguente errore:
2022-12-09 07:41:22,144 [SysExecutor.0 (Resource Principal Token Refresher)-47] WARN - #-# invocation access log [request-id-prefix: K9YBE4AY] #-#
Service: OCI
Method: GET
Path: /20200202/managementAgents/ocid1.managementagent.....rvf6i3ba/resourcePrincipalToken
Headers:opc-rpt-request-token=********************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************
date=Fri, 09 Dec 2022 07:41:19 GMT
host=management-agent.ap-tokyo-1.oci.oraclecloud.com
Authorization=******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************
opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO
User-Agent=Jersey/2.34 (Apache HttpClient 4.5.13)Attempts:
<--> Endpoint: management-agent.ap-tokyo-1.oci.oraclecloud.com
opc-request-id: K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO
StartTime: 2022-12-09 07:41:19,976 GMT
Status: 401 Unauthorized
Headers: X-Content-Type-Options=nosniff
Content-Length=187
opc-request-id=K9YBE4AYQFIMP2J6HGQ2JUKU1IJPFYVO/E4356B68C6C541BAD867E46760316D35/4118B130EE46A8E25F90DC91AB7F12D7
Date=Fri, 09 Dec 2022 07:41:21 GMT
Content-Type=application/json
ErrorBody:
{
"code" : "NotAuthenticated",
"message" : "Unable to authenticate the request for ocid1.managementagent.oc1.ap-tokyo-1.amaaaa...6frjnrbvqrvf6i3ba"}
Azione
Correggere il disallineamento dell'orologio e riavviare. Se l'agente è rimasto inattivo per giorni a causa di questo errore, è necessario eseguire il cleanup del file donotrestart
prima di riavviare l'agente.
Inoltre, Oracle consiglia di impostare la data/ora del sistema operativo per la sincronizzazione automatica con i server NTP in modo da evitare tempi di inattività in futuro. Se sul computer sono in esecuzione servizi aggiuntivi, è consigliabile riavviare il computer dopo la modifica dell'ora in modo che i servizi possano essere reimpostati con il nuovo orario.
Per correggere la data/ora del sistema operativo in cui l'agente è in esecuzione e quindi riavviare l'agente, effettuare le operazioni riportate di seguito.
- Per arrestare l'agente eseguire il comando seguente:
sudo systemctl stop oracle-cloud-agent
- Correggere la data e l'ora.
- Eseguire il comando seguente per eliminare il file
configure.donotrestart
.sudo rm /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/configure.donotrestart
- Avviare l'agente.
sudo systemctl start oracle-cloud-agent
Risoluzione dei problemi: servizio Management Agent OCI: agente non visibile nella console OCI in osservabilità e gestione
Installazione di OCI Management Agent riuscita in un'istanza di computazione. L'agente è in esecuzione sull'host. Tuttavia, l'agente non viene visualizzato nella console di Oracle Cloud se si passa al menu Navigazione, si seleziona Osservabilità e gestione, si passa ai Management Agent e si seleziona Agenti.
Possibile causa: i compartimenti dell'istanza di computazione e della chiave di installazione dell'agente sono diversi.
- Arrestare e disinstallare il Management Agent nell'istanza di computazione.
- Crea chiave di installazione agente nello stesso compartimento dell'istanza di computazione.
- Usare questa nuova chiave di installazione appena creata e installare Management Agent.
Risoluzione dei problemi relativi ai gateway di gestione
Questo argomento descrive i problemi e le soluzioni comuni correlati ai gateway di gestione.
- Risoluzione dei problemi: Rimuovi Management Gateway
- Risoluzione dei problemi: Configura Management Gateway
- Risoluzione dei problemi: l'installazione di Management Gateway non riesce su Red Hat Enterprise Linux 9.x
- Risoluzione dei problemi: l'installazione di Management Gateway non riesce con l'errore: impossibile creare i certificati e il report dei log delle identità: autenticazione non riuscita: DATE_OUTSIDE_CLOCK_SKEW
- Risoluzione dei problemi: durante l'installazione o la configurazione di Management Gateway, si è verificato un errore di timeout
Risoluzione dei problemi: rimozione del gateway di gestione
Causa: in alcuni casi potrebbe essere necessario rimuovere un'installazione di Management Gateway esistente per reinstallarla.
-
Verificare se il gateway è in esecuzione:
Per OL7:
systemctl status mgmt_gateway
Per OL6:
/sbin/initctl status mgmt_gateway
Se il gateway è in esecuzione, arrestarlo:
Per OL7:
systemctl stop mgmt_gateway
Per OL6:
/sbin/initctl stop mgmt_gateway
-
Rimuovere l'RPM Gateway installato utilizzando il seguente comando:
rpm -e oracle.mgmt_gateway --noscripts
-
Rimuovere i file gateway rimanenti utilizzando il comando seguente:
rm -rf /opt/oracle/mgmt_agent
-
Eseguire il seguente codice:
For OL7: rm -rf /etc/systemd/system/mgmt_gateway.service
For OL6: rm -rf /etc/init/mgmt_agent.conf
Risoluzione dei problemi: Configura Management Gateway
Causa: in alcuni casi, il nome host potrebbe non essere risolto nell'ambiente di installazione che potrebbe causare l'errore dell'installazione con il seguente messaggio di errore:
Risoluzione dei problemi: "Impossibile risolvere il valore del nome host <hostname> nell'ambiente di installazione. Risolvere il nome host o fornire GatewayCertCommonName nel file di risposta ed eseguire di nuovo lo script di impostazione del gateway."
Azione:
- Controllare e risolvere il nome host dell'ambiente per ottenere il valore FQDN (Full Qualified Doamin Name) dopo l'esecuzione del comando:
hostname -f
- Facoltativamente, un utente può fornire un nome di dominio completamente qualificato personalizzato per la configurazione del gateway mediante il popolamento della proprietà
GatewayCertCommonName
nel file di risposta di input. Vedere Parametri file di risposta - Rieseguire lo script del gateway di configurazione.
sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Causa: in alcuni casi l'installazione di Management Gateway potrebbe non riuscire con il seguente messaggio di errore a causa dell'assenza di criteri in OCI o a causa di problemi di limite delle risorse nella tenancy. Se viene visualizzato il seguente errore, attenersi alla procedura riportata di seguito.
Risoluzione dei problemi: "Impossibile avviare Management Gateway perché non è stato possibile creare, inizializzare o recuperare i certificati in OCI. Per ulteriori dettagli, controllare i log."
Azione:
- Aprire il file di log nella directory di installazione di Management Gateway, ad esempio:
/opt/oracle/mgmt_agent/plugins/GatewayProxy/statedir/log/mgmt_gateway.log
- Se il file di log contiene uno dei seguenti 404 codici di errore, scegliere una delle seguenti opzioni per risolvere il problema:
2023-07-25 15:38:06.694/CEST [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String { "code" : "NotAuthorizedOrNotFound", "message" : "Authorization failed or requested resource not found."} 2023-07-25 15:38:06.696/CEST [pool-3-thread-1] ERROR com.oracle.mgmtagent.proxy.ProxyServer - Error while initializing and loading certificate bundlescom.oracle.mgmtagent.proxy.exception.CertificateFailureException: The response status is 404 after multiple retries at com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility.executeRequest(CertificateUtility.java:293) ~
- Opzione consigliata: utilizzare l'applicazione Management Gateway Quick Start Marketplace per creare automaticamente i gruppi dinamici, i criteri e gestire i certificati necessari per installare Management Gateway.
- I gruppi dinamici e i criteri corretti necessari per l'installazione di Management Gateway vengono aggiunti manualmente e confermati al compartimento specifico all'interno della tenancy in cui si desidera installare Management Gateway. Per ulteriori informazioni, vedere Eseguire i prerequisiti per la distribuzione di Management Gateway.
- Se il file di log contiene uno dei 400 codici di errore riportati di seguito, esaminare le opzioni riportate di seguito per risolvere il problema.
2023-09-20 18:51:32.772/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateCreationUtil - Create Vault Service Url invoked https://kms.us-ashburn-1.oraclecloud.com/20180608/vaults 2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Received response code 400 2023-09-20 18:51:33.400/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Header name opc-request-id , value /5704D03441842D3818B824B2D6B2712E/1D1FED893474FDA900188E24F3DEE59B 2023-09-20 18:51:33.401/GMT [pool-3-thread-1] INFO com.oracle.mgmtagent.proxy.oci.certificate.util.CertificateUtility - Response String { "code" : "LimitExceeded", "message" : "The limit for this tenancy has been exceeded."}
- Controllare il limite per la risorsa Conteggio vault predefinito per il servizio di gestione delle chiavi in OCI Console. È possibile inviare una richiesta per aumentare i limiti delle risorse. Per ulteriori informazioni, vedere Gestione delle chiavi e Gestione dei vault.
- È possibile impostare i certificati manualmente. Per i dettagli, vedere Eseguire i prerequisiti per la distribuzione di Management Gateway e andare alla sezione Gestione manuale dei certificati.
Nota
Quando si creano i certificati Emessi dalla CA interna , il profilo del certificato deve essere Server TLS o Client TLS e sono supportati solo gli algoritmi di firma RSA.
- In caso di altri errori correlati al vault o alle API del servizio di chiavi nei log, è possibile inviare una richiesta e contattare il team
oci_kms
fornendo il corpo della risposta eopc-request-id
. - In caso di altri errori relativi alle autorità di certificazione o alle API del servizio di certificazione nei log, inviare una richiesta e contattare il team
oci_certificates
fornendo il corpo della risposta eopc-request-id
.
Risoluzione dei problemi: installazione di Management Gateway non riuscita su Red Hat Enterprise Linux 9.x
L'installazione di Management Gateway non riesce e potrebbe essere visualizzato il seguente messaggio di errore:mgmt_gateway service creation failed. Reason: Detected Linux
.
Inoltre, i messaggi del log degli errori di installazione possono confermare l'errore e indicare che i tentativi di configurazione utilizzano un service manager errato per installare il gateway.
Causa: Red Hat ha rimosso il package chkconfig
nella distribuzione Red Hat Enterprise Linux (RHEL) 9. Per ulteriori dettagli, vedere la Red Hat Knowledge base.
Azione:
- Verificare che l'ambiente utilizzi Red Hat Enterprise Linux 9.x eseguendo il seguente comando:
$ cat /etc/redhat-release Red Hat Enterprise Linux release 9.3 (Plow)
- I messaggi riportati di seguito evidenziano il problema che il sistema operativo/famiglia non è stato identificato correttamente utilizzando le regole presenti nello script agentcore e l'installazione tenterà di impostare il servizio agente utilizzando
init.d
e nonsystemctl
su RHEL 9x.$ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm Verifying... ################################# [100%] Preparing... ################################# [100%] Checking pre-requisites Checking if any previous gateway service exists Checking if OS has systemd or initd Checking available disk space for gateway install Checking if /opt/oracle/mgmt_agent directory exists Checking if 'mgmt_agent' user exists 'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one. Checking Java version Trying /omc/java/jdk1.8.0_391 Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java Checking agent version Updating / installing... 1:oracle.mgmt_gateway-231118.1208.1################################# [100%] Executing install Unpacking software zip Copying files to destination dir (/opt/oracle/mgmt_agent) Initializing software from template Checking if JavaScript engine is available to use Creating 'mgmt_gateway' daemon mgmt_gateway service creation failed. Reason: Detected Linux: Installing the mgmt_gateway daemon... ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory Service not installed. warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
- Verificare che il pacchetto
chkconfig
non sia presente, come descritto nel seguente articolo della base di conoscenza di Red Hat.
chkconfig
- Installare il pacchetto mancante eseguendo il seguente comando:
$ dnf install chkconfig
- Verificare che il pacchetto esista nell'ambiente eseguendo il seguente comando:
$ rpm -qa | grep chkconfig
- Installare nuovamente Management Gateway.
chkconfig
Questa è una soluzione alternativa. Utilizzare questa soluzione solo se il pacchetto
chkconfig
non può essere installato. La soluzione consigliata è installare il pacchetto chkconfig
.
Se l'installazione del pacchetto chkconfig
non è un'opzione come descritto nella sezione Soluzione 1 sopra, completare i seguenti passaggi come soluzione alternativa per installare il software Management Gateway.
- Passare a una shell root.
- Impostare la variabile di ambiente
DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
. - Installare il software Management Gateway.
$ sudo /bin/bash
$ export DIST_LINUX_FAMILY_OVERRIDE="Red Hat"
# RPM install
$ rpm -ivh <rpm_file_name.rpm>
# ZIP install
$ ./installer.sh <full_path_of_response_file>
Risoluzione dei problemi: installazione del gateway di gestione non riuscita con errore: impossibile creare i certificati e il report dei log delle identità: autenticazione non riuscita: DATE_OUTSIDE_CLOCK_SKEW
Causa:
Autenticazione del report dei log delle identità non riuscita: DATE_OUTSIDE_CLOCK_SKEW
# /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<PATH>/gateway_agent.rsp/opt/oracle/mgmt_agent/agent_inst/bin/setupAgent.sh
opts=<PATH>/gateway_agent.rsp
Executing configure
Parsing input response file
Validating install key
Generating communication wallet
Generating security artifactsRegistering Management Gateway
Found service plugin(s):[GatewayProxy]
Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...Done.
GatewayProxy : Successfully deployed external plugin
Gateway setup completed and the gateway is running.
In the future gateway can be started by directly running: sudo systemctl start mgmt_gateway
Please make sure that you delete <PATH>/gateway_agent.rsp or store it in secure location.
Creating gateway system properties file
Creating properties fileCreating or validating certificates
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Waiting for Management Gateway to create or validate certificates...
Failed to start Management Gateway as certificates could not be created, initialized or retrieved in OCI. Please check the logs for more details.
Management Gateway stopped
Azione:
Nell'host in cui è installato Management Gateway, assicurarsi che l'ora dell'host sia corretta, quindi installare Management Gateway.
Risoluzione dei problemi: durante l'installazione o la configurazione di Management Gateway, si è verificato un errore di timeout
Se si verifica che OCI Console visualizzi Management Gateway come attivo, ma le metriche non vengono popolate.
/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
Starting gateway...
Gateway started successfully
Starting plugin deployment for: [GatewayProxy]
Deploying service plugin(s)...............Timed out.
Agent is unable to check if it deployed requested service plugin(s) successfully or not.
Please check back later on the console.
Causa: il tempo di completamento del task di impostazione di Management Gateway più lungo del previsto potrebbe causare un problema di comunicazione di rete e il timeout di Management Gateway.
- Conferma che non ci sono problemi di comunicazione di rete.
- Verificare se i seguenti dettagli proxy sono stati aggiornati nel file di risposta per determinare se esiste un problema proxy. Ad esempio, confermare che i dettagli corretti di host e porta proxy siano stati aggiornati nel file di risposta:
ProxyHost = my.proxyhost.com
ProxyPort = 80
- Arrestare Management Gateway utilizzando il comando seguente:
systemctl stop mgmt_gateway
- Eseguire nuovamente l'impostazione di Management Gateway utilizzando il comando seguente:
/opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp
- L'impostazione di Management Gateway deve essere completata correttamente e le metriche devono essere popolate.
Raccogli log Management Agent
Se è necessario inviare un ticket di supporto per coinvolgere il Supporto Oracle, è utile raccogliere i log del Management Agent e allegare i log al ticket di supporto. La posizione del log dipende dal modo in cui viene installato e abilitato il Management Agent.
Trova la posizione del log
È possibile .zip
o .tar
manualmente per tutti i file di log in una delle seguenti posizioni:
- Se è stato abilitato il plugin Management Agent utilizzando l'agente Oracle Cloud (OCA), è possibile trovare i log in questa posizione:
/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log
- Se è stato installato Management Agent utilizzando un grafico helm
.rpm, zip,
o un'immagine contenitore, la posizione di log predefinita è la seguente:/opt/oracle/mgmt_agent/agent_inst/log
Se l'agente è stato installato in Windows, le posizioni dei log dipendono dalla posizione in cui sono installati gli agenti. Le posizioni dei log si trovano in genere nella directory di installazione nella seguente posizione:
agent_inst/log
Crea un bundle di diagnostica
È possibile eseguire manualmente .zip
o .tar
per tutti i file di log nelle posizioni sopra indicate oppure generare un bundle di diagnostica.
L'agente deve essere in esecuzione e in buono stato per generare il bundle di diagnostica. Se la generazione dell'archivio di diagnostica non riesce, eseguire manualmente .zip
o .tar
tutti i file di log sopra menzionati.
È necessario creare questi archivi
.zip
o .tar
come utente del sistema operativo Management Agent in /tmp
o in un'altra directory esterna alla directory di installazione dell'agente.
Per generare un bundle di diagnostica:
- Per un plugin Management Agent che utilizza l'agente Oracle Cloud (OCA) utilizzare il comando seguente:
$ sudo -u oracle-cloud-agent /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/bin/generateDiagnosticBundle.sh
- Per un Management Agent installato utilizzando un'immagine scaricata, ad esempio un grafico helm .
rpm, .zip,
o un'immagine contenitore, è possibile utilizzare il comando seguente:$ sudo -u mgmt_agent /opt/oracle/mgmt_agent/agent_inst/bin/generateDiagnosticBundle.sh