Metriche di Oracle Cloud Infrastructure GoldenGate

Monitora lo stato, la capacità e le prestazioni complessive della distribuzione di Oracle Cloud Infrastructure GoldenGate utilizzando metriche, allarmi e notifiche. Nella console di Oracle Cloud è possibile monitorare le metriche nella pagina dei dettagli di distribuzione OCI GoldenGate o utilizzando Metrics Explorer.

Risorse: goldengate-deployments, goldengate-connections, goldengate-pipelines

Panoramica

Le metriche di Oracle Cloud Infrastructure GoldenGate ti aiutano a misurare la quantità di dati replicati tra i database di origine e di destinazione.

I termini riportati di seguito sono utili per la comprensione delle metriche.

  • Spazio di nomi: un contenitore per le metriche Oracle Cloud Infrastructure GoldenGate. Lo spazio di nomi per Oracle Cloud Infrastructure GoldenGate è oci_goldengate.
  • Metriche: il concetto fondamentale di telemetria e monitoraggio. Le metriche definiscono un set di datapoint serie temporale. Ogni metrica viene definita in modo univoco per spazio di nomi, nome della metrica, identificativo del compartimento, set di una o più dimensioni e unità di misura. A ogni datapoint sono associati un indicatore orario, un valore e un conteggio.
  • Dimensioni: una coppia chiave-valore che definisce le caratteristiche associate alla metrica. Ad esempio, resourceId, che è l'OCID di distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • Statistiche: aggregazioni di dati delle metriche in periodi di tempo specificati. Le aggregazioni vengono eseguite utilizzando lo spazio dei nomi, il nome della metrica, le dimensioni e l'unità di misura del datapoint nel periodo di tempo specificato.
  • Allarmi: utilizzato per automatizzare il monitoraggio e le prestazioni delle operazioni. Un allarme tiene traccia delle modifiche che si verificano in un determinato periodo di tempo. Esegue inoltre una o più azioni definite, in base alle regole definite per la metrica.

Prerequisiti

  • Criteri IAM: per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso ai servizi di monitoraggio e alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, confermare con l'amministratore il tipo di accesso concesso e il compartimento in cui si dovrebbe lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Monitoraggio o Notifiche.
  • Le metriche elencate in questa pagina sono automaticamente disponibili per qualsiasi distribuzione Oracle Cloud Infrastructure GoldenGate creata. Non è necessario abilitare il monitoraggio sulla risorsa per ottenere queste metriche.

Metriche disponibili

Nota

Assicurarsi di aggiornare la distribuzione alla versione più recente per utilizzare tutte le metriche disponibili.

Metriche replica dati

Le metriche di replica dei dati di Oracle Cloud Infrastructure GoldenGate includono le dimensioni riportate di seguito.

  • deploymentId: per tutte le metriche, deploymentId è l'OCID di distribuzione.
  • deploymentName: nome della distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • ExtractName: nome di un processo Extract nella distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • ReplicatName: nome di un processo Replicat nella distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • DistributionPathName: nome di un processo di percorso di distribuzione nella distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • ReceiverPathName: nome di un processo di percorso del destinatario nella distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • ageSeconds: età dell'heartbeat in secondi.
Metrica Descrizione metrica Dimensioni metrica Azioni consigliate
Nome: CpuUtilization

Nome visualizzato: utilizzo CPU

Percentuale d'uso totale della CPU per tutti i gruppi di consumer. Controllare l'utilizzo della CPU in caso di ritardo di Extract o Replicat.

deploymentId

deploymentName

Se l'utilizzo della CPU è elevato, è possibile:
  • Aggiungere OCPU alla distribuzione
  • Abilita scala automatica, se non è già abilitata
  • Controllare l'utilizzo dello storage e la dimensione del trail e rimuovere i file trail se elevato
Nome: OcpuConsumption

Nome visualizzato: Consumo OCPU

Numero totale di OCPU utilizzate dalla distribuzione.

Quando il conteggio è inferiore al numero minimo di OCPU, viene visualizzato il valore minimo.

Quando il numero di OCPU è maggiore del numero minimo, viene visualizzato il numero effettivo di OCPU utilizzate.

deploymentId

deploymentName

Se il consumo OPCU è elevato, è possibile:
  • Aggiungere OCPU alla distribuzione
  • Abilita scala automatica, se non è già abilitata
Nome: MemoryUtilization

Nome visualizzato: Utilizzo della memoria

Percentuale di memoria disponibile utilizzata.

La necessità di memoria è allineata alla dimensione dei dati replicati. Se viene allocata memoria sufficiente, ogni transazione aperta viene conservata in memoria finché non viene ricevuto un record di commit.

deploymentId

deploymentName

Se l'utilizzo della memoria è elevato, è possibile:
  • Aggiungere OCPU alla distribuzione
  • Abilita scala automatica, se non è già abilitata
Nome: DeploymentHealth

Nome visualizzato: stato di distribuzione generale

Stato generale in percentuale dei servizi di distribuzione.

Sono disponibili quattro servizi: Servizio di amministrazione, Servizio di distribuzione, Servizio ricevente e Servizio metriche delle prestazioni. Se tutti e quattro sono in buono stato, il punteggio previsto è 100%. Se l'integrità della distribuzione è del 50%, solo due servizi sono in buono stato.

deploymentId

deploymentName

Quando si creano percorsi Extract, Replicat, Distribution o Receiver, è possibile contrassegnare il processo come Critico per lo stato di distribuzione in Opzioni gestite. Se lo stato di distribuzione è >100%, controllare i processi contrassegnati come critici per lo stato di distribuzione.
Nome: DeploymentInboundLag

Nome visualizzato: ritardo in entrata distribuzione

Ritardo medio, in secondi, per tutti i flussi in entrata critici per lo stato della distribuzione

deploymentId

deploymentName

Non applicabile
Nome: DeploymentOutboundLag

Nome visualizzato: ritardo in uscita distribuzione

Ritardo medio, in secondi, per tutti i flussi in uscita critici per lo stato della distribuzione

deploymentId

deploymentName

Non applicabile
Nome: SwapSpaceUsage

Nome visualizzato: utilizzo spazio di swap

Percentuale di spazio di swap utilizzato dalla distribuzione.

Poiché OCI GoldenGate scrive solo le transazioni di cui è stato eseguito il commit nei file trail, tutte le transazioni di cui non è stato eseguito il commit vengono inserite nella cache in memoria. Cache utilizza sia la memoria fisica che lo spazio di swap (memoria virtuale). Lo spazio di swap si trova sui dischi rigidi per fornire memoria aggiuntiva quando la memoria fisica (RAM) è piena.

deploymentId

deploymentName

Se l'uso dello spazio di swap sta aumentando, prendere in considerazione l'aggiunta di OCPU aggiuntive alla distribuzione per aumentare la memoria fisica (RAM).
Nome: TempSpaceUsage

Nome visualizzato: uso dello spazio temporaneo

Percentuale di spazio temporaneo utilizzata dalla distribuzione.

Quando il totale dei dati delle transazioni inserite nella cache supera l'impostazione delle dimensioni della cache, Extract scrive i dati della cache nei file temporanei. È più efficiente per il sistema operativo scambiare su disco che per Extract scrivere file temporanei.

deploymentId

deploymentName

Se l'uso dello spazio temporaneo sta aumentando, prendere in considerazione l'aggiunta di OCPU aggiuntive alla distribuzione per aumentare la memoria fisica (RAM).
Nome: FileSystemUsage

Nome visualizzato:

Quantità di spazio file system (GB) utilizzato dalla distribuzione

deploymentId

deploymentName

Se l'uso del file system è elevato:
  • Controllare le dimensioni del file trail e rimuovere i file trail non necessari
  • Controllare l'uso dello spazio temporaneo per verificare se OCI GoldenGate è a corto di memoria fisica (RAM)
Nome: ExtractStatus

Nome visualizzato: stato estrazione

Percentuale di stato di un processo di estrazione nella distribuzione
  • 100% quando il processo è in esecuzione
  • 0% se il processo viene interrotto o interrotto

deploymentId

deploymentName

ExtractName

Se un processo di estrazione viene interrotto o interrotto, controllare nel file di report la causa principale o l'errore per risolvere il problema.
Nome: ReplicatStatus

Nome visualizzato: stato Replicat

Percentuale di integrità di un processo Replicat nella distribuzione
  • 100% quando il processo è in esecuzione
  • 0% se il processo viene interrotto o interrotto

deploymentId

deploymentName

ReplicatName

Se un Replicat viene arrestato o interrotto, controllare nel file di report Replicat la causa principale o l'errore per diagnosticare i problemi.
Nome: DistributionPathStatus

Nome visualizzato: stato del percorso di distribuzione

Percentuale di stato di un processo Percorso di distribuzione nella distribuzione
  • 100% quando il processo è in esecuzione
  • 0% se il processo viene interrotto o interrotto

deploymentId

deploymentName

DistributionPathName

In caso di sospensione o arresto, le possibili cause sono:

  • Modifica delle credenziali
  • Servizio di ricezione arrestato
  • Distribuzione della destinazione interrotta
Nome: ReceiverPathStatus

Nome visualizzato: stato percorso ricevente

Percentuale di stato di un processo Percorso destinatario nella distribuzione
  • 100% quando il processo è in esecuzione
  • 0% se il processo viene interrotto o interrotto

deploymentId

deploymentName

ReceiverPathName

Se lo stato del percorso del destinatario viene interrotto o interrotto:
  • Controlla modifiche nelle credenziali
  • Controllare lo stato della distribuzione di destinazione
  • Verifica la presenza di problemi di rete tra le distribuzioni di origine e destinazione
Nome: ExtractLag

Nome visualizzato: Ritardo estrazione

La differenza, in secondi, tra l'ora in cui l'estrazione ha elaborato un record (in base al clock di sistema) e l'indicatore orario di tale record nell'origine dati.

deploymentId

deploymentName

ExtractName

Se il ritardo di estrazione è elevato, effettuare le operazioni riportate di seguito.
  • Controllare l'utilizzo della CPU per verificare se la distribuzione ha esaurito le risorse
  • Controllare l'utilizzo della memoria per verificare se le risorse assegnate possono gestire la dimensione di estrazione
  • Se l'origine dati è un database in locale, controllare lo stato e la latenza della rete
  • Verificare la presenza di problemi relativi alle prestazioni con il database di origine
  • Controlla storage file system
Nome: ReplicatLag

Nome visualizzato: ritardo Replicat

La differenza, in secondi, tra l'ora di elaborazione dell'ultimo record (in base al clock di sistema) e l'indicatore orario del record nel trail.

deploymentId

deploymentName

ReplicatName

Se il ritardo Replicat è alto:
  • Controllare l'utilizzo della CPU e della memoria per verificare se la distribuzione ha esaurito le risorse
  • Controlla ritardo estrazione per eventuali problemi di latenza
  • Esamina il laboratorio sul percorso di distribuzione per individuare i problemi di latenza
  • Controllare la latenza di rete tra OCI GoldenGate e il database di destinazione. Il ping di andata e ritorno consigliato è di 5 ms o meno.
  • HANDLECOLLISIONS può causare problemi di prestazioni e non è consigliata per la replica di Change Data Capture (CDC)
Nome: DistributionPathLag

Nome visualizzato: Ritardo percorso di distribuzione

Ritardo medio, in secondi, di un processo Percorso di distribuzione nella distribuzione. Ad esempio, se le distribuzioni di origine e destinazione sono in esecuzione in due data center diversi, i problemi di latenza della rete potrebbero influire sul ritardo.

deploymentId

deploymentName

DistributionPathName

Non applicabile
Nome: ReceiverPathLag

Nome visualizzato: ritardo percorso ricevente

Ritardo medio, in secondi, del processo Percorso destinatario nella distribuzione

deploymentId

deploymentName

ReceiverPathName

Non applicabile
Nome: HeartbeatLag

Nome visualizzato: ritardo heartbeat

Ritardo della replica, in secondi, dall'endpoint di origine all'endpoint di destinazione.

ReplicatName

deploymentName

deploymentId

ageSeconds

Se il valore di Ritardo heartbeat è alto, effettuare le operazioni riportate di seguito.
  • Controllare l'utilizzo della CPU per verificare se la distribuzione ha esaurito le risorse
  • Controllare l'utilizzo della memoria per verificare se le risorse assegnate possono gestire la dimensione di estrazione
  • Se l'origine dati è un database in locale, controllare lo stato e la latenza della rete
  • Verificare la presenza di problemi relativi alle prestazioni con il database di origine
  • Controlla storage file system
  • Controlla ritardo estrazione per eventuali problemi di latenza
  • Esamina il laboratorio sul percorso di distribuzione per individuare i problemi di latenza
  • Controllare la latenza di rete tra OCI GoldenGate e il database di destinazione. Il ping di andata e ritorno consigliato è di 5 ms o meno.
  • HANDLECOLLISIONS può causare problemi di prestazioni e non è consigliata per la replica di Change Data Capture (CDC)

Metriche Stream Analytics

Le metriche di Stream Analytics di Oracle Cloud Infrastructure GoldenGate includono le seguenti dimensioni:

  • deploymentId: per tutte le metriche, deploymentId è l'OCID di distribuzione.
  • deploymentName: nome della distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • PipelineName: nome della pipeline.
  • component: processo runtime della pipeline, driver o esecutore.
Metrica Descrizione metrica Dimensioni metrica Azioni consigliate
Nome: PipelineHealth

Nome visualizzato: stato della pipeline

Percentuale di stato generale di una pipeline di Stream Analytics.
  • 100% quando una pipeline è in buona salute durante l'intervallo di tempo.
  • 0% quando la pipeline è in cattivo stato o non è in esecuzione durante l'intervallo di tempo.
  • Tra lo 0% e il 100% quando una pipeline è in cattivo stato e si sta riprendendo o sta per terminare entro l'intervallo di tempo e richiede attenzione.

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineProcessingRate

Nome visualizzato: tasso di elaborazione pipeline

Numero medio di eventi elaborati al secondo dalle pipeline nella distribuzione.

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineSchedulingDelay

Nome visualizzato: ritardo pianificazione pipeline

Ritardo medio della pianificazione in millisecondi (ms) di pipeline nella distribuzione.

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineTotalDelay

Nome visualizzato: ritardo totale pipeline

Ritardo totale medio in millisecondi (ms) delle pipeline nella distribuzione.

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineMemoryUsage

Nome visualizzato: utilizzo della memoria della pipeline

Uso della memoria in megabyte (MB) dei driver ed esecutori della pipeline nella distribuzione.

deploymentId

deploymentName

PipelineName

component

Non applicabile

Metriche pipeline

Le metriche della pipeline di Oracle Cloud Infrastructure GoldenGate possono includere le dimensioni riportate di seguito.

  • deploymentId: per tutte le metriche, deploymentId è l'OCID di distribuzione.
  • deploymentName: nome della distribuzione di Oracle Cloud Infrastructure GoldenGate.
  • PipelineName: nome della pipeline.
  • pipelineId: pipelineId è l'OCID della pipeline.
  • ProcessName: nome di processo generato dal sistema.
  • ageSeconds: età dell'heartbeat in secondi.
Metrica Descrizione metrica Dimensioni metrica Azioni consigliate
Nome: CpuUtilization

Nome visualizzato: utilizzo CPU

Percentuale d'uso totale della CPU per tutti i gruppi di consumer. Controllare l'utilizzo della CPU in caso di ritardo di Extract o Replicat.

deploymentId

deploymentName

Se l'utilizzo della CPU rimane elevato per un lungo periodo di tempo, contattare il Supporto Oracle.
Nome: MemoryUtilization

Nome visualizzato: Utilizzo della memoria

Percentuale di memoria disponibile utilizzata.

La necessità di memoria è allineata alla dimensione dei dati replicati. Se viene allocata memoria sufficiente, ogni transazione aperta viene conservata in memoria finché non viene ricevuto un record di commit.

deploymentId

deploymentName

Se l'utilizzo della CPU rimane elevato per un lungo periodo di tempo, contattare il Supporto Oracle.
Nome: OcpuConsumption

Nome visualizzato: Consumo OCPU

Numero totale di OCPU utilizzate dalla distribuzione.

Quando il conteggio è inferiore al numero minimo di OCPU, viene visualizzato il valore minimo.

Quando il numero di OCPU è maggiore del numero minimo, viene visualizzato il numero effettivo di OCPU utilizzate.

deploymentId

deploymentName

Se l'utilizzo della CPU rimane elevato per un lungo periodo di tempo, contattare il Supporto Oracle.
Nome: PipelineCaptureStatus

Nome visualizzato: stato acquisizione pipeline

Percentuale di stato di un processo di acquisizione (estrazione).

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineApplyStatus

Nome visualizzato: stato applicazione pipeline

Percentuale di stato di un processo Applica (Replicat).

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineCaptureLag

Nome visualizzato: Ritardo acquisizione pipeline

Ritardo medio, in secondi, di un processo di acquisizione (estrazione) nella distribuzione.

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineApplyLag

Nome visualizzato: ritardo applicazione pipeline

Ritardo medio, in secondi, di un processo Applica (Replicat) nella distribuzione.

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: PipelineHealth

Nome visualizzato: stato della pipeline

Percentuale di integrità complessiva dei servizi e dei processi pipeline sottostanti.
  • 100% quando una pipeline è in buona salute durante l'intervallo di tempo.
  • 0% quando la pipeline è in cattivo stato o non è in esecuzione durante l'intervallo di tempo.
  • Tra lo 0% e il 100% quando una pipeline è in cattivo stato e si sta riprendendo o sta per terminare entro l'intervallo di tempo e richiede attenzione.

deploymentId

deploymentName

PipelineName

Non applicabile
Nome: HeartbeatLag

Nome visualizzato: ritardo heartbeat

Ritardo della replica, in secondi, dall'endpoint di origine all'endpoint di destinazione.

pipelineId

pipelineName

ProcessName

ageSeconds

Se il valore di Ritardo heartbeat è alto, effettuare le operazioni riportate di seguito.
  • Controllare l'utilizzo della CPU per verificare se la pipeline ha esaurito le risorse
  • Controllare l'utilizzo della memoria per verificare se le risorse assegnate possono gestire le dimensioni di acquisizione
  • Se l'origine dati è un database in locale, controllare lo stato e la latenza della rete
  • Verificare la presenza di problemi relativi alle prestazioni con il database di origine
  • Controlla storage file system
  • Controlla ritardo acquisizione per eventuali problemi di latenza

Utilizzo di Console

Per visualizzare le metriche di Oracle Cloud Infrastructure GoldenGate:
  1. Nel menu di navigazione della console selezionare Osservabilità e gestione, quindi in Monitoraggio selezionare Metriche servizio.
  2. Per il compartimento, selezionare il compartimento che contiene le distribuzioni di Oracle Cloud Infrastructure GoldenGate a cui si è interessati.
  3. Per Spazio di nomi metrica, selezionare oci_goldengate.

Aggiornare il browser per visualizzare le metriche più recenti emesse dal servizio.