Dettagli per flusso di dati
Dettagli di log per i log di diagnostica Spark di Data Flow.
Risorse
- applicazioni
Categorie di log
Valore API (ID): | Console (nome visualizzato) | descrizione; |
---|---|---|
tutte | Diagnostica | Include tutti i log generati dal framework Apache Spark (driver ed esecutori). |
Disponibilità
La registrazione del flusso di dati è disponibile in tutte le aree dei regimi commerciali.
commenti
I log di diagnostica Spark possono essere abilitati solo a livello di applicazione Flusso dati e non possono essere sostituiti.
Se si abilita il log per un'applicazione Flusso dati, i log di diagnostica Spark vengono trasmessi in streaming per qualsiasi nuova sottomissione dell'esecuzione del flusso dati. Le esecuzioni già accettate o in corso non vengono aggiornate.
Contenuto di un log di diagnostica Spark di flusso di dati
Proprietà | descrizione; |
---|---|
specversione | Versione dello schema di Oracle Cloud Infrastructure Logging del log. |
Tipo | Categoria di log che segue la convenzione com.oraclecloud.{service}.{resource-type}.{category} .com.oraclecloud.dataflow.run.driver com.oraclecloud.dataflow.run.executor |
origine | Nome della risorsa che ha generato il messaggio. |
soggetto | Una risorsa secondaria specifica che ha generato l'evento. |
id | Un identificativo unico di origine per questa inclusione batch. |
tempo | Ora di generazione dell'output della funzione, nel formato dell'indicatore orario RFC 3339. |
oracle.logid | OCID dell'oggetto log di Oracle Cloud Infrastructure Logging. |
oracle.loggroupid | OCID del gruppo di log di Oracle Cloud Infrastructure Logging. |
oracle.compartmentid | OCID del compartimento in cui si trova il gruppo di log di Oracle Cloud Infrastructure Logging. |
oracle.tenantid | OCID del tenant. |
oracle.ingestedtime | Ora in cui la riga di log è stata inserita da Oracle Cloud Infrastructure Logging, nel formato indicatore orario RFC 3339. |
dati[i].id | Identificativo univoco per questo evento di log. |
data[i].ora | L'ora in cui questa specifica voce registro è stata generata. Deve essere conforme al formato specificato in RFC 3339. |
dati[i].dati | Dati non vuoti che rappresentano un evento di log. |
data.data[i].livello | Il livello di log dell'evento di log. |
data.data[i].messaggio | Messaggio che descrive i dettagli dell'evento. |
data.data[i].opcRequestId | Un ID richiesta assegnato da Oracle univoco generato quando l'esecuzione del flusso di dati è stata sottomessa e inclusa nella risposta createRun. |
data.data[i].runId | OCID dell'esecuzione del flusso di dati la cui risorsa (un driver o un esecutore Spark) ha generato questo messaggio. |
data.data[i].thread | Il nome del thread che ha generato l'evento di log. |
Log di diagnostica Spark del flusso di dati di esempio
{
"datetime": 1687551602245,
"logContent": {
"data": {
"logLevel": "INFO",
"message": "Execution complete.",
"opcRequestId": "<unique_ID>",
"runId": "ocid1.dataflowrun.oc1.ca-toronto-1.<unique_ID>",
"thread": "shaded.dataflow.oracle.dfcs.spark.wrapper.DataflowWrapper"
},
"id": "<unique_ID>",
"oracle": {
"compartmentid": "ocid1.tenancy.oc1..<unique_ID>",
"ingestedtime": "2023-06-23T20:20:06.974Z",
"loggroupid": "ocid1.loggroup.oc1.ca-toronto-1.<unique_ID>",
"logid": "ocid1.log.oc1.ca-toronto-1.<unique_ID>",
"tenantid": "ocid1.tenancy.oc1..<unique_ID>"
},
"source": "Sample CSV Processing App",
"specversion": "1.0",
"subject": "spark-driver",
"time": "2023-06-23T20:20:02.245Z",
"type": "com.oraclecloud.dataflow.run.driver"
},
"regionId": "ca-toronto-1"
}
Uso dell'interfaccia CLI
Per un comando di esempio per abilitare il log di diagnostica di Data Flow Spark, vedere Abilita log di diagnostica Oracle Cloud Infrastructure Logging Spark.