Panoramica servizio

Document Understanding è un servizio multi-tenant serverless che può essere utilizzato per rilevare e classificare testo, tabelle e altri dati chiave dai file di documento caricati.

Per accedere al servizio, utilizzare la console, le API REST, l'SDK e l'interfaccia CLI. È possibile elaborare singoli file o batch di documenti utilizzando l'endpoint API ProcessorJob.

Sono supportati i seguenti modelli pre-addestrati:

OCR (Optical Character Recognition): rileva e riconosce il testo in un documento.
Estrazione testo: fornisce il testo a livello di parola e di riga e le coordinate del riquadro della posizione del testo.
Estrazione del valore chiave: estrae un elenco predefinito di informazioni sulla coppia chiave-valore da documenti quali ricevute, fatture, passaporti e ID driver.
Estrazione tabella: estrae il contenuto in formato tabulare, mantenendo le relazioni di riga e colonna delle celle.
Classificazione dei documenti: classifica i documenti in tipi diversi in base all'aspetto visivo, alle funzioni di alto livello e alle parole chiave estratte. Alcuni tipi di documento di esempio sono Fattura, Incasso e Riprendi.
PDF OCR (Optical Character Recognition): genera un file PDF ricercabile nel servizio OCI Object Storage.

Documentazione di Oracle Cloud Infrastructure

Panoramica servizio