Panoramica servizio

Document Understanding è un servizio multi-tenant serverless che può essere utilizzato per rilevare e classificare testo, tabelle e altri dati chiave dai file di documento caricati.

Per accedere al servizio, utilizzare la console, le API REST, l'SDK e l'interfaccia CLI. È possibile elaborare singoli file o batch di documenti utilizzando l'endpoint API ProcessorJob.

Sono supportati i seguenti modelli pre-addestrati:

  • OCR (Optical Character Recognition): rileva e riconosce il testo in un documento.
  • Estrazione testo: fornisce il testo a livello di parola e di riga e le coordinate del riquadro della posizione del testo.
  • Estrazione chiave-valore: estrae un elenco predefinito di informazioni sulla coppia chiave-valore da ricevute, fatture, passaporti e ID driver.
  • Estrazione tabella: estrae il contenuto in formato tabulare, mantenendo le relazioni di riga e colonna delle celle.
  • Classificazione dei documenti: classifica i documenti in tipi diversi in base all'aspetto visivo, alle funzioni di alto livello e alle parole chiave estratte. Alcuni tipi di documento di esempio sono Fattura, Incasso e Riprendi.
  • PDF OCR (Optical Character Recognition): genera un file PDF ricercabile nel servizio OCI Object Storage.