Visão Geral do Serviço

O Document Understanding é um serviço multitenant sem servidor que você pode usar para detectar e classificar texto, tabelas e outros dados importantes de arquivos de documentos carregados.

O serviço pode ser acessado usando a Console, APIs REST, SDK e CLI. Você pode processar arquivos individuais ou lotes de documentos usando o ponto final da API ProcessorJob.

Os seguintes modelos pré-treinados são suportados:

  • Reconhecimento Óptico de Caracteres (OCR): Detecta e reconhece texto em um documento.
  • Extração de texto: Fornece o nível de palavra e o texto no nível de linha, e as coordenadas da caixa de delimitação de onde o texto é encontrado.
  • Extração de chave/valor: Extrai uma lista predefinida de informações de par de chave/valor de recibos, faturas, passaportes e IDs de driver.
  • Extração de tabela: Extrai conteúdo em formato tabular, mantendo os relacionamentos de linha e coluna das células.
  • Classificação de documentos: Classifica documentos em diferentes tipos com base na aparência visual, recursos de alto nível e palavras-chave extraídas. Alguns tipos de documento de exemplo são NFF, recebimento e retomada.
  • PDF OCR (Optical Character Recognition): Gera um arquivo PDF pesquisável no serviço OCI Object Storage.