Visão Geral do Serviço

O Document Understanding é um serviço multitenant sem servidor que você pode usar para detectar e classificar texto, tabelas e outros dados importantes de arquivos de documentos carregados.

O serviço pode ser acessado usando a Console, APIs REST, SDK e CLI. Você pode processar arquivos individuais ou lotes de documentos usando o ponto final da API ProcessorJob.

Os seguintes modelos pré-treinados são suportados:

Reconhecimento Óptico de Caracteres (OCR): Detecta e reconhece texto em um documento.
Extração de texto: Fornece o nível de palavra e o texto no nível de linha, e as coordenadas da caixa de delimitação de onde o texto é encontrado.
Extração de valor de chave: extrai uma lista predefinida de informações de par de valor de chave de documentos, como recibos, faturas, passaportes e IDs de driver.
Extração de tabela: Extrai conteúdo em formato tabular, mantendo os relacionamentos de linha e coluna das células.
Classificação de documentos: Classifica documentos em diferentes tipos com base na aparência visual, recursos de alto nível e palavras-chave extraídas. Alguns tipos de documento de exemplo são NFF, recebimento e retomada.
PDF OCR (Optical Character Recognition): Gera um arquivo PDF pesquisável no serviço OCI Object Storage.

Documentação do Oracle Cloud Infrastructure

Visão Geral do Serviço