Criando um Modelo Generativo Personalizado V2.0 (Novo)

O OCI Document Service apresenta Extração de Valor Chave com tecnologia de LMMs (Large Multimodal Models, Modelos multimodais grandes), oferecendo maior precisão e adaptabilidade em relação aos métodos convencionais orientados por modelos.

Sobre

A extração de valor-chave do serviço OCI Document usa raciocínio multimodal para analisar conteúdo textual e layouts visuais, tornando-o altamente eficaz para lidar com documentos com formatos, modelos e estruturas variados. Você pode fornecer um esquema que descreva as chaves (campos) necessárias para extração, permitindo que o serviço se adapte a diferentes tipos de documento sem a necessidade de novo treinamento do modelo.

Essa grande abordagem alimentada por modelo multimodal (LMM) brilha em situações que envolvem inconsistências de layout, rotulagem irregular ou dados de treinamento escassos, circunstâncias em que as soluções tradicionais baseadas em modelo ou modelo geralmente exigem atualizações e manutenção contínuas.

Regiões Disponíveis

Você pode criar modelos personalizados para extração de Key-Value baseada em LMM (Modelo Multimodal Generativo Grande) nas seguintes regiões do OCI:

Nome da Região Local Identificador da Região Chave da Região
Leste do Brasil (São Paulo) São Paulo sa-saopaulo-1 GRU
Centro do Japão (Osaka) Osaka ap-osaka-1 KIX
Sul do Reino Unido (Londres) London uk-london-1 LHR
Centro-Oeste dos EUA (Chicago) Chicago us-chicago-1 ORD

Saiba Sobre Regiões e Domínios de Disponibilidade.

Criando um Arquivo JSON para Chaves e Valores

Com a extração generativa, você especifica as informações a serem extraídas definindo um esquema. O esquema atua como um conjunto de instruções que descreve as chaves (campos) de interesse e seus valores esperados. Com base nessas instruções, o modelo identifica e extrai os valores entre documentos com suas especificidades.

  1. Definir o Esquema JSON: Crie um arquivo JSON que contenha um array de objetos, em que cada objeto represente uma chave a ser extraída.
  2. Especificar Propriedades da Chave: Crie cada objeto no array com as seguintes propriedades:
    • key: O nome da chave a ser extraída (obrigatório).
    • dataType: O tipo de dados esperado (opcional).
    • description: Uma descrição em linguagem natural da chave (obrigatório).
  3. Enter the Keys: Para nomes de chave, consulte Using System Keys and Custom Keys.
  4. (Opcional) Adicionar um Tipo de Dados Opcional: Se você precisar de um tipo de dados específico para qualquer uma das chaves, para a propriedade dataType, atribua um dos seguintes valores:
    • string
    • date
    • number
    • currency
    • phone
  5. Usar Linguagem Natural para Descrições: Na propriedade description, forneça detalhes claros e contextuais em inglês simples para orientar o modelo de IA Generativa na identificação e extração dos valores corretos.

    Os documentos analisados com este modelo personalizado podem estar em vários idiomas, conforme listado na coluna versão 2 para extração de chave/valor personalizada na tabela Idiomas Suportados.

    Uma descrição eficaz esclarece explicitamente:

    • O que o campo representa.

    • Onde ele geralmente aparece no documento (localização visual ou contextual), como o canto superior direito.

    • Como é formatado (padrões, separadores, restrições), como formatos de data.

    • O que excluir, incluindo texto visualmente ou semanticamente semelhante que você não deseja extrair.

  6. Preencher o Arquivo JSON: Adicione suas chaves necessárias e suas descrições. Você poderá deixar o campo description como uma string vazia se preferir que o modelo infera o valor.
  7. Em uma região suportada, salve esse arquivo JSON em um bucket do serviço Object Storage em sua tenancy.
Exemplo de Arquivo JSON

Veja um exemplo de arquivo JSON para extração de valor-chave:

[
                    {
                    "key": "InvoiceId",
                    "dataType": "String",
                    "description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #, 
Bill Number and appears near the top of the invoice, often right after the text label."
                    },
                    {
                    "key": "InvoiceDate",
                    "description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
                    },
                    {
                    "key": "DueDate",
                    "description": ""
                    },
                    {
                    "key": "PurchaseOrder",
                    "description": ""
                    },
                    {
                    "key": "InvoiceTotal",
                    "description": "Total amount due. Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
                    },
                    {
                    "key": "TotalTax",
                    "description": ""
                    },
                    {
                    "key": "SubTotal",
                    "description": ""
                    },
                    {
                    "key": "AmountDue",
                    "description": ""
                    },
                    {
                    "key": "PreviousUnpaidBalance",
                    "description": ""
                    }
                    ]
Dica

Para obter mais exemplos de como escrever descrições, consulte Melhores Práticas para Descrições Personalizadas.

Utilizando Chaves de Sistema e Chaves Personalizadas

O Document Understanding fornece um conjunto de chaves de sistema predefinidas. Essas teclas são ajustadas para funcionar com vários tipos de documento e layouts. Você pode reutilizar essas chaves no estado em que se encontram ou alterar sua descrição.

Começar com chaves fornecidas pelo sistema

Comece usando as definições de chave do sistema predefinidas e avalie seu desempenho em uma amostra representativa de seus documentos. Para obter uma lista de chaves fornecidas pelo sistema, consulte Extração de Valor de Chave.

  • Se os resultados atenderem aos requisitos, reutilize as chaves fornecidas pelo sistema.
  • Não é necessário adicionar descrições para essas chaves.

Personalizar descrições de chave quando necessário

Se uma chave fornecida pelo sistema não atender aos requisitos, defina uma descrição personalizada com base nos documentos.

Melhores práticas para descrições personalizadas

Veja a seguir algumas práticas recomendadas com exemplos para escrever descrições importantes:

Seja explícito e inequívoco

Distinguir claramente os campos que podem parecer semelhantes, como identificadores numéricos diferentes.

Exemplo

"key": "Invoice number"   
"description": "A unique alphanumeric identifier assigned to the invoice. 
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice, 
often right after the text label." 

Descrever variações de contexto e rótulo

Os modelos generativos dependem muito de texto e rótulos circundantes. Incluir variantes de rótulo comuns.

Exemplo

"key": "Company GST Number" "description": "Company GST number, 
often labeled as GSTIN, GST No., or Tax ID. Usually appears 
in the header with other business identifiers."

Especificar formatos de valor esperado

Se o campo seguir um formato conhecido, informe-o explicitamente.

Exemplo

"key": "Invoice Date" "description": "Date the invoice was issued. 
Common formats include DD-MM-YYYY or MM/DD/YYYY."

Esclarecer o que excluir

Identifique explicitamente campos semelhantes que você não deseja extrair.

Exemplo

"key": "Total Amount" "description": "Total amount due. 
Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."

Incluir sinônimos e variações de rótulo

Forneça rótulos diferentes para melhorar a robustez entre as variantes de documentos.

Exemplo

"key": "Customer Phone Number" "description": "Customer phone number. 
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the 
customer name or address."

Adicionar dicas de local de referência

Se os documentos seguirem layouts consistentes, inclua dicas de posição relativa.

Exemplo

"key": "Supplier Address" "description": "Supplier address 
located under the business name in the top-left area of the first page." 

Incluir exemplos quando úteis

Exemplos de concreto melhoram a precisão da extração.

Exemplo

"key": "Invoice Date" "description": "Invoice date, 
for example 24-12-2025 or Dec 24, 2025. 
Usually follows labels such as Date or Invoice Date."

Seja conciso e preciso

Prefira uma frase descritiva clara complementada com restrições ou exemplos essenciais.

Definir comportamento de fallback

Quando aplicável, especifique como inferir valores se o rótulo principal estiver ausente.

Exemplo:

Se o Total da Fatura estiver ausente, use o Valor Total Devido.

Codificar reconhecimento de seção explicitamente

Para documentos de várias seções (como formulários), especifique o contexto da seção e a ordenação do campo.

Exemplo

"key": "First Name" "description": "Person’s given name. 
Appears under the Personal Information or Applicant   Details section header. 
Usually the first field in the section and appears before Last Name. 
Might contain multiple words (for example, MaryAnn)."

Tratar valores de várias palavras e várias linhas

Permitir explicitamente a extração multi-token ou multi-linha quando aplicável.

Exemplo

"key": "Address" "description": "Full residential address. 
May span multiple consecutive lines within the same section. 
Extract all adjacent address lines as a single value."

Use orientação negativa para evitar falsos positivos

Indique explicitamente de onde os valores não devem ser extraídos.

Exemplo

"key": "Applicant Name" "description": "Applicant name. 
Do not extract names appearing in signature blocks, declaration sections, 
or references to officials or witnesses."

Tratando campos sem rótulos explícitos

Para campos implícitos, confie na função semântica e nas dicas de layout:

  • Posição relativa aos cabeçalhos da seção

  • Ordenação entre campos próximos

  • Proximidade com rótulos relacionados

Frases de Exemplo

  • Aparece imediatamente após…
  • Localizado ao lado de…
  • Segue o cabeçalho da seção…

Criando um Modelo Generativo Personalizado

Para criar um modelo personalizado para extração de chave/valor usando IA Generativa, siga estas etapas:

Selecionar Dados

Crie um modelo generativo personalizado Key-Value (KV) usando o Document Understanding.

  1. Navegue até a página da lista Projetos. Se precisar de ajuda para localizar a página da lista, consulte Listando Projetos.
  2. Execute uma das seguintes opções:
    • Se você não tiver um projeto existente, crie um projeto e selecione esse projeto.
    • Se você tiver um projeto existente, selecione-o na lista.
  3. Na página de detalhes do projeto, selecione Create Model. Se precisar de ajuda para localizar a página de detalhes do projeto, consulte Exibindo um Projeto.
  4. Selecione Criar Modelo.
  5. Para obter detalhes do modelo, selecione o seguinte:
    • Escolher tipo de modelo a ser treinado: extração de valor de chave
    • Versão do modelo: V2.0 (Extração generativa)
  6. Para Dados de Treinamento, selecione Escolher conjunto de dados existente.
  7. Para Origem de Dados, selecione Object Storage.
  8. Selecione o bucket que contém o arquivo JSON preparado em Creating a JSON File for Keys and Values. Se o bucket estiver em um compartimento diferente desse projeto, selecione o compartimento com o bucket.
  9. Para Arquivo de Label de Dados, selecione o arquivo JSON e, em seguida, selecione Próximo.

Treinar Modelo

  1. Digite um nome para o modelo personalizado.
  2. (Opcional) Dê uma descrição ao modelo para ajudá-lo a encontrá-lo.
  3. Contagem de Unidades de Inferência é um recurso do serviço Compute dedicado ao seu ponto final e está definido como 1. Não é possível alterá-lo.
  4. Para Idioma do Documento de Treinamento, selecione EN para inglês.
  5. Para a Duração do Treinamento, selecione uma das seguintes opções:
    • Treinamento recomendado: O Document Understanding seleciona automaticamente a duração do treinamento para criar o melhor modelo. O treinamento pode levar até 24 horas.
    • Personalizado: com essa opção, você pode definir a duração máxima do treinamento (em horas).
  6. Selecione Próximo.

Revisar

  1. Revise as informações fornecidas nas etapas anteriores. Você pode fazer qualquer alteração, selecionando Anterior ou Editar.
  2. Quando estiver satisfeito com as seleções, selecione Criar e treinar.

Testar o Modelo

  1. Após a criação do modelo personalizado, na página de detalhes do modelo, navegue até a seção Analisar.
  2. Faça upload de um documento de um arquivo local ou do Object Storage para testar o modelo personalizado.
  3. Selecione Analisar.
  4. Examinar as chaves e seus valores extraídos.
  5. Se você não estiver satisfeito com os resultados, por exemplo, para adicionar uma chave ou atualizar uma descrição, atualize seu arquivo JSON e repita as etapas anteriores.