Criando um Modelo Generativo Personalizado V2.0 (Novo)
O OCI Document Service apresenta Extração de Valor Chave com tecnologia de LMMs (Large Multimodal Models, Modelos multimodais grandes), oferecendo maior precisão e adaptabilidade em relação aos métodos convencionais orientados por modelos.
Sobre
A extração de valor-chave do serviço OCI Document usa raciocínio multimodal para analisar conteúdo textual e layouts visuais, tornando-o altamente eficaz para lidar com documentos com formatos, modelos e estruturas variados. Você pode fornecer um esquema que descreva as chaves (campos) necessárias para extração, permitindo que o serviço se adapte a diferentes tipos de documento sem a necessidade de novo treinamento do modelo.
Essa grande abordagem alimentada por modelo multimodal (LMM) brilha em situações que envolvem inconsistências de layout, rotulagem irregular ou dados de treinamento escassos, circunstâncias em que as soluções tradicionais baseadas em modelo ou modelo geralmente exigem atualizações e manutenção contínuas.
Regiões Disponíveis
Você pode criar modelos personalizados para extração de Key-Value baseada em LMM (Modelo Multimodal Generativo Grande) nas seguintes regiões do OCI:
| Nome da Região | Local | Identificador da Região | Chave da Região |
|---|---|---|---|
| Leste do Brasil (São Paulo) | São Paulo |
sa-saopaulo-1
|
GRU
|
| Centro do Japão (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Sul do Reino Unido (Londres) | London |
uk-london-1
|
LHR
|
| Centro-Oeste dos EUA (Chicago) | Chicago |
us-chicago-1
|
ORD
|
Adicionando Permissões
Criando um Arquivo JSON para Chaves e Valores
Com a extração generativa, você especifica as informações a serem extraídas definindo um esquema. O esquema atua como um conjunto de instruções que descreve as chaves (campos) de interesse e seus valores esperados. Com base nessas instruções, o modelo identifica e extrai os valores entre documentos com suas especificidades.
Veja um exemplo de arquivo JSON para extração de valor-chave:
[
{
"key": "InvoiceId",
"dataType": "String",
"description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #,
Bill Number and appears near the top of the invoice, often right after the text label."
},
{
"key": "InvoiceDate",
"description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
},
{
"key": "DueDate",
"description": ""
},
{
"key": "PurchaseOrder",
"description": ""
},
{
"key": "InvoiceTotal",
"description": "Total amount due. Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
},
{
"key": "TotalTax",
"description": ""
},
{
"key": "SubTotal",
"description": ""
},
{
"key": "AmountDue",
"description": ""
},
{
"key": "PreviousUnpaidBalance",
"description": ""
}
]Para obter mais exemplos de como escrever descrições, consulte Melhores Práticas para Descrições Personalizadas.
Utilizando Chaves de Sistema e Chaves Personalizadas
O Document Understanding fornece um conjunto de chaves de sistema predefinidas. Essas teclas são ajustadas para funcionar com vários tipos de documento e layouts. Você pode reutilizar essas chaves no estado em que se encontram ou alterar sua descrição.
Começar com chaves fornecidas pelo sistema
Comece usando as definições de chave do sistema predefinidas e avalie seu desempenho em uma amostra representativa de seus documentos. Para obter uma lista de chaves fornecidas pelo sistema, consulte Extração de Valor de Chave.
- Se os resultados atenderem aos requisitos, reutilize as chaves fornecidas pelo sistema.
- Não é necessário adicionar descrições para essas chaves.
Personalizar descrições de chave quando necessário
Se uma chave fornecida pelo sistema não atender aos requisitos, defina uma descrição personalizada com base nos documentos.
-
Personalize descrições para terminologia, layouts e padrões de formatação específicos do documento.
-
Siga as Melhores Práticas para Descrições Personalizadas para obter as descrições.
Melhores práticas para descrições personalizadas
Veja a seguir algumas práticas recomendadas com exemplos para escrever descrições importantes:
Seja explícito e inequívoco
Distinguir claramente os campos que podem parecer semelhantes, como identificadores numéricos diferentes.
Exemplo
"key": "Invoice number"
"description": "A unique alphanumeric identifier assigned to the invoice.
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice,
often right after the text label." Descrever variações de contexto e rótulo
Os modelos generativos dependem muito de texto e rótulos circundantes. Incluir variantes de rótulo comuns.
Exemplo
"key": "Company GST Number" "description": "Company GST number,
often labeled as GSTIN, GST No., or Tax ID. Usually appears
in the header with other business identifiers."Especificar formatos de valor esperado
Se o campo seguir um formato conhecido, informe-o explicitamente.
Exemplo
"key": "Invoice Date" "description": "Date the invoice was issued.
Common formats include DD-MM-YYYY or MM/DD/YYYY."Esclarecer o que excluir
Identifique explicitamente campos semelhantes que você não deseja extrair.
Exemplo
"key": "Total Amount" "description": "Total amount due.
Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."Incluir sinônimos e variações de rótulo
Forneça rótulos diferentes para melhorar a robustez entre as variantes de documentos.
Exemplo
"key": "Customer Phone Number" "description": "Customer phone number.
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the
customer name or address."Adicionar dicas de local de referência
Se os documentos seguirem layouts consistentes, inclua dicas de posição relativa.
Exemplo
"key": "Supplier Address" "description": "Supplier address
located under the business name in the top-left area of the first page." Incluir exemplos quando úteis
Exemplos de concreto melhoram a precisão da extração.
Exemplo
"key": "Invoice Date" "description": "Invoice date,
for example 24-12-2025 or Dec 24, 2025.
Usually follows labels such as Date or Invoice Date."Seja conciso e preciso
Prefira uma frase descritiva clara complementada com restrições ou exemplos essenciais.
Definir comportamento de fallback
Quando aplicável, especifique como inferir valores se o rótulo principal estiver ausente.
Exemplo:
Se o Total da Fatura estiver ausente, use o Valor Total Devido.
Codificar reconhecimento de seção explicitamente
Para documentos de várias seções (como formulários), especifique o contexto da seção e a ordenação do campo.
Exemplo
"key": "First Name" "description": "Person’s given name.
Appears under the Personal Information or Applicant Details section header.
Usually the first field in the section and appears before Last Name.
Might contain multiple words (for example, MaryAnn)."Tratar valores de várias palavras e várias linhas
Permitir explicitamente a extração multi-token ou multi-linha quando aplicável.
Exemplo
"key": "Address" "description": "Full residential address.
May span multiple consecutive lines within the same section.
Extract all adjacent address lines as a single value."Use orientação negativa para evitar falsos positivos
Indique explicitamente de onde os valores não devem ser extraídos.
Exemplo
"key": "Applicant Name" "description": "Applicant name.
Do not extract names appearing in signature blocks, declaration sections,
or references to officials or witnesses."Tratando campos sem rótulos explícitos
Para campos implícitos, confie na função semântica e nas dicas de layout:
-
Posição relativa aos cabeçalhos da seção
-
Ordenação entre campos próximos
-
Proximidade com rótulos relacionados
Frases de Exemplo
- Aparece imediatamente após…
- Localizado ao lado de…
- Segue o cabeçalho da seção…
Criando um Modelo Generativo Personalizado
Para criar um modelo personalizado para extração de chave/valor usando IA Generativa, siga estas etapas:
Selecionar Dados
Crie um modelo generativo personalizado Key-Value (KV) usando o Document Understanding.
Treinar Modelo
Revisar
- Revise as informações fornecidas nas etapas anteriores. Você pode fazer qualquer alteração, selecionando Anterior ou Editar.
- Quando estiver satisfeito com as seleções, selecione Criar e treinar.
Testar o Modelo
- Após a criação do modelo personalizado, na página de detalhes do modelo, navegue até a seção Analisar.
- Faça upload de um documento de um arquivo local ou do Object Storage para testar o modelo personalizado.
- Selecione Analisar.
- Examinar as chaves e seus valores extraídos.
- Se você não estiver satisfeito com os resultados, por exemplo, para adicionar uma chave ou atualizar uma descrição, atualize seu arquivo JSON e repita as etapas anteriores.