Creación de un Modelo Generativo Personalizado V2.0 (Nuevo)
El servicio de documentos de OCI cuenta con extracción de clave-valor con tecnología de grandes modelos multimodales (LMM), que ofrece una mayor precisión y adaptabilidad sobre los métodos convencionales basados en modelos.
Acerca de
La extracción de clave-valor del servicio OCI Document utiliza el razonamiento multimodal para analizar tanto el contenido textual como los diseños visuales, lo que lo hace altamente efectivo para manejar documentos con formatos, plantillas y estructuras variados. Puede proporcionar un esquema que describa las claves (campos) necesarias para la extracción, lo que permite al servicio adaptarse a través de diferentes tipos de documentos sin necesidad de volver a entrenar el modelo.
Este gran enfoque basado en modelos multimodales (LMM) brilla en situaciones que implican inconsistencias de diseño, etiquetado irregular o datos de entrenamiento escasos, circunstancias en las que las plantillas tradicionales o las soluciones basadas en modelos a menudo exigen actualizaciones y mantenimiento continuos.
Regiones disponibles
Puede crear modelos personalizados para la extracción de clave-valor basada en modelo multimodal (LMM) de gran tamaño generativo en las siguientes regiones de OCI:
| Nombre de región | Ubicación | Identificador de región | Clave de región |
|---|---|---|---|
| Este de Brasil (São Paulo) | Sao Paulo |
sa-saopaulo-1
|
GRU
|
| Centro de Japón (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Sur de Reino Unido (Londres) | London |
uk-london-1
|
LHR
|
| Medio Oeste de EE. UU. (Chicago) | Chicago |
us-chicago-1
|
ORD
|
Descubra Acerca de las regiones y los dominios de disponibilidad.
Adición de permisos
Agregue permisos mediante políticas de IAM:
Creación de un archivo JSON para claves y valores
Con la extracción generativa, se especifica la información que se va a extraer definiendo un esquema. El esquema actúa como un juego de instrucciones que describe las claves (campos) de interés y sus valores esperados. En función de estas instrucciones, el modelo identifica y extrae los valores de los documentos con sus datos específicos.
A continuación, se muestra un archivo JSON de ejemplo para la extracción de clave-valor:
[
{
"key": "InvoiceId",
"dataType": "String",
"description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #,
Bill Number and appears near the top of the invoice, often right after the text label."
},
{
"key": "InvoiceDate",
"description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
},
{
"key": "DueDate",
"description": ""
},
{
"key": "PurchaseOrder",
"description": ""
},
{
"key": "InvoiceTotal",
"description": "Total amount due. Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
},
{
"key": "TotalTax",
"description": ""
},
{
"key": "SubTotal",
"description": ""
},
{
"key": "AmountDue",
"description": ""
},
{
"key": "PreviousUnpaidBalance",
"description": ""
}
]Para obtener más ejemplos sobre la escritura de descripciones, consulte Mejores prácticas para descripciones personalizadas.
Uso de claves del sistema y claves personalizadas
Document Understanding proporciona un conjunto de claves de sistema predefinidas. Estas claves se ajustan para trabajar con varios tipos de documentos y diseños. Puede reutilizar estas claves tal cual o modificar su descripción.
Comience con las claves proporcionadas por el sistema
Comience por utilizar las definiciones de clave del sistema predefinidas y evalúe su rendimiento en un ejemplo representativo de los documentos. Para obtener una lista de las claves proporcionadas por el sistema, consulte Extracción de clave-valor.
- Si los resultados cumplen los requisitos, reutilice las claves proporcionadas por el sistema.
- No es necesario agregar descripciones para estas claves.
Personalizar descripciones de claves cuando sea necesario
Si una clave proporcionada por el sistema no se ajusta a los requisitos, defina una descripción personalizada basada en los documentos.
-
Adapte las descripciones a la terminología, los diseños y los patrones de formato específicos del documento.
-
Siga las Mejores prácticas para descripciones personalizadas para obtener las descripciones.
Mejores prácticas para descripciones personalizadas
A continuación, se muestran algunas prácticas recomendadas con ejemplos para escribir descripciones clave:
Ser explícito e inequívoco
Distinga claramente entre campos que pueden parecer similares, como diferentes identificadores numéricos.
Ejemplo
"key": "Invoice number"
"description": "A unique alphanumeric identifier assigned to the invoice.
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice,
often right after the text label." Describir las variaciones de contexto y etiqueta
Los modelos generativos dependen en gran medida del texto y las etiquetas circundantes. Incluir variantes de etiqueta comunes.
Ejemplo
"key": "Company GST Number" "description": "Company GST number,
often labeled as GSTIN, GST No., or Tax ID. Usually appears
in the header with other business identifiers."Especificar formatos de valores esperados
Si el campo sigue un formato conocido, indíquelo explícitamente.
Ejemplo
"key": "Invoice Date" "description": "Date the invoice was issued.
Common formats include DD-MM-YYYY or MM/DD/YYYY."Aclarar qué excluir
Identifique explícitamente campos similares que no desea extraer.
Ejemplo
"key": "Total Amount" "description": "Total amount due.
Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."Incluir sinónimos y variaciones de etiqueta
Proporcione diferentes etiquetas para mejorar la solidez de las variantes de los documentos.
Ejemplo
"key": "Customer Phone Number" "description": "Customer phone number.
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the
customer name or address."Agregar indicaciones de ubicación de referencia
Si los documentos siguen diseños coherentes, incluya señales de posición relativas.
Ejemplo
"key": "Supplier Address" "description": "Supplier address
located under the business name in the top-left area of the first page." Incluir ejemplos útiles
Los ejemplos concretos mejoran la precisión de la extracción.
Ejemplo
"key": "Invoice Date" "description": "Invoice date,
for example 24-12-2025 or Dec 24, 2025.
Usually follows labels such as Date or Invoice Date."Sea conciso y preciso
Preferir una frase descriptiva clara complementada con limitaciones o ejemplos esenciales.
Definir comportamiento de reserva
Cuando corresponda, especifique cómo inferir valores si falta la etiqueta principal.
Ejemplo:
Si falta el total de la factura, utilice en su lugar el importe total pendiente.
Codificar consciencia de sección explícitamente
Para documentos de varias secciones (como formularios), especifique el contexto de sección y el orden de los campos.
Ejemplo
"key": "First Name" "description": "Person’s given name.
Appears under the Personal Information or Applicant Details section header.
Usually the first field in the section and appears before Last Name.
Might contain multiple words (for example, MaryAnn)."Manejar valores de varias palabras y líneas
Permitir explícitamente la extracción de varios tokens o varias líneas cuando corresponda.
Ejemplo
"key": "Address" "description": "Full residential address.
May span multiple consecutive lines within the same section.
Extract all adjacent address lines as a single value."Utilizar orientación negativa para evitar falsos positivos
Indique explícitamente de dónde no se deben extraer los valores.
Ejemplo
"key": "Applicant Name" "description": "Applicant name.
Do not extract names appearing in signature blocks, declaration sections,
or references to officials or witnesses."Manejo de campos sin etiquetas explícitas
Para los campos implícitos, confíe en el rol semántico y las pistas de diseño:
-
Posición relativa a las cabeceras de sección
-
Ordenar entre campos cercanos
-
Proximidad a las etiquetas relacionadas
Frases de ejemplo
- Aparece inmediatamente después de...
- Situado junto a...
- Sigue el encabezado de la sección…
Creación de un modelo generativo personalizado
Para crear un modelo personalizado para la extracción de clave-valor mediante IA generativa, siga estos pasos:
Seleccionar Datos
Cree un modelo generativo personalizado de clave-valor (KV) con Document Understanding.
Modelo de entrenamiento
Revisar
- Revise la información que ha proporcionado en los pasos anteriores. Puede realizar cualquier cambio seleccionando Anterior o Editar.
- Cuando esté satisfecho con las selecciones, seleccione Crear y entrenar.
Prueba del modelo
- Después de crear el modelo personalizado, en la página de detalles del modelo, vaya a la sección Analizar.
- Cargue un documento de un archivo local o de Object Storage para probar el modelo personalizado.
- Seleccione Analizar.
- Revise las claves y sus valores extraídos.
- Si no está satisfecho con los resultados, por ejemplo, para agregar una clave o actualizar una descripción, actualice su archivo JSON y repita los pasos anteriores.