Creación de un Modelo Generativo Personalizado V2.0 (Nuevo)

El servicio de documentos de OCI cuenta con extracción de clave-valor con tecnología de grandes modelos multimodales (LMM), que ofrece una mayor precisión y adaptabilidad sobre los métodos convencionales basados en modelos.

Acerca de

La extracción de clave-valor del servicio OCI Document utiliza el razonamiento multimodal para analizar tanto el contenido textual como los diseños visuales, lo que lo hace altamente efectivo para manejar documentos con formatos, plantillas y estructuras variados. Puede proporcionar un esquema que describa las claves (campos) necesarias para la extracción, lo que permite al servicio adaptarse a través de diferentes tipos de documentos sin necesidad de volver a entrenar el modelo.

Este gran enfoque basado en modelos multimodales (LMM) brilla en situaciones que implican inconsistencias de diseño, etiquetado irregular o datos de entrenamiento escasos, circunstancias en las que las plantillas tradicionales o las soluciones basadas en modelos a menudo exigen actualizaciones y mantenimiento continuos.

Regiones disponibles

Puede crear modelos personalizados para la extracción de clave-valor basada en modelo multimodal (LMM) de gran tamaño generativo en las siguientes regiones de OCI:

Nombre de región Ubicación Identificador de región Clave de región
Este de Brasil (São Paulo) Sao Paulo sa-saopaulo-1 GRU
Centro de Japón (Osaka) Osaka ap-osaka-1 KIX
Sur de Reino Unido (Londres) London uk-london-1 LHR
Medio Oeste de EE. UU. (Chicago) Chicago us-chicago-1 ORD

Descubra Acerca de las regiones y los dominios de disponibilidad.

Creación de un archivo JSON para claves y valores

Con la extracción generativa, se especifica la información que se va a extraer definiendo un esquema. El esquema actúa como un juego de instrucciones que describe las claves (campos) de interés y sus valores esperados. En función de estas instrucciones, el modelo identifica y extrae los valores de los documentos con sus datos específicos.

  1. Definir el esquema JSON: cree un archivo JSON que contenga una matriz de objetos, donde cada objeto represente una clave que se extraerá.
  2. Especificar propiedades de clave: cree cada objeto de la matriz con las siguientes propiedades:
    • key: nombre de la clave que se va a extraer (necesario).
    • dataType: tipo de dato esperado (opcional).
    • description: descripción en lenguaje natural de la clave (necesaria).
  3. Introduzca las claves: para ver los nombres de claves, consulte Uso de claves del sistema y claves personalizadas.
  4. (Opcional) Agregar un tipo de datos opcional: si necesita un tipo de datos específico para cualquiera de las claves, asigne uno de los siguientes valores para la propiedad dataType:
    • string
    • date
    • number
    • currency
    • phone
  5. Usar lenguaje natural para descripciones: en la propiedad description, proporcione detalles claros y contextuales en inglés sencillo para guiar el modelo de IA generativa a la hora de identificar y extraer los valores correctos.

    Los documentos analizados con este modelo personalizado pueden estar en varios idiomas, como se muestra en la columna de la versión 2 para la extracción de clave-valor personalizada en la tabla Idiomas soportados.

    Una descripción eficaz aclara explícitamente:

    • Qué representa el campo.

    • Dónde suele aparecer en el documento (ubicación visual o contextual), como la esquina superior derecha.

    • Cómo se formatea (patrones, separadores, restricciones), como formatos de fecha.

    • Qué excluir, incluido el texto visual o semánticamente similar que no desea extraer.

  6. Rellene el archivo JSON: agregue las claves necesarias y sus descripciones. Puede dejar el campo description como una cadena vacía si prefiere que el modelo infiera el valor.
  7. En una región soportada, guarde este archivo JSON en un cubo de Object Storage de su arrendamiento.
Archivo JSON de ejemplo

A continuación, se muestra un archivo JSON de ejemplo para la extracción de clave-valor:

[
                    {
                    "key": "InvoiceId",
                    "dataType": "String",
                    "description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #, 
Bill Number and appears near the top of the invoice, often right after the text label."
                    },
                    {
                    "key": "InvoiceDate",
                    "description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
                    },
                    {
                    "key": "DueDate",
                    "description": ""
                    },
                    {
                    "key": "PurchaseOrder",
                    "description": ""
                    },
                    {
                    "key": "InvoiceTotal",
                    "description": "Total amount due. Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
                    },
                    {
                    "key": "TotalTax",
                    "description": ""
                    },
                    {
                    "key": "SubTotal",
                    "description": ""
                    },
                    {
                    "key": "AmountDue",
                    "description": ""
                    },
                    {
                    "key": "PreviousUnpaidBalance",
                    "description": ""
                    }
                    ]
Consejo

Para obtener más ejemplos sobre la escritura de descripciones, consulte Mejores prácticas para descripciones personalizadas.

Uso de claves del sistema y claves personalizadas

Document Understanding proporciona un conjunto de claves de sistema predefinidas. Estas claves se ajustan para trabajar con varios tipos de documentos y diseños. Puede reutilizar estas claves tal cual o modificar su descripción.

Comience con las claves proporcionadas por el sistema

Comience por utilizar las definiciones de clave del sistema predefinidas y evalúe su rendimiento en un ejemplo representativo de los documentos. Para obtener una lista de las claves proporcionadas por el sistema, consulte Extracción de clave-valor.

  • Si los resultados cumplen los requisitos, reutilice las claves proporcionadas por el sistema.
  • No es necesario agregar descripciones para estas claves.

Personalizar descripciones de claves cuando sea necesario

Si una clave proporcionada por el sistema no se ajusta a los requisitos, defina una descripción personalizada basada en los documentos.

Mejores prácticas para descripciones personalizadas

A continuación, se muestran algunas prácticas recomendadas con ejemplos para escribir descripciones clave:

Ser explícito e inequívoco

Distinga claramente entre campos que pueden parecer similares, como diferentes identificadores numéricos.

Ejemplo

"key": "Invoice number"   
"description": "A unique alphanumeric identifier assigned to the invoice. 
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice, 
often right after the text label." 

Describir las variaciones de contexto y etiqueta

Los modelos generativos dependen en gran medida del texto y las etiquetas circundantes. Incluir variantes de etiqueta comunes.

Ejemplo

"key": "Company GST Number" "description": "Company GST number, 
often labeled as GSTIN, GST No., or Tax ID. Usually appears 
in the header with other business identifiers."

Especificar formatos de valores esperados

Si el campo sigue un formato conocido, indíquelo explícitamente.

Ejemplo

"key": "Invoice Date" "description": "Date the invoice was issued. 
Common formats include DD-MM-YYYY or MM/DD/YYYY."

Aclarar qué excluir

Identifique explícitamente campos similares que no desea extraer.

Ejemplo

"key": "Total Amount" "description": "Total amount due. 
Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."

Incluir sinónimos y variaciones de etiqueta

Proporcione diferentes etiquetas para mejorar la solidez de las variantes de los documentos.

Ejemplo

"key": "Customer Phone Number" "description": "Customer phone number. 
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the 
customer name or address."

Agregar indicaciones de ubicación de referencia

Si los documentos siguen diseños coherentes, incluya señales de posición relativas.

Ejemplo

"key": "Supplier Address" "description": "Supplier address 
located under the business name in the top-left area of the first page." 

Incluir ejemplos útiles

Los ejemplos concretos mejoran la precisión de la extracción.

Ejemplo

"key": "Invoice Date" "description": "Invoice date, 
for example 24-12-2025 or Dec 24, 2025. 
Usually follows labels such as Date or Invoice Date."

Sea conciso y preciso

Preferir una frase descriptiva clara complementada con limitaciones o ejemplos esenciales.

Definir comportamiento de reserva

Cuando corresponda, especifique cómo inferir valores si falta la etiqueta principal.

Ejemplo:

Si falta el total de la factura, utilice en su lugar el importe total pendiente.

Codificar consciencia de sección explícitamente

Para documentos de varias secciones (como formularios), especifique el contexto de sección y el orden de los campos.

Ejemplo

"key": "First Name" "description": "Person’s given name. 
Appears under the Personal Information or Applicant   Details section header. 
Usually the first field in the section and appears before Last Name. 
Might contain multiple words (for example, MaryAnn)."

Manejar valores de varias palabras y líneas

Permitir explícitamente la extracción de varios tokens o varias líneas cuando corresponda.

Ejemplo

"key": "Address" "description": "Full residential address. 
May span multiple consecutive lines within the same section. 
Extract all adjacent address lines as a single value."

Utilizar orientación negativa para evitar falsos positivos

Indique explícitamente de dónde no se deben extraer los valores.

Ejemplo

"key": "Applicant Name" "description": "Applicant name. 
Do not extract names appearing in signature blocks, declaration sections, 
or references to officials or witnesses."

Manejo de campos sin etiquetas explícitas

Para los campos implícitos, confíe en el rol semántico y las pistas de diseño:

  • Posición relativa a las cabeceras de sección

  • Ordenar entre campos cercanos

  • Proximidad a las etiquetas relacionadas

Frases de ejemplo

  • Aparece inmediatamente después de...
  • Situado junto a...
  • Sigue el encabezado de la sección…

Creación de un modelo generativo personalizado

Para crear un modelo personalizado para la extracción de clave-valor mediante IA generativa, siga estos pasos:

Seleccionar Datos

Cree un modelo generativo personalizado de clave-valor (KV) con Document Understanding.

  1. Vaya a la página de lista Proyectos. Si necesita ayuda para buscar la página de lista, consulte Lista de proyectos.
  2. Lleve a cabo una de las siguientes acciones:
    • Si no tiene un proyecto existente, cree un proyecto y, a continuación, seleccione ese proyecto.
    • Si tiene un proyecto existente, seleccione el proyecto de la lista.
  3. En la página de detalles del proyecto, seleccione Crear modelo. Si necesita ayuda para buscar la página de detalles del proyecto, consulte Visualización de un proyecto.
  4. Seleccione Crear modelo.
  5. Para obtener detalles del modelo, seleccione lo siguiente:
    • Seleccionar tipo de modelo para entrenar: extracción de valores clave
    • Versión del modelo: V2.0 (extracción generativa)
  6. Para Datos de entrenamiento, seleccione Seleccionar juego de datos existente.
  7. En Origen de datos, seleccione Object Storage.
  8. Seleccione el cubo que contiene el archivo JSON preparado en Creación de un archivo JSON para claves y valores. Si el cubo está en un compartimento diferente al de este proyecto, seleccione el compartimento con el cubo.
  9. En Archivo de etiquetado de datos, seleccione el archivo JSON y, a continuación, seleccione Siguiente.

Modelo de entrenamiento

  1. Introduzca un nombre para el modelo personalizado.
  2. (Opcional) Proporcione al modelo una descripción que le ayude a encontrarlo.
  3. Recuento de unidades de inferencias es un recurso informático dedicado al punto final y está definido en 1. No puede cambiarlo.
  4. En Lenguaje de documento de formación, seleccione EN para Inglés.
  5. Para Duración de formación, seleccione una de las siguientes opciones:
    • Formación recomendada: Document Understanding selecciona automáticamente la duración del entrenamiento para crear el mejor modelo. El entrenamiento puede tardar hasta 24 horas.
    • Personalizado: con esta opción puede definir la duración máxima del entrenamiento (en horas).
  6. Seleccione Next (Siguiente).

Revisar

  1. Revise la información que ha proporcionado en los pasos anteriores. Puede realizar cualquier cambio seleccionando Anterior o Editar.
  2. Cuando esté satisfecho con las selecciones, seleccione Crear y entrenar.

Prueba del modelo

  1. Después de crear el modelo personalizado, en la página de detalles del modelo, vaya a la sección Analizar.
  2. Cargue un documento de un archivo local o de Object Storage para probar el modelo personalizado.
  3. Seleccione Analizar.
  4. Revise las claves y sus valores extraídos.
  5. Si no está satisfecho con los resultados, por ejemplo, para agregar una clave o actualizar una descripción, actualice su archivo JSON y repita los pasos anteriores.