preparación de documentos para analizarlos con un modelo de OCI Document Understanding

Utilice cubos de OCI Object Storage para almacenar los documentos que desee analizar y, a continuación, cree un juego de datos para acceder a estos documentos en Oracle Analytics.

Normalmente, los documentos de entrada y los modelos de IA los puede almacenar en la misma cuenta (arrendamiento) de Oracle Cloud, lo cual facilita la configuración en Oracle Analytics.

Si los documentos de entrada y los modelos de IA están almacenados en arrendamientos diferentes:
  • Asegúrese de que la visibilidad del cubo de almacenamiento que contiene los documentos de entrada es pública. Consulte Cambio de la visibilidad de un cubo.
  • Rellene el juego de datos de entrada para el flujo de datos con URL de documento individuales en lugar de una única URL para el cubo de OCI donde se almacenan los documentos.
Los flujos de datos de Oracle Analytics pueden procesar hasta 10 000 documentos en una ejecución. Si tiene más de 10 000 documentos, en Object Storage y Archive Storage de OCI, cree varios cubos que no contengan más de 10 000 documentos cada uno. A continuación, cree un juego de datos y un flujo de datos independientes para cada cubo, y utilice una secuencia para procesar los flujos de datos de forma secuencial.

Puede utilizar un cubo privado o público que sea accesible para el usuario de OCI y que cumpla con los límites genéricos de OCI sobre los documentos. Consulte la documentación de OCI.

  1. En la consola de OCI, vaya a Object Storage y Archive Storage y cree un cubo para almacenar los documentos.

  2. En el área Object Storage y Archive Storage, haga clic en un nombre de cubo y, a continuación, en la región Objectos de la página, haga clic en Cargar y cargue sus documentos.
    Asegúrese de que el cubo no contiene ningún archivo que no proceda que no desee procesar. Oracle Analytics procesa todos los archivos del cubo.
  3. Para cada cubo, agregue la URL de cubo a un archivo de valores separador por comas (CSV).
    1. En Object Storage, seleccione el cubo para mostrar los documentos en el cuadro de diálogo Objetos.
    2. Copie la URL de la barra de URL del explorador.
    3. Cree un archivo CSV con campos para ID, Bucket Name, y Bucket URL.
    4. Pegue la URL del cubo en el archivo CSV como valor de Bucket URL.
      Como alternativa, si los documentos de entrada y los modelos de IA están almacenados en arrendamientos diferentes, agréguelos de forma individual al archivo CSV.
      Cree un archivo CSV con campos para ID, Document Name y Document URL. Para cada documento de Object Storage, haga clic en el icono de tres puntos icono de tres puntos, y seleccione Ver detalles de objeto y copie el valor de Nombre y el valor de Ruta de acceso de URL (URI).

      Pegue el valor de Nombre como Nombre de documento, y pegue el valor de Ruta de acceso de URL (URI) como URL de documento.

  4. En Oracle Analytics, para cada cubo que utilice para almacenar los documentos, haga clic en Crear y, a continuación, en Juego de datos.
  5. Cargue el archivo CSV que ha creado en el paso 3 y guarde el juego de datos.
    Repita los pasos 4 y 5 para cada cubo. Si tiene más de 10 000 documentos, cree varios cubos con un máximo de 10 000 documentos, así como un juego de datos independiente para cada cubo.