Note:

Análisis de documentos PDF en lenguaje natural con OCI Generative AI

Introducción

Oracle Cloud Infrastructure Generative AI (OCI Generative AI) es una solución avanzada de inteligencia artificial generativa que permite a empresas y desarrolladores crear aplicaciones inteligentes utilizando modelos de lenguaje de vanguardia. Basada en potentes tecnologías como los grandes modelos de lenguaje (LLM), esta solución permite la automatización de tareas complejas, haciendo que los procesos sean más rápidos, eficientes y accesibles a través de interacciones de lenguaje natural.

Una de las aplicaciones más impactantes de OCI Generative AI es el análisis de documentos PDF. Las empresas a menudo se ocupan de grandes volúmenes de documentos, como contratos, informes financieros, manuales técnicos y documentos de investigación. La búsqueda manual de información en estos archivos puede llevar mucho tiempo y ser propensa a errores.

Con el uso de la inteligencia artificial generativa, es posible extraer información de forma instantánea y precisa, lo que permite a los usuarios consultar documentos complejos simplemente formulando preguntas en lenguaje natural. Esto significa que, en lugar de leer páginas completas para encontrar una cláusula específica en un contrato o un punto de datos relevante en un informe, los usuarios pueden simplemente preguntar al modelo, que devuelve rápidamente la respuesta basada en el contenido analizado.

Además de la recuperación de información, OCI Generative AI también se puede utilizar para resumir documentos largos, comparar contenido, clasificar información e incluso generar insights estratégicos. Estas capacidades hacen que la tecnología sea esencial para varios campos, como los legales, financieros, sanitarios e ingeniería, optimizando la toma de decisiones y aumentando la productividad.

Al integrar esta tecnología con herramientas como los servicios de Oracle AI, OCI Data Science y API para el procesamiento de documentos, las empresas pueden crear soluciones inteligentes que transformen completamente la forma en que interactúan con sus datos, lo que hace que la recuperación de información sea más rápida y efectiva.

Requisitos

Tarea 1: Instalación de paquetes de Python

El código Python requiere determinadas bibliotecas para utilizar OCI Generative AI. Ejecute el siguiente comando para instalar los paquetes de Python necesarios.

pip install -r requirements.txt

Tarea 2: Descripción del código Python

Esta es una demostración de OCI Generative AI para consultar funcionalidades de Oracle SOA Suite y Oracle Integration. Ambas herramientas se utilizan actualmente para estrategias de integración híbrida, lo que significa que operan tanto en entornos locales como en la nube.

Dado que estas herramientas comparten funcionalidades y procesos, este código ayuda a comprender cómo implantar el mismo enfoque de integración en cada herramienta. Además, permite a los usuarios explorar características y diferencias comunes.

Descargue el código Python desde aquí:

Puede encontrar los documentos PDF aquí:

Cree una carpeta denominada Manuals y mueva estos PDF allí.

Ahora, puede elegir 3 opciones para procesar los documentos. Puedes pensar:

Por lo tanto, tiene las siguientes opciones:

Fixed Size Chunking: una alternativa más rápida para procesar los documentos. Puede ser suficiente para obtener lo que quieres.

Fragmentación semántica: este proceso será más lento que la fragmentación de tamaño fijo, pero proporcionará más fragmentación de calidad.

Fragmentación semántica con GraphRAG: entregará un método más preciso porque organizará los textos de fragmentación y los gráficos de conocimientos.

Fragmentación de tamaño fijo

Descargue el código desde aquí: oci_genai_llm_context_fast.py.

Fragmentación semántica

Descargue el código desde aquí: oci_genai_llm_context.py.

Fragmentación semántica con GraphRAG

Descargue el código desde aquí: oci_genai_llm_graphrag.py.

GraphRAG (Generación aumentada por recuperación aumentada por gráficos) es una arquitectura de IA avanzada que combina la recuperación tradicional basada en vectores con gráficos de conocimientos estructurados. En un pipeline RAG estándar, un modelo de lenguaje recupera fragmentos de documentos relevantes utilizando la similitud semántica de una base de datos vectorial (como FAISS). Sin embargo, la recuperación basada en vectores funciona de manera no estructurada, basándose únicamente en incrustaciones y métricas de distancia, que a veces pierden significados contextuales o relacionales más profundos.

GraphRAG mejora este proceso mediante la introducción de una capa de gráfico de conocimientos, donde las entidades, los conceptos, los componentes y sus relaciones se representan explícitamente como nodos y bordes. Este context basado en gráficos permite al modelo de lenguaje razonar sobre relaciones, jerarquías y dependencias que la similitud de vectores por sí sola no puede capturar.

Nota:

Neo4j Uso:

Esta implantación utiliza Neo4j como base de datos de gráficos de conocimientos integrada para fines de demostración y creación de prototipos. Si bien Neo4j es una base de datos de gráficos potente y flexible adecuada para cargas de trabajo de desarrollo, prueba y pequeñas y medianas, puede que no cumpla los requisitos para cargas de trabajo empresariales, esenciales o de alta seguridad, especialmente en entornos que exigen alta disponibilidad, escalabilidad y conformidad de seguridad avanzada.

Para entornos de producción y escenarios empresariales, recomendamos aprovechar Oracle Database con capacidades de Gráfico, que ofrece:

Al utilizar Oracle Database para cargas de trabajo de grafos, las organizaciones pueden unificar datos estructurados, semiestructurados y graficados en una única plataforma empresarial segura y ampliable.

Tarea 3: Ejecutar Consulta para Contenido de Oracle Integration y Oracle SOA Suite

Ejecute el siguiente comando.

FOR FIXED CHUNKING TECHNIQUE (MORE FASTER METHOD)
python oci_genai_llm_context_fast.py --device="mps" --gpu_name="M2Max GPU 32 Cores"
FOR SEMANTIC CHUNKING TECHNIQUE
python oci_genai_llm_context.py --device="mps" --gpu_name="M2Max GPU 32 Cores"
FOR SEMANTIC CHUNKING COMBINED WITH GRAPHRAG TECHNIQUE
python oci_genai_llm_graphrag.py --device="mps" --gpu_name="M2Max GPU 32 Cores"

Nota: Los parámetros --device y --gpu_name se pueden utilizar para acelerar el procesamiento en Python, mediante GPU si la máquina tiene uno. Tenga en cuenta que este código también se puede utilizar con modelos locales.

El contexto proporcionado distingue a Oracle SOA Suite y Oracle Integration. Puede probar el código teniendo en cuenta estos puntos:

Podemos definir el siguiente contexto, lo que ayuda en gran medida a interpretar los documentos correctamente.

img_7.png

En la siguiente imagen se muestra el ejemplo de comparación entre Oracle SOA Suite y Oracle Integration.

img.png

Pasos Siguientes

En este código se muestra una aplicación de OCI Generative AI para el análisis inteligente en PDF. Permite a los usuarios consultar de manera eficiente grandes volúmenes de documentos mediante búsquedas semánticas y un modelo de IA generativa para generar respuestas precisas en lenguaje natural.

Este enfoque se puede aplicar en varios campos, como el legal, el cumplimiento, el soporte técnico y la investigación académica, lo que hace que la recuperación de información sea mucho más rápida e inteligente.

Acuses de recibo

Más recursos de aprendizaje

Explore otros laboratorios en docs.oracle.com/learn o acceda a más contenido de aprendizaje gratuito en el canal YouTube de Oracle Learning. Además, visite education.oracle.com/learning-explorer para convertirse en un explorador de Oracle Learning.

Para obtener documentación sobre el producto, visite Oracle Help Center.