Observação:

Analise documentos PDF em linguagem natural com a OCI Generative AI

Introdução

A Oracle Cloud Infrastructure Generative AI (OCI Generative AI) é uma solução avançada de inteligência artificial generativa que permite que empresas e desenvolvedores criem aplicações inteligentes usando modelos de linguagem de ponta. Com base em tecnologias poderosas, como os Grandes Modelos de Linguagem (LLMs), esta solução permite a automação de tarefas complexas, tornando os processos mais rápidos, mais eficientes e acessíveis por meio de interações de linguagem natural.

Uma das aplicações mais impactantes da OCI Generative AI é a análise de documentos em PDF. As empresas frequentemente lidam com grandes volumes de documentos, como contratos, relatórios financeiros, manuais técnicos e documentos de pesquisa. A busca manual de informações nesses arquivos pode ser demorada e propensa a erros.

Com o uso da inteligência artificial generativa, é possível extrair informações de forma instantânea e precisa, permitindo que os usuários consultem documentos complexos simplesmente formulando perguntas em linguagem natural. Isso significa que, em vez de ler páginas inteiras para encontrar uma cláusula específica em um contrato ou um ponto de dados relevante em um relatório, os usuários podem apenas perguntar ao modelo, que retorna rapidamente a resposta com base no conteúdo analisado.

Além da recuperação de informações, a OCI Generative AI também pode ser usada para resumir documentos longos, comparar conteúdo, classificar informações e até mesmo gerar insights estratégicos. Esses recursos tornam a tecnologia essencial para vários campos, como jurídico, financeiro, saúde e engenharia, otimizando a tomada de decisões e aumentando a produtividade.

Ao integrar essa tecnologia com ferramentas como serviços Oracle AI, OCI Data Science e APIs para processamento de documentos, as empresas podem criar soluções inteligentes que transformam completamente a maneira como interagem com seus dados, tornando a recuperação de informações mais rápida e eficaz.

Pré-requisitos

Tarefa 1: Instalar Pacotes Python

O código Python requer certas bibliotecas para usar a OCI Generative AI. Execute o seguinte comando para instalar os pacotes Python necessários.

pip install -r requirements.txt

Tarefa 2: Compreender o Código Python

Esta é uma demonstração da OCI Generative AI para consultar funcionalidades do Oracle SOA Suite e do Oracle Integration. Ambas as ferramentas são usadas atualmente para estratégias de integração híbrida, o que significa que operam em ambientes de nuvem e on-premises.

Como essas ferramentas compartilham funcionalidades e processos, esse código ajuda a entender como implementar a mesma abordagem de integração em cada ferramenta. Além disso, permite que os usuários explorem características e diferenças comuns.

Faça o download do código Python aqui:

Você pode encontrar os documentos PDF aqui:

Crie uma pasta chamada Manuals e mova esses PDFs para lá.

Agora, você pode escolher 3 opções para processar os documentos. Você pode pensar:

Portanto, você tem estas opções:

Fixed Size Chunking: Esta é uma alternativa mais rápida para processar seus documentos. Pode ser suficiente para obter o que você quer.

Divisão Semântica: Esse processo será mais lento do que a divisão em blocos de tamanho fixo, mas fornecerá mais divisão em blocos de qualidade.

Divisão Semântica com GraphRAG: Ele fornecerá um método mais preciso porque organizará os textos de divisão em blocos e os gráficos de conhecimento.

Divisão em blocos de tamanho fixo

Faça download do código aqui: oci_genai_llm_context_fast.py.

Divisão em blocos semânticos

Faça download do código aqui: oci_genai_llm_context.py.

Divisão em Blocos Semânticos com GraphRAG

Faça download do código aqui: oci_genai_llm_graphrag.py.

GraphRAG (Geração Aumentada de Recuperação de Gráficos) é uma arquitetura de IA avançada que combina a recuperação tradicional baseada em vetores com gráficos de conhecimento estruturados. Em um pipeline RAG padrão, um modelo de linguagem recupera partes de documentos relevantes usando similaridade semântica de um banco de dados vetorial (como FAISS). No entanto, a recuperação baseada em vetores opera de maneira não estruturada, contando puramente com incorporações e métricas de distância, que às vezes perdem significados contextuais ou relacionais mais profundos.

GraphRAG aprimora esse processo introduzindo uma camada de gráfico de conhecimento, na qual entidades, conceitos, componentes e seus relacionamentos são representados explicitamente como nós e bordas. Esse context baseado em gráfico permite que o modelo de linguagem raciocine sobre relacionamentos, hierarquias e dependências que a similaridade vetorial sozinha não pode capturar.

Observação:

Neo4j Uso:

Essa implementação usa o Neo4j como um banco de dados de gráfico de conhecimento incorporado para fins de demonstração e prototipagem. Embora o Neo4j seja um banco de dados gráfico avançado e flexível adequado para desenvolvimento, teste e cargas de trabalho de pequeno a médio porte, ele pode não atender aos requisitos para cargas de trabalho de nível empresarial, de missão crítica ou altamente seguras, especialmente em ambientes que exigem alta disponibilidade, escalabilidade e conformidade de segurança avançada.

Para ambientes de produção e cenários corporativos, recomendamos aproveitar o Oracle Database com recursos do Graph, que oferece:

Ao usar o Oracle Database para cargas de trabalho gráficas, as organizações podem unificar dados estruturados, semiestruturados e gráficos em uma única plataforma empresarial segura e escalável.

Tarefa 3: Executar Consulta para o Conteúdo do Oracle Integration e do Oracle SOA Suite

Execute o seguinte comando.

FOR FIXED CHUNKING TECHNIQUE (MORE FASTER METHOD)
python oci_genai_llm_context_fast.py --device="mps" --gpu_name="M2Max GPU 32 Cores"
FOR SEMANTIC CHUNKING TECHNIQUE
python oci_genai_llm_context.py --device="mps" --gpu_name="M2Max GPU 32 Cores"
FOR SEMANTIC CHUNKING COMBINED WITH GRAPHRAG TECHNIQUE
python oci_genai_llm_graphrag.py --device="mps" --gpu_name="M2Max GPU 32 Cores"

Observação: Os parâmetros --device e --gpu_name podem ser usados para acelerar o processamento em Python, usando GPU se sua máquina tiver um. Considere que esse código também pode ser usado com modelos locais.

O contexto fornecido faz a distinção entre Oracle SOA Suite e Oracle Integration. Você pode testar o código considerando estes pontos:

Podemos definir o contexto a seguir, o que ajuda muito na interpretação correta dos documentos.

img_7.png

A imagem a seguir mostra o exemplo de comparação entre o Oracle SOA Suite e o Oracle Integration.

img.png

Próximas Etapas

Este código demonstra uma aplicação da OCI Generative AI para análise inteligente de PDF. Ele permite que os usuários consultem com eficiência grandes volumes de documentos usando pesquisas semânticas e um modelo de IA generativa para gerar respostas precisas em linguagem natural.

Essa abordagem pode ser aplicada em diversos campos, como jurídico, compliance, suporte técnico e pesquisa acadêmica, tornando a recuperação de informações muito mais rápida e inteligente.

Confirmações

Mais Recursos de Aprendizado

Explore outros laboratórios em docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal do Oracle Learning YouTube. Além disso, acesse education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.

Para obter a documentação do produto, visite o Oracle Help Center.