Processe Documentos Não Estruturados de Forma Inteligente

O processamento de documentos não estruturados pode ser uma tarefa demorada sem automação inteligente. Vamos usar PDFs de faturas como exemplo - talvez seja necessário extrair informações importantes do cabeçalho, como nome da empresa, data, número da fatura, endereço etc. Provavelmente, você também precisará extrair cada item de linha com vários números de item, descrições, quantidades, preços unitários e totais. Após a extração, essas informações precisam ser publicadas em um sistema de registro, como um banco de dados, um aplicativo de destino como o Oracle E-Business Suite, o Oracle Fusion Cloud Financials ou o Oracle Fusion Cloud SCM, para citar alguns. Por fim, seus usuários finais podem tomar medidas sobre as informações recém-lançadas, seja criando relatórios ou até mesmo um aplicativo personalizado.

Esse cenário é facilmente realizado usando o Oracle Integration Cloud Service para orquestrar vários serviços da Oracle Cloud Infrastructure (OCI). Com o Oracle Integration Cloud Service, você pode se conectar facilmente e integrar seus sistemas de registro, sejam eles executados na OCI ou em outro lugar. Os serviços de IA da OCI, como o OCI Document Understanding, podem ser facilmente combinados com o Oracle Integration Cloud Service para alcançar uma variedade de casos de uso.

Você pode facilmente aplicar essa abordagem a vários outros casos de uso que automatizam o processamento de documentos não estruturados usando modelos predefinidos, como passaportes, carteiras de motorista e recibos. Outros tipos de documento também podem ser processados treinando um modelo personalizado no serviço OCI Document Understanding.

Arquitetura

Essa arquitetura descreve como usar o Oracle Integration Cloud Service para orquestrar serviços da OCI para automatizar o processamento inteligente de documentos não estruturados.

O diagrama a seguir ilustra essa arquitetura de referência.



oic-process-documents-arch.zip

O fluxo de trabalho desta arquitetura se assemelha a:

  1. Uma integração é iniciada pelo Oracle Integration Cloud Service para extrair novos anexos de e-mail (PDFs, PNGs, JPGs etc.) do Microsoft Outlook ou do Gmail usando adaptadores predefinidos.
  2. Os anexos podem ser armazenados no servidor de arquivos incorporado do Oracle Integration Cloud Service ou no OCI Object Storage para retenção de curto a longo prazo.
  3. O OCI Document Understanding é chamado para selecionar e processar os arquivos recém-carregados, retornando JSON estruturado dos campos de chave extraídos de volta ao Oracle Integration Cloud Service.
  4. Se a pontuação de confiança retornada pelo OCI Document Understanding atender a um limite aceitável, a integração transformará e validará o resultado extraído fazendo chamadas adicionais para vários sistemas ou aplicativos usando qualquer um de seus mais de 100 adaptadores pré-criados. Caso contrário, a integração iniciará um processo no Oracle Integration Cloud Service Process Automation para garantir o tratamento de exceções de loop humano. Como parte desse processo, um desenvolvedor ou analista recebe uma notificação por e-mail para revisar o documento e corrigi-lo antes de reenviar ou identificar manualmente os pares de chave/valor necessários para que a integração possa continuar.
  5. Os dados extraídos são inseridos em um sistema de registro, como o Oracle E-Business Suite local, por meio do uso do OCI FastConnect e de um agente de conectividade, o Oracle Fusion Cloud Financials no backbone da Oracle, um Banco de Dados do Oracle Autonomous Transaction Processing por meio de um ponto final privado ou outras aplicações, como Salesforce, SAP e Workday.
  6. Quando os dados extraídos e validados são inseridos em um Banco de Dados Oracle Autonomous Transaction Processing privado como parte do fluxo de integração, agora você pode aproveitar recursos adicionais do OCI para dar aos seus usuários finais maneiras diferentes de interagir com os dados. Por exemplo, você pode facilmente criar um portal personalizado usando o Oracle APEX (uma plataforma low-code incluída no Oracle Database). Este portal pode fornecer aos usuários de negócios a capacidade de consultar e atualizar os dados extraídos por meio de uma interface de usuário personalizada.
  7. Opcionalmente, você pode conectar o Banco de Dados do Oracle Autonomous Transaction Processing a uma instância do Oracle Analytics Cloud na qual os usuários de negócios podem criar relatórios personalizados que revelam as tendências de documentos processados mais importantes.

A arquitetura tem os seguintes componentes:

  • Região

    Região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, denominada domínios de disponibilidade. As regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou até mesmo continentes).

  • Domínios de disponibilidade

    Domínios de disponibilidade são data centers stand-alone e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que oferece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou refrigeração ou a rede interna do domínio de disponibilidade. Portanto, uma falha em um domínio de disponibilidade não deve afetar os outros domínios de disponibilidade na região.

  • Domínios de falha

    Um domínio de falha é um agrupamento de hardware e infraestrutura dentro de um domínio de disponibilidade. Cada domínio de disponibilidade tem três domínios de falha com energia e hardware independentes. Quando você distribui recursos entre vários domínios de falha, seus aplicativos podem tolerar falha no servidor físico, manutenção do sistema e falhas de energia dentro de um domínio de falha.

  • Rede virtual na nuvem (VCN) e sub-redes

    Uma VCN é uma rede personalizável definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, as VCNs oferecem controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após a criação da VCN. Você pode segmentar uma VCN em sub-redes, com escopo definido para uma região ou para um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não se sobrepõem a outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.

  • Rede on-premises

    Essa rede é a rede local usada por sua organização. É um dos raios da topologia.

  • Gateway de roteamento dinâmico (DRG)

    O DRG é um roteador virtual que fornece um caminho para o tráfego de rede privada entre VCNs na mesma região, entre uma VCN e uma rede fora da região, como uma VCN em outra região do Oracle Cloud Infrastructure, uma rede local ou uma rede em outro provedor de nuvem.

  • Gateway de serviço

    O gateway de serviço fornece acesso de uma VCN a outros serviços, como o Oracle Cloud Infrastructure Object Storage. O tráfego da VCN para o serviço Oracle percorre a malha da rede Oracle e não passa pela internet.

  • FastConnect

    O Oracle Cloud Infrastructure FastConnect fornece uma maneira fácil de criar uma conexão privada dedicada entre o seu data center e o Oracle Cloud Infrastructure. O FastConnect fornece opções de largura de banda maior e uma experiência de rede mais confiável quando comparado com conexões baseadas na internet.

  • Tabela de roteamento

    As tabelas de roteamento virtual contêm regras para rotear o tráfego de sub-redes para destinos fora de uma VCN, geralmente por meio de gateways.

  • Lista de segurança

    Para cada sub-rede, você pode criar regras de segurança que especifiquem a origem, o destino e o tipo de tráfego que deve ser permitido dentro e fora da sub-rede.

  • Object Storage

    O armazenamento de objetos oferece acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo backups de bancos de dados, dados de análise e conteúdo avançado, como imagens e vídeos. Você pode armazenar de forma segura e depois recuperar dados diretamente da internet ou de dentro da plataforma da nuvem. Você pode dimensionar o armazenamento sem prejudicar o desempenho ou a confiabilidade do serviço. Use o armazenamento padrão para armazenamento de acesso frequente que você precisa para acessar de forma rápida, imediata e com frequência. Use o armazenamento de arquivos compactados para armazenamento "frio" que você mantém por longos períodos de tempo e raramente acessa.

  • Oracle Services Network

    O Oracle Services Network (OSN) é uma rede conceitual no Oracle Cloud Infrastructure reservada para os serviços Oracle. Esses serviços têm endereços IP públicos que você pode acessar pela internet. Os hosts fora do Oracle Cloud podem acessar o OSN de forma privada usando o Oracle Cloud Infrastructure FastConnect ou o VPN Connect. Os hosts em suas VCNs podem acessar o OSN de forma privada por meio de um gateway de serviço.

  • Integração

    O Oracle Integration é um serviço totalmente gerenciado que permite integrar seus aplicativos, automatizar processos, obter insight sobre seus processos de negócios e criar aplicativos visuais.

  • Análise de documentos

    O Oracle Cloud Infrastructure Document Understanding é um serviço de IA para executar análises de documentos baseadas em aprendizado profundo em escala. Com modelos predefinidos disponíveis prontos para uso, os desenvolvedores podem facilmente criar processamento inteligente de documentos em seus aplicativos sem experiência em machine learning (ML).

  • Analytics

    O Oracle Analytics Cloud é um serviço de nuvem pública escalável e seguro que capacita os analistas de negócios com recursos modernos de análise com autoatendimento para preparação de dados, visualização, relatórios empresariais, análise aumentada e geração e processamento de linguagem natural. Com o Oracle Analytics Cloud, você também obtém recursos flexíveis de gerenciamento de serviços, incluindo configuração rápida, dimensionamento e aplicação de patches fáceis e gerenciamento automatizado do ciclo de vida.

  • Serviço do APEX

    O Oracle APEX é uma plataforma de desenvolvimento de baixo código que permite criar aplicativos empresariais escaláveis, ricos em recursos e seguros que podem ser implantados em qualquer local em que o Oracle Database esteja instalado. Você não precisa ser especialista em uma vasta gama de tecnologias para fornecer soluções sofisticadas. O Oracle APEX inclui recursos internos, como temas de interface do usuário, controles de navegação, handlers de formulários e relatórios flexíveis que aceleram o processo de desenvolvimento de aplicações.

  • Autonomous Transaction Processing

    O Oracle Autonomous Transaction Processing é um banco de dados independente, autoprotegido e autorreparável otimizado para cargas de trabalho de processamento de transações. Você não precisa configurar nem gerenciar nenhum hardware, nem instalar nenhum software. O Oracle Cloud Infrastructure trata da criação do banco de dados, bem como do backup, da aplicação de patches, do upgrade e do ajuste do banco de dados.

  • Serviço IAM (Identity and Access Management)

    O Oracle Cloud Infrastructure Identity and Access Management (IAM) é o plano de controle de acesso do Oracle Cloud Infrastructure (OCI) e do Oracle Cloud Applications. A API do serviço IAM e a interface do usuário permitem gerenciar domínios de identidades e os recursos dentro do domínio de identidades. Cada domínio de identidades do OCI IAM representa uma solução de gerenciamento de identidade e acesso independente ou uma população de usuários diferente.

  • Logging
    O registro em log é um serviço altamente escalável e totalmente gerenciado que oferece acesso aos seguintes tipos de logs de seus recursos na nuvem:
    • Logs de auditoria: Logs relacionados a eventos emitidos pelo serviço Audit.
    • Logs de serviço: Logs emitidos por serviços individuais, como API Gateway, Events, Functions, Load Balancing, Object Storage e logs de fluxo da VCN.
    • Logs personalizados: Logs que contêm informações de diagnóstico de aplicativos personalizados, outros provedores de nuvem ou um ambiente on-premises.
  • Auditoria

    O serviço Oracle Cloud Infrastructure Audit registra automaticamente as chamadas para todos os pontos finais suportados da API (application programming interface) pública do Oracle Cloud Infrastructure como eventos de log. Atualmente, todos os serviços suportam logs do Oracle Cloud Infrastructure Audit.

Recomendações

Use as seguintes recomendações como ponto de partida para implementar o processamento inteligente de documentos com o Oracle Integration Cloud Service. Seus requisitos podem ser diferentes da arquitetura descrita aqui.
  • Restringir o Acesso a uma Instância do Oracle Integration Cloud Service

    Restrinja as redes que têm acesso à sua instância do Oracle Integration Cloud Service configurando uma lista de permissões (anteriormente uma lista de permissões). Somente usuários de endereços IP específicos, blocos CIDR (Classless Interdomain Routing) e redes virtuais na nuvem que você especificar poderão acessar a instância.

  • Conectividade

    Ao implantar recursos no OCI, você pode começar pequeno, com uma única conexão com sua rede local. Essa conexão única pode ser por meio de FastConnect ou por meio de IPSec VPN. Para planejar a redundância, considere todos os componentes (dispositivos de hardware, instalações, circuitos e energia) entre sua rede local e a OCI. Considere também a diversidade, para garantir que as instalações não sejam compartilhadas entre os caminhos.

  • Usar o Agente de Conectividade em Ambientes de Alta Disponibilidade

    Você pode usar o agente de conectividade em ambientes de alta disponibilidade com o Oracle Integration Cloud Service instalando o agente de conectividade duas vezes em hosts diferentes. Os agentes de conectividade podem ser dimensionados horizontalmente, fornecendo todos os benefícios da execução de vários agentes para um grupo de agentes. Isso resulta em maior desempenho e amplia os benefícios de failover.

  • Usar Pontos Finais Privados

    Um ponto final privado permite que suas integrações se conectem a recursos privados na sua rede virtual na nuvem (VCN). Todo o tráfego passa por um canal privado que é configurado na OCI. Você pode configurar um ponto final privado por instância. Isso permite que sua instância do Oracle Integration Cloud Service acesse recursos privados sem precisar passar por um agente de conectividade.

Confirmações

  • Autors: Nolan Trouvé, Jerry Mbamo
  • Colaborador: Daryl Eicher