Usar linguagem OCI para análise de feedback do cliente

Dados de texto, como publicações de mídia social, notícias e pesquisas, fornecem informações valiosas sobre negócios e clientes. Na maioria das vezes, é muito demorado analisar manualmente grandes volumes de dados textuais. Portanto, as empresas recorrem ao processamento de linguagem natural (NLP) para obter insights de forma eficaz e em escala. Para usar esses recursos de NLP, você deve contar com cientistas de dados para criar e treinar modelos de aprendizado de máquina personalizados e, em seguida, implantar esses modelos nos aplicativos. Esse processo é muitas vezes demorado e caro.

A linguagem do Oracle Cloud Infrastructure (OCI) reduz esse tempo e esforço fornecendo os principais recursos de processamento de linguagem como modelos pré-treinados prontos para produção para descobrir insights em texto não estruturado e elimina a necessidade da experiência com aprendizado de máquina. Você pode usar a Linguagem do OCI para automatizar a análise de texto em escala e entender o texto não estruturado em documentos, interações de feedback do cliente ou tíquetes de suporte em relação a qualquer problema ou revisão. Isso permite extrair informações para melhorar a experiência do cliente e aumentar a eficiência.

A Linguagem do OCI capacita os desenvolvedores a aplicar recursos como análise de sentimentos, extração de frase-chave, classificação de texto, reconhecimento de entidade nomeado e muito mais nos aplicativos. Os desenvolvedores podem integrar recursos pré-treinados de NLP a aplicativos, sem a necessidade de cientistas de dados para criar modelos personalizados. A linguagem OCI pode ser acessada por meio da console do OCI, SDKs do OCI em Python, Java, Go, Typescript, .Rede, APIs REST ou OCI-CLI.

O uso da linguagem OCI fornece os seguintes benefícios:
  • Melhorar a experiência do cliente: explore como os clientes usam o(s) produto(s), extraia sentimentos sobre determinadas áreas de interesse e identifique frustrações importantes para resolvê-las em tempo hábil.
  • Identificar dados importantes: extraia entidades nomeadas do feedback do cliente para identificar pessoas, produtos e organizações mencionadas.
  • Garanta a segurança e a privacidade: a linguagem OCI mantém a privacidade do cliente com modelos de idioma que não armazenam dados para fins de treinamento, depuração ou outros. Além disso, a Linguagem OCI pode ser usada para identificar quaisquer informações potenciais de identificação pessoal (PII) para proteger a privacidade do cliente.

Arquitetura

Essa arquitetura demonstra o relacionamento entre os vários componentes em um sistema típico que tem a Linguagem do OCI em seu núcleo.

Cerca de 80% dos dados do mundo estão em formatos não estruturados, na maioria das vezes, escritos em linguagem natural. Esta arquitetura de referência ilustra qualquer sistema que recebe feedback dos clientes. Neste exemplo específico, vamos usar um aplicativo de reserva para o setor de hotelaria que inclui alojamento, serviço de alimentação e bebidas, planejamento de eventos, parques temáticos, hotéis, agências de viagens, restaurantes ou bares. O diagrama a seguir descreve como você pode usar os recursos de IA pré-criados para analisar, explorar e visualizar o feedback dos clientes para extrair insights para melhorar a experiência do cliente.

Uma cadeia de hotéis solicita que os clientes façam comentários após o check-out. Há um fluxo contínuo de feedback que precisa ser analisado. O hotel usa uma planilha para capturar milhares de avaliações, sendo que cada linha consiste em uma avaliação do cliente: feliz ou não feliz com o serviço, localização ou comida. Essas informações podem ser usadas para melhorar produtos, serviços vendidos ou toda a empresa. Como há tantas informações não estruturadas, os dados precisam ser ingeridos, os insights precisam ser extraídos dessas informações e, em seguida, analisados e visualizados. O serviço de integração de dados é usado para orquestrar o fluxo de dados nessa arquitetura de referência.

O diagrama a seguir ilustra essa arquitetura de referência.

Veja a seguir a descrição da ilustração oci-ai-language-arch.png
Descrição da ilustração oci-ai-language-arch.png

oci-ai-language-arch-oracle.zip

A seção a seguir descreve o fluxo de análise de feedback do cliente nessa arquitetura de referência.
  1. Agregue os dados de revisão do cliente em uma origem de dados como um banco de dados ou arquivo. Para fins deste exemplo, vamos supor que os dados estejam em um arquivo .csv no armazenamento de objetos.
  2. A integração de dados pode ler os dados da origem de dados e, para cada revisão do cliente, enviar chamadas para a Linguagem do OCI por meio de uma função sem servidor.
  3. O Idioma do OCI extrai uma lista de aspectos e seus sentimentos relacionados (positivos, negativos, neutros) de cada registro. Além disso, a Linguagem do OCI extrai a lista de entidades mencionadas no registro enviado a ela, como os nomes de pessoas ou organizações mencionados em cada revisão.

    Por exemplo: Uma das avaliações menciona: "Ei, o hotel era lindo, a equipe era muito gentil comigo, mas a comida do café da manhã não era tão grande". A Linguagem do OCI extrairá aspectos como "hotel", "breakfast" e "staff" e nos informará que "hotel" e "staff" têm sentimento positivo e que "breakfast" tem sentimento negativo.

    Também é possível extrair entidades, como nomes de pessoas, locais, organizações e eventos usando a Linguagem OCI.

  4. Quando os aspectos e as entidades são recebidos pela integração dos dados, essas informações são projetadas como um conjunto de tabelas no Autonomous Data Warehouse. São projetadas três tabelas diferentes: uma tabela para os dados da revisão bruta, uma tabela para cada um dos aspectos detectados e seu sentimento e uma tabela com as entidades identificadas.

    O banco de dados de destino também pode ser um tipo diferente de banco de dados, como o MySQL.

  5. Em seguida, você pode usar o Oracle Analytics Cloud para visualizar os insights extraídos. O Oracle Analytics Cloud permite que você crie gráficos das tabelas extraídas e filtre os dados. Por exemplo, você pode plotar o sentimento ao longo do tempo em um gráfico ou visualizar os aspectos que são os mais propensos a causar sentimento positivo ou negativo em uma nuvem de palavras.

    O processo de transformar o arquivo da Linguagem OCI e exibir as informações no Oracle Analytics Cloud é o seguinte: Armazenamento de Objetos → Serviço de Integração de Dados → Oracle Functions → Linguagem OCI → Oracle Functions → Serviço de Integração de Dados → Autonomous Data Warehouse → Oracle Analytics Cloud.

A arquitetura tem os seguintes componentes:

  • Região

    Uma região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, chamados domínios de disponibilidade. As regiões são independentes de outras regiões, e grande distância pode separá-las (entre países ou até mesmo continentes).

  • Domínios de disponibilidade

    Os domínios de disponibilidade são data centers independentes e independentes dentro de uma região. Os recursos físicos em cada domínio de disponibilidade são isolados dos recursos dos outros domínios de disponibilidade, que fornecem tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura, como energia ou resfriamento, ou rede interna. Portanto, é improvável que uma falha em um domínio de disponibilidade afete os outros domínios de disponibilidade da região.

  • Rede virtual na nuvem (VCN) e sub-redes

    Uma VCN é uma rede personalizada e definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, as VCNs permitem total controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após criar a VCN. Você pode segmentar uma VCN em sub-redes, que podem ter escopo em uma região ou em um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contínuo de endereços que não se sobrepõem com as outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.

  • Balanceador de Carga

    O serviço Oracle Cloud Infrastructure Load Balancing fornece distribuição automatizada de tráfego de um ponto de entrada para vários servidores acessíveis na sua VCN (rede virtual na nuvem). O serviço oferece um balanceador de carga com a sua escolha de endereço IP público ou privado e largura de banda provisionada. Um balanceador de carga melhora a utilização dos recursos, facilita o escalonamento e ajuda a assegurar alta disponibilidade.

    Você pode configurar várias políticas de balanceamento de carga e verificações de integridade específicas para o aplicativo para garantir que o balanceador de carga direcione o tráfego apenas para instâncias íntimas. O balanceador de carga pode reduzir a sua janela de manutenção diminuindo o tráfego de um servidor de aplicativos não saudável antes de você removê-lo do serviço para manutenção.

    O serviço Load Balancing permite que você crie um balanceador de carga público ou privado dentro da sua VCN. Um balanceador de carga público tem um endereço IP público acessível pela internet. Um balanceador de carga privado tem um endereço IP da sub-rede de hospedagem, que fica visível somente dentro da sua VCN. Sub-redes dedicadas serão criadas para Balanceadores de Carga Privados ou Públicos para requisitos futuros. O balanceador de carga Público do OCI com o Oracle Cloud Infrastructure WAF será considerado para qualquer aplicativo Web voltado para a internet ou para qualquer API baseada em HTTP.

  • Listas de segurança

    Para cada sub-rede, você pode criar regras de segurança que especifiquem a origem, o destino e o tipo de tráfego que devem ser permitidos dentro e fora da sub-rede.

  • Tabelas de roteamento

    As tabelas de roteamento virtual contêm regras para rotear o tráfego de sub-redes para destinos fora de uma VCN, normalmente por meio de gateways.

  • Gateway de Internet

    O gateway de internet permite tráfego entre as sub-redes públicas em uma VCN e a internet pública.

  • Conexão VPN

    O VPN Connect fornece conectividade de VPN IPSec site a site entre a sua rede local e VCNs no Oracle Cloud Infrastructure. A suíte de protocolos IPSec criptografa o tráfego IP antes que os pacotes sejam transferidos da origem para o destino e decriptografa o tráfego quando ele chega.

  • Gerenciamento de identidade e acesso (IAM)

    O serviço Oracle Cloud Infrastructure Identity and Access Management (IAM) permite controlar quem pode acessar seus recursos no Oracle Cloud Infrastructure e as operações que eles podem executar nesses recursos.

  • Object Storage

    O armazenamento de objetos fornece acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo backups de bancos de dados, dados analíticos e conteúdo avançado, como imagens e vídeos. Você pode armazenar de forma segura e depois recuperar dados diretamente da internet ou de dentro da plataforma da nuvem. Você pode dimensionar o armazenamento de forma integrada, sem perder nenhuma degradação no desempenho ou na confiabilidade do serviço. Use o armazenamento padrão para armazenamento "dinâmico" que você precisa para acessar rapidamente, imediatamente e com frequência. Use o armazenamento de arquivos compactados para armazenamento "frio" que você mantém por longos períodos de tempo e raramente ou raramente acessa.

  • Serviço de integração de dados

    O Oracle Cloud Infrastructure Data Integration é um serviço nativo da nuvem totalmente gerenciado, sem servidor, que extrai, carrega, transforma, limpa e recupera dados de uma variedade de origens de dados nos serviços do Oracle Cloud Infrastructure de destino, como o Autonomous Data Warehouse e o Oracle Cloud Infrastructure Object Storage. O ETL (extract transform load) utiliza o processamento de escalonamento horizontal totalmente gerenciado no Spark, e o ELT (extract load transform) aproveita os recursos completos de push-down do SQL do Autonomous Data Warehouse para minimizar o movimento de dados e melhorar o tempo de retorno dos dados recém-ingeridos. Os usuários criam processos de integração de dados usando uma interface de usuário intuitiva e sem codificação que otimiza os fluxos de integração para gerar o mecanismo e a orquestração mais eficientes, alocando e dimensionando automaticamente o ambiente de execução. O Oracle Cloud Infrastructure Data Integration fornece exploração interativa e preparação de dados e ajuda os engenheiros de dados a protegerem contra desvio de esquema, definindo regras para lidar com alterações de esquema.

    No exemplo de revisões do hotel, você pode criar um fluxo de dados para ler seus dados não estruturados, chamar a Linguagem do OCI para extrair informações do texto e, em seguida, projetar as informações extraídas em tabelas estruturadas em um banco de dados. Para obter mais informações, consulte o post do blog vinculado: Extraindo insights de dados não estruturados usando os serviços AI na seção "Mais Informações".

  • Funções

    O Oracle Functions é uma plataforma Functions-as-a-Service (FaaS) totalmente gerenciada, multitenant, altamente escalável e sob demanda. Ele é ativado pelo mecanismo de código aberto do Fn Project. As funções permitem implantar o código, chamá-lo diretamente ou acioná-lo em resposta a eventos. O Oracle Functions usa contêineres Docker hospedados no Oracle Cloud Infrastructure Registry.

  • Idioma do OCI

    A Linguagem do OCI é um serviço sem servidor e multitenant acessível usando chamadas de API REST. Ele fornece modelos pré-treinados que são frequentemente treinados e monitorados para obter os melhores resultados. A linguagem fornece recursos de inteligência artificial e aprendizado de máquina para detectar a linguagem em seu texto não estruturado. Além disso, ele fornece outras ferramentas para ajudá-lo a obter mais informações sobre o texto.

  • Autonomous Data Warehouse

    O Oracle Autonomous Data Warehouse é um serviço de banco de dados independente, com autoproteção e autorreparo otimizado para cargas de trabalho de data warehouse. Não é necessário configurar ou gerenciar nenhum hardware ou instalar qualquer software. O Oracle Cloud Infrastructure trata da criação do banco de dados, bem como de backup, aplicação de patches, upgrade e ajuste do banco de dados.

  • Oracle Analytics Cloud

    O Oracle Analytics Cloud é um serviço de nuvem pública escalável e seguro que capacita os analistas de negócios com recursos modernos de análise com autoatendimento baseados em IA para preparação de dados, visualização, relatórios empresariais, análise aumentada e geração e processamento de linguagem natural. Com o Oracle Analytics Cloud, você também obtém recursos flexíveis de gerenciamento de serviços, incluindo configuração rápida, escalonamento e aplicação de patches fáceis e gerenciamento automatizado do ciclo de vida.

    A transformação de milhares de revisões não estruturadas em formatos estruturados, como a tabela de aspectos, permite usar os dados para cenários, como análise de dados, modelos de aprendizado de máquina de treinamento e pesquisa. Para o exemplo de revisões do hotel, você pode carregar os dados no Oracle Analytics Cloud para visualizar as informações e explorar as informações de uma forma que permita identificar tarefas acionáveis. Para obter mais informações, consulte o post do blog vinculado: Extraindo insights de dados não estruturados usando os serviços AI na seção "Mais Informações".

  • Domínios de falha

    Domínio de falha é um agrupamento de hardware e infraestrutura dentro de um domínio de disponibilidade. Cada domínio de disponibilidade tem três domínios de falha, com energia e hardware independentes. Quando você distribui recursos entre vários domínios de falha, seus aplicativos podem tolerar falhas físicas do servidor, manutenção do sistema e falhas de alimentação dentro de um domínio de falha.

  • Análise, AM e aplicativos personalizados

    Serviços de análise e aplicativos personalizados que catalogarão, prepararão, processarão e analisarão dados.

Recomendações

Use as seguintes recomendações como ponto de partida. Seus requisitos podem ser diferentes da arquitetura descrita aqui.
  • VCN

    Ao criar uma VCN, determine o número de blocos CIDR necessários e o tamanho de cada bloco com base no número de recursos que você planeja anexar a sub-redes na VCN. Use blocos CIDR que estão dentro do espaço de endereço IP privado padrão.

    Selecione blocos CIDR que não se sobreponham a nenhuma outra rede (no Oracle Cloud Infrastructure, seu data center local ou outro provedor de nuvem) para a qual você pretende configurar conexões privadas.

    Depois de criar uma VCN, você pode alterar, adicionar e remover seus blocos CIDR.

    Ao projetar as sub-redes, considere seu fluxo de tráfego e os requisitos de segurança. Anexe todos os recursos de uma camada ou atribuição específica à mesma sub-rede, que pode servir como limite de segurança.

  • Segurança

    Use políticas para restringir quem pode acessar os recursos do OCI que sua empresa tem e como eles podem acessá-los. Quando qualquer configuração incorreta ou atividade insegura é detectada, o Cloud Guard recomenda ações corretivas e ajuda com essas ações, com base nas receitas do respondedor que você pode definir.

    Para recursos que exigem segurança máxima, a Oracle recomenda o uso de zonas de segurança. Uma zona de segurança é um compartimento associado a uma receita de políticas de segurança definida pela Oracle que se baseiam nas melhores práticas. Por exemplo, os recursos em uma zona de segurança não devem ser acessíveis por meio da internet pública e devem ser criptografados usando chaves gerenciadas pelo cliente.

    Quando você cria e atualiza recursos em uma zona de segurança, o OCI valida as operações para as políticas na receita de zona de segurança e nega as operações que violam qualquer uma das políticas.

  • Autonomous Data Warehouse

    Essa arquitetura usa o Oracle Autonomous Data Warehouse em infraestrutura compartilhada. Ative o dimensionamento automático para fornecer as cargas de trabalho do banco de dados até três vezes o poder de processamento.

    Considere o uso do recurso de tabelas particionadas híbridas do Autonomous Data Warehouse para mover partições de dados para o Oracle Cloud Infrastructure Object Storage e servi-las aos usuários e aplicativos de forma transparente. Recomendamos que você use esse recurso para dados que não são geralmente consumidos e para os quais não é necessário o mesmo desempenho que para dados armazenados no Autonomous Data Warehouse.

    Considere o uso do recurso de tabelas externas para consumir dados armazenados no Oracle Cloud Infrastructure Object Storage em tempo real sem a necessidade de replicá-los no Autonomous Data Warehouse. Esse recurso une de forma transparente e integrada conjuntos de dados com curadoria externa ao Autonomous Data Warehouse, independentemente do formato (parquet, avro, orc, json, csv etc.), com dados que residem no Autonomous Data Warehouse.

    Considere o uso do acelerador de consultas do ADW ao consumir dados de armazenamento de objetos para oferecer aos usuários uma experiência aprimorada e mais rápida.

  • Armazenamento de Objetos

    Essa arquitetura usa a saída processada de armazenamento do Oracle Cloud Infrastructure Object Storage padrão para que outros serviços de nuvem possam acessar a saída para análise e exibição adicionais.

  • Largura de banda do balanceador de carga

    Ao criar o balanceador de carga, você pode selecionar uma forma predefinida que forneça uma largura de banda fixa ou especificar uma forma personalizada (flexível) na qual você defina um intervalo de largura de banda e deixe que o serviço escale a largura de banda automaticamente com base nos padrões de tráfego. Com qualquer uma das abordagens, você pode alterar a configuração a qualquer momento após criar o balanceador de carga.

Considerações

Considere os pontos a seguir ao implantar essa arquitetura de referência.

  • Limites de recursos

    Considere as melhores práticas, limites por serviço e cotas de compartimento para sua tenancy.

  • Conectividade

    Considere o uso do FastConnect se quiser uma conexão privada dedicada entre suas instalações e o OCI, caso contrário, use o VCN Connect.

  • Monitoramento do OCI

    O serviço OCI Monitoring permite monitorar de forma ativa e passiva seus recursos de nuvem usando as funcionalidades de métricas e alarmes.

  • Custo

    Use formas flexíveis para selecionar o número de CPUs e a quantidade de memória necessária para as cargas de trabalho executadas na instância. Essa flexibilidade permite que você crie VMs que correspondam à sua carga de trabalho, permitindo otimizar o desempenho e minimizar os custos. O serviço OCI Monitoring permite monitorar de forma ativa e passiva seus recursos de nuvem usando as funcionalidades de métricas e alarmes.

  • Chatbots com análise de sentimento em tempo real

    Como projeto futuro, essa arquitetura pode ser adaptada para usar chatbots. A análise de sentimento evoluiu para incluir o mapeamento narrativo em tempo real que permite ao chatbot observar as palavras importantes em uma sentença e atribuí-las um valor relativo de positivo, neutro ou negativo, dando ao bot um entendimento de todo o tenor da conversa.

Agradecimentos

  • Autor: Gabriel Grigorie
  • Colaboradores: Hassan Ajan, Luis Cabrera-Cordon, Mari Messinger

Alterar Log

Esse log lista as alterações significativas: