Conceitos para Agentes de IA Generativa
Aqui estão alguns conceitos e termos relacionados ao serviço OCI Generative AI Agents.
Modelo do Generative AI
Um modelo de linguagem grande (LLM), treinado em grandes quantidades de dados, que recebe entradas em que não foi treinado antes e gera novo conteúdo. O serviço Agentes de IA Generativa usa um LLM ao processar solicitações e gerar respostas.
Agente
Um sistema autônomo baseado em LLM que entende e gera texto semelhante ao humano, permitindo interações de processamento de linguagem natural. Os Agentes de IA Generativa suportam agentes de geração aumentada de recuperação (RAG). Um agente RAG se conecta a uma origem de dados, recupera dados e aumenta as respostas do modelo com as informações das origens de dados para gerar respostas mais relevantes. Exemplos de outros agentes de IA são agentes que podem chamar APIs dinamicamente, como agentes que atendem a consultas de suporte ao cliente em uma interface de conversa ou agentes que podem comprar itens automaticamente em nome do cliente.
Ao usar agentes RAG, os modelos precisam ser executados com alta respondência e base:
- Capacidade de resposta
-
O modelo pode gerar respostas relevantes para consultas do usuário.
- Fundição
- As respostas geradas do modelo podem ser rastreadas para origens de dados.
Base de conhecimento, origem de dados e armazenamento de dados
Como um agente obtém acesso aos dados. Um agente se conecta a uma base de conhecimento, que é um armazenamento baseado em vetores que pode se conectar e ingerir dados de uma origem de dados. As origens de dados fornecem informações de conexão aos armazenamentos de dados que um agente usa para gerar respostas. Por exemplo, para um armazenamento de dados do Object Storage que contém um bucket com centenas de arquivos de dados, a origem de dados pode estabelecer conexão com o armazenamento de dados e ingerir os arquivos.
Dependendo do armazenamento de dados, as bases de conhecimento podem ser gerenciadas pelo serviço ou pelo cliente.
- Base de conhecimento gerenciada pelo serviço
- O usuário especifica a origem de dados e os Agentes de IA Generativa ingerem dados dessa origem de dados para uma base de conhecimento a ser usada pelos agentes.
- Base de conhecimento gerenciada pelo cliente
- O usuário gerencia a indexação dos dados e, em seguida, fornece os índices para Agentes de IA Generativa a serem usados pelos agentes.
Ingestão de Dados
Um processo que extrai dados de documentos de origem de dados, converte-os em um formato estruturado adequado para análise e, em seguida, armazena-os em uma base de conhecimento.
Chat
Ter uma conversa com um Modelo de Linguagem Grande (LLM) fazendo perguntas e fazendo com que o modelo gere respostas, como texto ou código, e continuar a conversa enquanto o modelo mantém o contexto da conversa. Quando o LLM é ativado com um agente de Geração Aumentada de Recuperação (RAG), você pode fazer perguntas relacionadas aos dados aos quais o agente tem acesso e o modelo pode gerar saídas com referência à base de conhecimento.
Sessão
Representa uma conversa interativa iniciada por um usuário por meio de uma API para interagir com o agente. Envolve uma série de trocas em que o usuário envia consultas ou prompts, e o agente responde com informações, ações ou ajuda relevantes com base na entrada do usuário. A sessão persiste durante a interação, mantendo o contexto e a continuidade para fornecer respostas coerentes e significativas ao longo da conversa.
Ponto final do agente
Pontos específicos de acesso em uma rede ou sistema que os agentes usam para interagir com outros sistemas ou serviços. Os pontos finais são usados principalmente para permitir a comunicação e a troca de dados entre um agente e sistemas externos, a fim de que os agentes recuperem ou enviem informações conforme necessário para executar suas funções.
Rastreamento
Rastreando uma conversa de bate-papo.
Nos Agentes de IA Generativa do OCI, o recurso de rastreamento rastreia e exibe o histórico de conversas, incluindo o prompt original e a resposta gerada, durante uma conversa de chat. Você pode ativar esse recurso ao criar um ponto final para um agente.
Citação
A origem das informações da resposta do agente.
Em OCI Generative AI Agents, o agente RAG gera a citação de cada resposta, que inclui o título, o caminho externo, o id do documento e os números de página da origem das informações. Você pode ativar a citação de um agente ao criar um ponto final para esse agente.
No OCI Generative AI Agents, além das informações relevantes existentes, o recurso de citação retorna o título e as páginas do documento, fornecendo mais contexto. Para o gerenciamento de citações, você pode substituir os links de citação do Object Storage para URLs personalizadas, adicionando metadados aos objetos. Consulte Atribuindo um URL Personalizado a uma Citação.
Moderação de conteúdo
Um recurso projetado para ajudar a detectar ou filtrar certas frases tóxicas, violentas, abusivas, odiosas, ameaçadoras, insultantes e assediadoras de respostas geradas ou prompts do usuário em grandes modelos de linguagem (LLMs). No OCI Generative AI Agents, esse recurso está associado a uma categorização dos quatro tipos de danos a seguir:
- O ódio e o assédio, por exemplo, ataques de identidade, insultos, ameaças de violência e agressão sexual.
- Dano Autoinfligido, por exemplo, promoção de autoagressão e transtorno alimentar.
- Dano ideológico, por exemplo, extremismo, terrorismo e crime organizado.
- Exploração, por exemplo, golpes e abuso sexual.
Ativando a moderação de conteúdo
Para ativar a moderação de conteúdo, você deve:
- Ative-o ao criar um ponto final para um agente.
- Especifique se a moderação é aplicada a:
- Prompt do usuário (entrada)
- Resposta gerada (saída)
- Entrada e saída
Saiba mais sobre Criando um Ponto Final em Agentes de IA Generativa.
Como Funciona a Moderação de Conteúdo
Quando aplicado à entrada, o agente não procura respostas se detectar conteúdo prejudicial na entrada. Quando aplicado à saída, o agente procurará respostas, mas não as exibirá se encontrar conteúdo prejudicial na origem.