Criando um pipeline de RAG para Pesquisa com OpenSearch

Gere código automaticamente para configurar e usar um conector do OCI Generative AI com o Search com OpenSearch para um pipeline de Geração Aumentada de Recuperação (RAG) de ponta a ponta.

Antes de começar, revise e implemente os pré-requisitos para usar um conector do OCI Generative AI com o Search with OpenSearch.

Talvez você precise configurar mais da rede para que o aplicativo chame a função que fala com o cluster OpenSearch. A rede requer uma das seguintes opções:

  • Para uma sub-rede pública, um gateway de internet e duas regras na lista de segurança: uma regra de saída com monitoramento de estado e uma regra de entrada que permite que o tráfego TCP use a porta 9200.
  • Para uma sub-rede privada, um gateway de serviço e uma regra de saída com monitoramento de estado na lista de segurança.

Para obter informações sobre como configurar essas opções, consulte Criando a VCN e as Sub-redes a Serem Usadas com o OCI Functions, se ainda não existirem.

O aplicativo precisa ser executado de uma instância de VM dentro da mesma sub-rede do cluster ou você pode configurar o encaminhamento de porta para executar o código localmente. Consulte Tarefa 5: Consultar o Serviço OCI Search para obter exemplos dessas opções.

A partir da Console

  1. Abra o Menu de Navegação e clique em Bancos de Dados. Em OpenSearch, clique em Clusters.
  2. Em Escopo da lista, selecione o compartimento que contém o cluster.
  3. Na lista Clusters, clique no nome do cluster cujo pipeline de RAG você deseja criar.
  4. Na página de detalhes do cluster, clique em Criar pipeline de RAG.
  5. Na página Configurar pipeline de RAG, em Informações Gerais, digite um nome, uma descrição e uma tag para o pipeline e, em seguida, especifique um ou mais campos de contexto.
    Os campos de contexto especificam o texto que é traduzido em incorporações para o índice. Os valores especificados aqui devem corresponder aos campos existentes no índice.

    Para usar a funcionalidade de gerar automaticamente o código do conector de IA Generativa na Console, a senha do cluster deve ser armazenada usando um segredo com o serviço OCI Vault. Se a senha já estiver armazenada como segredo do Vault, especifique o nome de usuário em Credenciais do Vault do Cluster e selecione o vault, o segredo do vault e a versão do segredo do cluster.

    Se a senha não for armazenada como um segredo do vault, selecione Criar um vault e um segredo e execute as seguintes tarefas:

    1. Criar um vault.
    2. Depois que o vault estiver ativo, crie uma chave para o vault.
    3. Para o vault, crie um segredo com as seguintes especificidades:
      • Selecione a chave que você criou na etapa anterior.
      • Informe manualmente a senha do cluster OpenSearch com o seguinte formato:
        • Modelo de Tipo de Segredo: Plain-Text
        • Conteúdo do Segredo: <OpenSearch-password>
  6. Em Grupo de modelos, informe um nome e uma descrição para o grupo de modelos. Se você informar o nome de um grupo de modelos existente, o código gerado usará o ID grupo de modelos para o grupo de modelos existente; caso contrário, um novo grupo de modelos será criado.
  7. Selecione Próximo.
  8. Na página Configurar conector do serviço Generative AI, em Conector do serviço Generative AI, informe um nome e uma descrição para o conector.
  9. Selecione a ação e, em seguida, o modelo a ser usado para o conector.
    Os campos na seção Parâmetros de modelo de IA de Geração são preenchidos com valores padrão, com base no modelo selecionado na etapa anterior. Você pode alterar os valores do parâmetro. Você só pode informar parâmetros válidos, e os valores de parâmetro permitidos são baseados no modelo selecionado. Um valor de parâmetro que funciona para um modelo pode não funcionar se você selecionar um modelo diferente.
  10. Em Modelo de registro de IA generativa, digite um nome e uma descrição para o modelo de IA generativa.
  11. Selecione Próximo.
A página Gerar código contém o código que você usa para criar o pipeline RAG, com base nas opções especificadas nas páginas anteriores do workflow Criar pipeline RAG. Para código stand-alone que você pode copiar ou fazer download, selecione Java ou Python na lista drop-down Linguagem. Em seguida, você pode copiar ou fazer download do código na primeira área de texto em um aplicativo.

Se você selecionar Kibana, o código gerado não poderá ser executado como um aplicativo independente. Em vez disso, o código gerado contém é dividido em etapas sequenciais que você copia para execução no Painel de Controle OpenSearch do cluster.

A segunda área de texto contém um código de modelo que mostra como executar consultas após a criação do pipeline.