Criando um Aplicativo

Crie um aplicativo no serviço OCI Generative AI.

Os aplicativos definem um runtime gerenciado para implantações hospedadas, incluindo dimensionamento, armazenamento gerenciado, rede e definições de autenticação. Esta tarefa documenta as etapas para criar um aplicativo usando a Console do Oracle Cloud.

Dica

Depois de criar um aplicativo, você poderá exibir seus detalhes e executar outras tarefas, como atualizá-lo, movê-lo para outro compartimento, gerenciar suas tags ou excluí-lo. Use o menu Ações (três pontos) na Console para acessar essas tarefas. Você também pode criar uma ou mais implantações para o aplicativo e ativar uma implantação para torná-la a versão em execução. Para obter mais informações, consulte Listando Aplicativos.

Para criar um aplicativo, na página de lista, selecione Criar aplicativo. Se precisar de ajuda para localizar a página da lista, consulte Listando Aplicativos.

  1. (Opcional) Em Variáveis de ambiente, adicione variáveis de ambiente exigidas pelo contêiner.
  2. (Opcional) No serviço Networking, selecione o tipo de rede para tráfego de saída (saída) e selecione um tipo de ponto final (público ou privado) para acesso à implantação ativa deste aplicativo.
  3. Em Autenticação, selecione uma configuração de domínio de identidades e forneça as definições OAuth necessárias (escopo e público).
  4. Verifique as definições e selecione Criar aplicativo.

Informações básicas

  1. Informe um nome para a aplicação.
    Inicie o nome com uma letra ou sublinhado, seguido de letras, números, hifens ou sublinhados. O comprimento pode ser de 1 a 255 caracteres.
  2. (Opcional) Digite uma descrição para o aplicativo.
  3. Selecione um compartimento no qual criar o aplicativo. O compartimento padrão é o mesmo da página de lista, mas você pode selecionar qualquer compartimento em que tenha permissão para trabalhar.

Tags

  1. (Opcional) Selecione Adicionar tag e designe tags a este armazenamento de vetores. Consulte Tags de Recursos.
  2. Selecione Criar.

Dimensionamento

  1. Para Dimensionamento Automático, você define como a implantação hospedada é dimensionada para lidar com a carga.
    • Réplicas mínimas

      Mantém pelo menos tantas réplicas em execução em todos os momentos. Deve ser menor ou igual ao máximo de réplicas. O padrão é 1.

    • Máximo de réplicas

      Limpa o número de réplicas. Novas réplicas são adicionadas à medida que a carga aumenta, até esse limite. O padrão é 3 (máximo de 30). Defina igual à réplica mínima para desativar o dimensionamento automático.

  2. Selecione uma métrica de Concorrência.
    Essa configuração adiciona réplicas quando as solicitações simultâneas excedem esse valor, até o máximo de réplicas definido. Faixa: 1 a 500.
    • Utilização da CPU (%)

      Adiciona réplicas quando a utilização da CPU excede esse percentual, até o máximo de réplicas definido. Faixa: 50% a 95%.

    • Utilização da memória (%)

      Adiciona réplicas quando a utilização da memória excede esse percentual, até o máximo de réplicas definido. Faixa: 50% a 95%.

    • Solicitações simultâneas

      Adiciona réplicas quando as solicitações simultâneas excedem esse valor, até o máximo de réplicas que você definir. Faixa: 1 a 500.

    • Solicitações por Segundo (RPS)

      Mantém pelo menos tantas réplicas em execução em todos os momentos. Deve ser menor ou igual ao máximo de réplicas. O padrão é 1.

Armazenamento (Opcional)

Se o agente precisar usar o armazenamento gerenciado pelo serviço, você poderá selecionar PostgreSQL, OCI Cache e Oracle Autonomous Database.

Ative o armazenamento gerenciado para implantações hospedadas associadas a este aplicativo. O armazenamento gerenciado é criado e gerenciado pelo serviço e só pode ser acessado pela implantação hospedada associada a este aplicativo. Os detalhes da conexão são fornecidos ao contêiner por meio de variáveis de ambiente.

  1. Se o agente precisar usar o Armazenamento Gerenciado do serviço, ative uma das opções a seguir.
    • OCI PostgreSQL

      Ative o OCI PostgreSQL para fornecer um banco de dados gerenciado para implantações neste aplicativo.

      No drop-down de seleção de armazenamento, você verá uma lista de sistemas de banco de dados PostgreSQL gerenciados disponíveis. Depois de selecionar um sistema de armazenamento, a console exibirá uma lista de aplicativos que atualmente usam esse armazenamento abaixo da lista drop-down, permitindo que você entenda quais aplicativos estão compartilhando o sistema de banco de dados selecionado.

      Para esta opção:
      • Informe o nome da variável do ambiente que recebe o URI da conexão PostgreSQL do OCI. O serviço adiciona a string de conexão à variável de ambiente especificada. Você deve usar o mesmo nome que o nome da variável de ambiente no código.
      • Armazenamento: Selecione se deseja criar um ou usar um existente. Se você selecionar um armazenamento existente, o aplicativo compartilhará este OCI PostgreSQL com outros aplicativos na tenancy. No entanto, cada aplicativo recebe um banco de dados dedicado, e esse aplicativo só tem permissões para acessar seu banco de dados dedicado.
    • Cache do OCI
      Ative o OCI Cache para fornecer um cache gerenciado para implantações neste aplicativo. Para esta opção:
      • Informe o nome da variável de ambiente que recebe o URI da conexão do Cache do OCI
      • Armazenamento: Selecione se deseja criar um ou usar um existente.
    • Oracle Autonomous Database
      Ative o Oracle Autonomous Database para fornecer um banco de dados gerenciado para implantações neste aplicativo. Para esta opção:
      • Informe o nome da variável de ambiente que recebe o URI do Autonomous Database
      Além da string de conexão, o serviço monta a credencial do usuário do banco de dados no arquivo local do contêiner em
      /mnt/secrets/adb/username
      /mnt/secrets/adb/password
  2. (Opcional) Para Variáveis de Ambiente, informe uma ou mais variáveis de ambiente para a implantação.

    Se o seu código precisar consumir variáveis de ambiente personalizadas, você poderá definir essas variáveis nesta seção e essas variáveis de ambiente serão adicionadas ao perfil de contêiner.

    • Texto sem formatação

      Para cada variável, defina uma chave (o nome da variável de ambiente) e seu valor.

    • Vault do OCI

      Para cada variável, defina uma chave (o nome da variável de ambiente) e o segredo no vault selecionando as seguintes informações:

      • Compartimento do vault
      • Vault
      • Segredo do vault
      O serviço adiciona as informações do vault em um contêiner como um arquivo JSON. Exemplo de código JSON:
      {
          "vaultId":<vault-ocid>,
          "key":<the secret in the vault>
      }

Rede (Opcional)

Selecione como as implantações neste aplicativo roteiam o tráfego de saída (saída) e como os clientes acessam o ponto final de implantação.

  1. Para Rede, selecione uma das seguintes opções.
    • Padrão (gerenciado pelo serviço)

      Permite acesso de saída aos serviços do OCI e à internet pública por meio de uma rede gerenciada por serviço.

    • Personalizado (gerenciado pelo cliente)
      Roteia o tráfego de saída por meio de uma VCN e sub-rede em sua tenancy usando uma conexão de ponto final privado (PE/RCE). Recomendado para implantações privadas e integradas à empresa. Para esta opção, selecione o seguinte:
      • Compartimento da VCN
      • VCN
      • Compartimento de sub-rede
      • Sub-rede
      Observação

      Se você selecionar personalizado, todo o tráfego de saída será roteado para a sub-rede da VCN. Se o agente também precisar de acesso à Internet, talvez você queira usar uma sub-rede pública e configurar a tabela de roteamento. Consulte Gateway de internet.
  2. Selecione se a implantação ativa deste aplicativo é acessada por meio de um ponto final público ou privado.
    • Público

      Acessível de fora da VCN.

    • Privado

      Acessível somente de dentro da VCN.

      Importante

      Você deve usar um ponto final privado do serviço Generative AI. Se você não tiver um, crie um ponto final privado do serviço Generative AI.

      Informe o seguinte:

      • Compartimento de ponto final privado
      • Ponto final privado

    Após a criação do aplicativo, você pode acessá-lo por meio desse ponto final privado usando seu FQDN ou endereço IP. Exemplo de FQDN:

    https://<pe-name>.pe.inference.generativeai.<region>
    .oci.oraclecloud.com/20251112/hostedApplications/{your_application_ocid}

Autenticação

Execute tarefas em Configurando Autenticação para Suporte Agêntico, antes de iniciar esta tarefa.

  1. Selecione Domínio de Identidades do OCI para autenticação.
    Esse domínio é o mesmo domínio de identidades que o aplicativo integrado que você criou na Etapa 2. A qual pertence a criação de um Aplicativo no Domínio de Identidades.
  2. Selecione ou cole as informações do domínio de identidades.
    • Selecione um domínio de identidade existente

      Permite acesso de saída aos serviços do OCI e à internet pública por meio de uma rede gerenciada por serviço.

      • Compartimento do domínio de identidades
      • Domínio de identidades
    • Colar um URL do domínio de identidades

      Exemplo: https://idcs-xxx.identity.oraclecloud.com:443

  3. Para o domínio de identidades, informe valores para os seguintes parâmetros:
    • Escopo

      Especifica quais ações o token de acesso permite (permissões). Exemplos: user.read , email.

    • Público-alvo

      Especifica para qual serviço ou API o token de acesso se destina. O token só é aceito quando a reivindicação do público corresponde ao servidor de recursos de destino.

      Para encontrar o valor, vá para a Console do domínio de identidades e descubra o aplicativo integrado que você criou na Etapa 2. Criar um Aplicativo no Domínio de Identidades. Selecione OAuth configuration, copie Público-alvo principal e cole aqui.

      Exemplos:
      https://api.example.com
      https://my-service.internal
      urn:my-resource-server
      ocid1.resourceServer.oc1..xxxx

Verificar e Criar

Verifique as seleções e, se estiver satisfeito com elas, selecione Criar.

Observação

O tempo de criação de um aplicativo depende dos recursos do aplicativo.

  • Se o armazenamento gerenciado estiver ativado, o serviço provisionará uma instância de armazenamento dedicada, o que pode levar vários minutos.

  • Se a opção rede personalizada for selecionada, o serviço provisionará os recursos de ponte de rede necessários, o que também poderá levar alguns minutos.