23 Computação de IA

Este capítulo aborda o uso de recursos de computação especializados para capacitar agentes de IA no Oracle AI Data Platform Workbench.

Um cluster de computação AI permite hospedar agentes em espaços de trabalho do AI Data Platform Workbench. Os cálculos de IA podem ser anexados aos agentes para executar a experiência de playground e hospedar agentes implantados para cargas de trabalho de produção.

Onde encontrar o AI Compute

Você gerencia a computação AI na página Computação, acessível no painel de navegação esquerdo do Workbench da Plataforma de Dados AI. Clique na guia computação AI para ver os clusters de computação AI disponíveis no seu espaço de trabalho.


A página Compute é aberta com a guia AI Compute selecionada.

A guia computação AI é a principal página de destino dos recursos de computação AI no espaço de trabalho selecionado no momento. Ele fornece ações de tabela, filtragem, classificação e informações de status.

Coluna ou Controle Objetivo
Filter Pesquise na tabela um recurso por nome ou texto visível.
Soma (+) Comece a criar uma nova computação de IA.
Excluir Remover cálculos de IA selecionados.
Nome da computação de IA Nome do recurso de computação. Clique no nome da computação AI para abrir a página de detalhes do recurso.
Estado Estado do ciclo de vida atual, como Criando, Ativo ou Atualizando.
Nº de réplicas Número de réplicas de computação associadas à computação de IA.
Nº de agentes Número de agentes hospedados na computação AI. A contagem é mostrada como um link quando os agentes estão presentes.
Configuração Resumo da forma de computação das réplicas no AI Compute, como 1 OCPU, 16 GB ou 2 OCPU, 32 GB.
Atualizado por/Atualizado em/Criado em Informações de auditoria para a atualização e o horário de criação mais recentes.
Menu Ação (...) Abra ações específicas do recurso para a linha selecionada.

Observação:

Uma marca de seleção verde indica um recurso Ativo. Um spinner indica uma operação em andamento, como Criando ou Atualizando. Aguarde a ativação de um recurso antes de confiar nele para o trabalho de produção.

Clicar no nome de uma computação de IA na guia computação de IA permite exibir informações detalhadas sobre essa computação de IA. A view de computação AI tem quatro guias: Agentes, Detalhes, Utilização de computação e Permissões.

Guia Agentes

A guia Agentes lista os agentes hospedados no recurso AI Compute. Se um agente não for implantado, a computação de IA hospedará a experiência de playground necessária para desenvolvimento e teste iterativos. Se o agente for implantado, o AI calculado estará hospedando o ponto final de implantação do agente para cargas de trabalho de produção.


A página AI Compute é aberta com a guia Agentes selecionada.

Item da Guia Agentes Descrição
Filtrar por nome do agente Pesquise a lista de agentes associados.
Nome do Agente Nome do agente associado ao recurso de computação.
Modo da criação Como o agente foi criado. Valores visuais ou de código.
Implantação Estado de implantação. Os agentes hospedados na computação de IA não podem ser implantados (o playground é hospedado na computação de IA) ou implantados (quando a computação está hospedando o ponto final de implantação do agente)
Estado do URI/URI Informações do URI do ponto final quando um agente é implantado e tem um URI.
Computação AI A computação associada ao ponto final de produção do agente.
Criado em/Atualizado em/Atualizado por Criar e atualizar metadados para o agente.

Guia Detalhes

A guia Detalhes resume a forma e o armazenamento configurados para cada réplica da computação AI.


A página AI Compute é aberta com a guia Detalhes selecionada.

Item da Guia Detalhes Descrição
Forma do driver A forma de GPU selecionada para o AI Compute. AMD é a forma do driver para todo o AI Compute.
OCPUs O número selecionado de OCPUs para o AI Compute.
Memória (GB) A memória de computação AI em GB.
Volume em blocos O tamanho do volume em blocos da computação AI em GB.

Guia Utilização de Computação

Use a guia Utilização de computação para revisar a utilização de CPU, memória e rede ao longo do tempo. Isso é útil ao decidir se as réplicas, OCPUs ou memória devem ser dimensionadas para cima ou para baixo. Não há tempo de inatividade durante uma operação de computação de IA de expansão/inclinação.


Página AI Compute aberta com a guia Utilização de Computação selecionada.

Observação:

Cada série temporal corresponde a uma réplica diferente. Por exemplo, se você criar uma computação AI com duas réplicas, duas séries temporais serão exibidas da mesma forma que a captura de tela acima mostra.
Calcular Item da Guia Utilização Descrição
Filtros Aplicados Escolha a data/hora inicial e final para a exibição de utilização.
Exibir Escolha a métrica. As opções são:
  • Utilização da CPU
  • Utilização da Memória
  • Bytes Recebidos por Rede
  • Bytes Transmitidos por Rede
Período Escolha entre um período personalizado ou os últimos 7 dias.
ID da Réplica Filtre métricas para um ID de réplica específico ou mostre Todas as réplicas de computação.
Interval Escolha o intervalo de agregação do gráfico. As opções são Auto, 1min, 5 min, 15min, 30min e 60min.

Guia Permissões

A guia de permissão fornece uma tabela de todos os principais que têm permissão para esta computação AI. Use esta guia para adicionar principais, alterar o nível de permissão ou modificar permissões.


Página AI Compute aberta com a guia Permissões selecionada.

Item da Guia Permissões Descrição
Nome principal Nome do principal ou da atribuição.
Tipo de controlador de instâncias Tipo de controlador de instâncias. USUÁRIO ou PAPEL.
Permissão Nível de permissão.
Será herdado Se as permissões concedidas para um objeto pai concederem permissões para objetos contidos.

Criar um Cluster de IA

Você pode criar clusters de computação de IA para executar agentes de IA na sua Plataforma de Dados de IA.

  1. Na Home page, navegue até seu espaço de trabalho.
  2. Clique em Criar e, em seguida, clique em Computação AI.
  3. Forneça um nome e uma descrição para o cluster de computação de IA.
  4. Defina o número de réplicas de computação. As réplicas dimensionam o pool de computação. Cada réplica hospeda uma cópia de todos os agentes hospedados na computação AI.

    Observação:

    O número máximo de réplicas é 10. Entre em contato com o representante da Oracle se precisar aumentar seu limite de réplica.
  5. Defina o número de OCPUs em cada réplica. Você pode escolher 1, 2, 4, 8, 16, 32 ou 64 OCPUs.
  6. Defina a memória (em GB) por réplica. A faixa de memória permitida varia com base no número de OCPUs:
    OCPUs Memória
    1 OCPU 16 ou 32 GB
    2 OCPUs 16, 32 ou 64 GB
    4 OCPUs 32, 64 ou 128 GB
    8 OCPUs 32. 64, 128 ou 256 GB
    16 OCPUs 64, 128, 256 ou 512 GB
    32 OCPUs 128, 256 ou 512 GB
    64 OCPUs 256, 512 ou 1024 GB
  7. Revise as Unidades AIDP correspondentes que tal configuração de computação de IA custa por hora.
  8. Clique em Criar. O novo recurso aparece na lista no estado Criando. O estado muda para Ativo após a conclusão do provisionamento.

Editar um Cluster de IA

Você pode modificar as definições de configuração de uma computação AI por meio da operação Editar.

A alteração da OCPU ou da memória do cluster de computação de IA pode levar alguns minutos para ser concluída. Você também pode interromper consultas de longa execução em seu agente.
  1. Na Home page, navegue até seu espaço de trabalho.
  2. Clique em Compute e, em seguida, clique na guia Computação AI.
  3. Ao lado do cluster de computação AI que você deseja modificar, clique em Ícone de três pontos de ações Ações e, em seguida, clique em Editar. Você também pode clicar no nome da computação AI e, em seguida, clicar em Editar no canto superior direito.

    A página Computação é aberta na guia Computação AI. O menu de ações de uma computação AI está aberto e Editar está destacado.


    Página do AI Compute aberta. O botão Editar no canto superior direito da tela é realçado.

  4. Modifique o nome, a descrição, o número de réplicas de computação, a contagem de OCPUs por réplica e a memória por réplica. As alterações na computação de IA são concluídas sem tempo de inatividade.
  5. Clique em Atualizar. O estado de computação do AI é exibido como Atualizando enquanto a atualização está em andamento.

Excluir um Cluster de IA

Você pode excluir clusters de computação de IA que não são usados ou que não são mais necessários.

  1. Navegue até o seu espaço de trabalho e clique em Compute. Em seguida, clique na guia Computação AI.
  2. Ao lado do cluster de IA que você deseja excluir, clique em Ícone de três pontos de ações Ações e clique em Excluir.
  3. Clique em Excluir.

    Página de computação AI com menu Ações aberto e Excluir destacado

Interromper um Cluster de IA

Você pode interromper uma computação de IA para interromper todos os agentes em execução na computação de IA. A computação é liberada e a medição é interrompida.

Recomendamos interromper uma computação de IA sempre que os agentes hospedados na computação não estiverem em uso.
  1. Na Home page, navegue até seu espaço de trabalho.
  2. Clique em Compute e, em seguida, clique na guia Computação AI.
  3. Ao lado do cluster de IA que você deseja interromper, clique em Ícone de três pontos de ações Ações e clique em Interromper.

    Página de computação AI com menu Ações aberto e Interromper destacado

Iniciar um Cluster de IA

Você pode iniciar uma computação de IA que foi interrompida anteriormente.

  1. Na Home page, navegue até seu espaço de trabalho.
  2. Clique em Compute e, em seguida, clique na guia Computação AI.
  3. Ao lado do cluster de IA que você deseja iniciar, clique em Ícone de três pontos de ações Ações e clique em Iniciar.

    Página de computação AI com menu Ações aberto e Iniciar destacado

Reiniciar um Cluster de IA

Você pode reiniciar uma computação AI ativa para selecionar alterações ou atualizações recentes.

Observação:

Os agentes hospedados na computação ativa serão interrompidos durante a reinicialização.
  1. Na Home page, navegue até seu espaço de trabalho.
  2. Clique em Compute e, em seguida, clique na guia Computação AI.
  3. Ao lado do cluster de IA que você deseja iniciar, clique em Ícone de três pontos de ações Ações e clique em Reiniciar.

    Página de computação AI com menu Ações aberto e Reiniciar destacado