Avaliações

Avaliando o desempenho do modelo com o AI Quick Actions

Com modelos implantados, você pode criar uma avaliação de modelo para avaliar seu desempenho. Você pode selecionar um conjunto de dados no Object Storage ou fazer upload de um no armazenamento do notebook no qual está trabalhando. Para fazer upload de conjuntos de dados do seu notebook, primeiro configure políticas que permitam que a sessão de notebook grave arquivos no Object Storage. Você pode rotular sua avaliação de modelo com um nome de experimento. Você pode selecionar um experimento existente ou criar um novo. BERTScore, BLEU Score, Perplexity Score, Text Readability e ROUGE são as métricas de avaliação disponíveis para medir o desempenho do modelo. Você pode salvar o resultado da avaliação do modelo no Object Storage. Você pode definir os parâmetros de avaliação do modelo. Em opções avançadas, você pode selecionar a forma da instância de computação para a avaliação e, opcionalmente, inserir a sequência Interromper. Além disso, você pode configurar o registro em log com sua avaliação de modelo para monitorá-lo. O registro em log é opcional, mas recomendamos que ele ajude a solucionar erros com avaliação. Você precisa ter a política necessária para ativar o registro em log. Para obter mais informações sobre log, consulte a seção Logs. Você pode revisar as configurações e os parâmetros da sua avaliação antes de criá-la.

Se você voltar para a guia Avaliação, verá que o estado do ciclo de vida da avaliação é Succeeded quando a avaliação do modelo for concluída. Você pode exibir o resultado da avaliação e fazer download de uma cópia do relatório de avaliação do modelo para sua máquina local.

Consulte Avaliação em GitHub para obter mais informações e dicas sobre Avaliações.
Observação

As avaliações não podem ser executadas em formas baseadas no ARM.
    1. Em Ações Rápidas de IA, clique em Avaliações.
      A página Avaliações é mostrada.
    2. Selecione Criar avaliações.
    3. Insira o nome da avaliação.
    4. Selecione o nome da implantação do modelo.
    5. (Opcional) Digite uma descrição da avaliação.
    6. Para especificar um conjunto de dados, selecione Escolher um conjunto de dados existente ou Fazer upload do conjunto de dados no armazenamento de notebook.
    7. (Opcional) Se você tiver selecionado Escolher um conjunto de dados existente na etapa 6, selecione o compartimento.
    8. (Opcional) Se você tiver selecionado Escolher um conjunto de dados existente na etapa 6, selecione o local do Object Storage do conjunto de dados.
    9. (Opcional) Se você tiver selecionado Escolher um conjunto de dados existente na etapa 6, especifique o caminho do Object Storage.
    10. Para especificar um experimento, selecione Escolher um experimento existente ou Criar um novo experimento. Use experimentos para agrupar modelos semelhantes para avaliação.
    11. Opcional: Se você selecionou Escolher um experimento existente, selecione o experimento.
    12. Opcional: Se você selecionou Criar um novo experimento:
      1. Insira o nome do experimento.
      2. Opcional: Dê ao experimento uma descrição.
    13. Especifique o bucket do Object Storage no qual armazenar os resultados.
      1. Selecione o compartimento.
      2. Selecione o local do Object Storage.
      3. Opcional: Especifique o caminho do Object Storage.
    14. Selecione Próximo.
    15. (Opcional) Em Parâmetros, atualize os parâmetros de avaliação do modelo com base nos valores padrão.
    16. Selecione Mostrar opções antecipadas.
    17. Especifique a forma da instância e a sequência de interrupção a ser usada.
    18. (Opcional) Em Log, especifique o grupo de logs e o log a ser usado.
    19. Selecione Próximo.
      A página de avaliação é mostrada para a avaliação que você deseja criar.
    20. Selecione Enviar para iniciar a avaliação.
    21. Quando a avaliação for concluída e o Estado do ciclo de vida for definido como Bem-sucedido, selecione a seta ao lado da avaliação.
      As métricas de avaliação e os parâmetros do modelo são mostrados. Selecione Fazer Download para fazer download do relatório no formato HTML.
  • Para obter uma lista completa de parâmetros e valores para comandos da CLI do AI Quick Actions, consulte CLI do AI Quick Actions.

  • Não é possível executar essa tarefa usando a API.