Usando um Modelo Pré-treinado na Console

O Vision fornece modelos pré-treinados para extrair insights de imagens, sem precisar de Cientistas de Dados.

Neste tutorial, você aprenderá a:

Antes de Começar

Antes de usar o Vision, o administrador da tenancy deve configurar as políticas apropriadas.

Configurando as Políticas

Siga estas etapas para configurar as políticas necessárias para usar o Vision.

  1. No menu de navegação da Console, selecione Identidade e Segurança.
  2. Em Identidade, selecione Políticas.
  3. Selecione Criar Política.
    O painel Criar Política é exibido.
  4. Informe um Nome. Você só pode usar caracteres alfanuméricos, hifens, pontos e sublinhados. Não são permitidos espaços. Por exemplo, digite, vision-access-policy.
  5. Informe uma Descrição para ajudar outros usuários a saber a finalidade desse conjunto de políticas. Por exemplo, digite, Policy to access Vision service..
  6. Selecione o Compartimento.
  7. Em Criador de Política, selecione Mostrar editor manual.
  8. Adicione a seguinte instrução:
    allow any-user to use ai-service-vision-family in tenancy
  9. (Opcional) Para limitar o acesso somente ao seu grupo de usuários, adicione a seguinte política:
    allow group <your-group-name> to use ai-service-vision-family in tenancy
  10. Selecione Criar.

1. Noções Básicas de Requisitos de Dados

O Vision funciona com muitos formatos de dados de imagem para detectar objetos, atribuir rótulos a imagens, extrair texto e muito mais. Ele aceita dados por meio do Object Storage. Se o Vision for executado na Console, você também poderá fornecer imagens armazenadas localmente.

O Vision oferece APIs síncronas e assíncronas para analisar imagens. Os requisitos de dados para cada um são explicados na tabela a seguir:
Requisitos de Dados da API
API Descrição: Formato de Entrada Suportado
API Síncrona
  • analyzeImage
  • analyzeDocument
Analisa imagens individuais.
  • JPG, PNG. PDF e TIFF também são suportados com analyzeDocument
  • Até 5 MB
  • Entrada de imagem única
API Assíncrona Analise várias imagens ou PDFs de várias páginas.
  • JPG, PNG. PDF e TIFF também são suportados com analyzeDocument
  • Suporta PDF de várias páginas
  • Entrada de até 2.000 imagens

2. Carregar Dados para o Object Storage

Nesta etapa, você carrega no Object Storage as imagens e os documentos que deseja analisar.

Complete 1. Entenda os Requisitos de Dados antes de tentar esta seção.

Crie um Bucket de Armazenamento de Objetos

Se você já tiver um bucket no Object Storage que possa usar, vá direto para a próxima seção sobre como carregar arquivos de imagem.

  1. No menu de navegação da Console, selecione Storage.
  2. Em Object Storage, selecione Buckets.
  3. Na página Buckets, em Escopo da Lista, selecione seu Compartimento.
  4. Selecione Criar Bucket. O painel Criar Bucket é exibido.
  5. Informe o Nome do Bucket. Não insira informações confidenciais.
  6. Em Default Storage Tier, selecione Standard. Deixe todos os outros campos em seus valores default.
  7. Selecione Criar.

Carregar Arquivos de Imagem para o Bucket de Armazenamento de Objetos

  1. Na página Buckets, selecione o nome do bucket no qual você carregará imagens. A página de detalhes do bucket é exibida.
  2. Em Recursos, selecione Objetos para exibir a lista de objetos no bucket.
  3. Selecione Fazer Upload. O painel Fazer Upload de Objetos é exibido.
  4. Arraste os arquivos que você deseja carregar para o painel ou selecione selecionar arquivos para selecioná-los de seus arquivos locais.

3. Inteligência Artificial do Documento

As etapas para usar os recursos Document AI no Vision.

Complete 2. Carregue Dados para o Serviço Object Storage antes de tentar esta seção.

Abrir Console do Vision

  1. No menu de navegação da Console, selecione Análise e AI.
  2. Em Serviços de IA, clique em Vision. A página inicial do Vision será exibida.

Usar AI do Documento

  1. Em Vision, selecione Document AI. A página Document AI é exibida.
  2. Em Origem da imagem, selecione Armazenamento de objetos.
  3. Selecione um documento carregado em 2. Carregar Dados no Serviço Object Storage. A API analyzeDocument é chamada.
Esses recursos são chamados e seus resultados exibidos na Console:
Resultados do Document AI
Recurso Descrição: Resultados
OCR (Optical Character Recognition) Localiza e digitaliza informações de texto das imagens. O texto identificado no documento é exibido em Texto Bruto no painel Resultados.
Classificação da Imagem do Documento Classifica documentos em diferentes tipos com base em sua aparência visual, recursos de alto nível e palavras-chave extraídas. A classificação em um Tipo de documento junto com uma pontuação de confiança é exibida no painel Resultados.
Classificação de Idiomas Classifica o idioma do documento com base em recursos visuais. A classificação em um Idioma do documento junto com uma pontuação de confiança é exibida no painel Resultados.
Extração de tabela Extrai conteúdo em um formato tabular, mantendo as relações de linha e coluna das células. No painel Resultados, clique na guia Tabela para ver a saída.
Saída em PDF Pesquisável Incorpora uma camada transparente no topo da imagem do documento em formato PDF para torná-lo pesquisável por palavras-chave.

Observação: esta funcionalidade só está disponível quando um documento PDF é fornecido.

Clique em PDF Pesquisável. Um arquivo OCR PDF é baixado para seu computador.

4. Análise de Imagem

As etapas para usar os recursos de Análise de Imagem no Vision.

Complete 2. Carregue Dados para o Serviço Object Storage antes de tentar esta seção.

Abrir Console do Vision

  1. No menu de navegação da Console, selecione Análise e AI.
  2. Em Serviços de IA, selecione Vision. A home page do Vision é exibida.

Usar Classificação da Imagem

  1. Em Visão, selecione Classificação de Imagem. A página Classificação da imagem é exibida.
  2. Selecionar Armazenamento de objetos.
  3. Selecione uma imagem carregada em 2. Carregar Dados no Serviço Object Storage. A API analyzeIamge é chamada.

Os resultados que categorizam objetos na imagem são exibidos na seção Resultados. Há labels para classificar os objetos detectados e uma pontuação de confiança para cada objeto.

Usar Detecção de Objeto

  1. Em Vision, selecione Detecção de Objetos. A página Detecção de Objetos é exibida.
  2. Selecionar Armazenamento de objetos.
  3. Selecione uma imagem carregada em 2. Carregar Dados no Serviço Object Storage. A API analyzeIamge é chamada.

Os resultados são exibidos na seção Resultados. Os objetos detectados, uma pontuação de confiança para cada objeto e a caixa delimitadora realçada em torno de cada objeto são exibidos no painel Resultados. Se você clicar em um rótulo, onde na imagem esse objeto é detectado será mostrado.

O Que Vem a Seguir

Agora você sabe como usar o Vision com modelos pré-treinados, tente usá-lo com modelos personalizados.