Serviço de ciência de dados: casos de uso de assistência médica
O Oracle Cloud Infrastructure Data Science (OCI) O serviço Data Science é uma plataforma totalmente gerenciada sem servidor para que as equipes de ciência de dados criem, treinem e gerenciem modelos de aprendizado de máquina.
O serviço Data Science se integra ao restante da pilha do OCI, incluindo o Oracle Functions, o Data Flow, o Autonomous Data Warehouse e o Object Storage. O Oracle Accelerated Data Science (ADS) software developer kit (SDK) é uma biblioteca Python incluída como parte do serviço Data Science, que tem muitas funções e objetos que automatizam ou simplificam as etapas do workflow de ciência de dados, incluindo a conexão com dados, a exploração e a visualização de dados, o treinamento de um modelo com AutoML, a avaliação de modelos e a explicação de modelos. O ADS também fornece uma interface simples para acessar o catálogo de modelos de serviço Data Science e outros serviços OCI, incluindo o Object Storage.
Arquitetura
Essa arquitetura flexível suporta vários cenários entre redes de saúde integradas com base no serviço Oracle Machine Learning, combinando plataformas Autonomous Data Warehouse e Data Science.
Além do Data Science e do Autonomous Data Warehouse, essa arquitetura também usa Data Catalog, Oracle APEX Application Development e Oracle Analytics Cloud. Ele também usa instâncias do OCI Compute para hospedar aplicativos que podem simplificar dinamicamente dados de dispositivos vestíveis para o Autonomous Data Warehouse ou o Object Storage. Essa arquitetura atende a vários fins, incluindo o armazenamento de dados importantes em armazenamento seguro, confiável e rápido de recuperação, bem como a criação e a implantação de aplicativos e módulos de aprendizado de máquina em curtos períodos.
O diagrama a seguir ilustra essa arquitetura de referência.

Descrição da ilustração architecture-datascience-use-cases.png
A arquitetura tem os seguintes componentes:
- Região
Uma região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, denominados domínios de disponibilidade. As regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou continentes).
- Domínios de disponibilidade
Os domínios de disponibilidade são data centers independentes e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que fornece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou resfriamento ou a rede interna de domínios de disponibilidade. Portanto, não é possível afetar os outros domínios de disponibilidade na região.
- Domínios de falha
Domínio de falha é um agrupamento de hardware e infraestrutura dentro de um domínio de disponibilidade. Cada domínio de disponibilidade tem três domínios de falha com energia e hardware independentes. Quando você distribui recursos entre vários domínios de falha, seus aplicativos podem tolerar falhas físicas do servidor, manutenção do sistema e falhas de alimentação dentro de um domínio de falha.
- Rede virtual na nuvem (VCN) e sub-redes
Uma VCN é uma rede personalizável definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes de data center tradicionais, as VCNs permitem controle total sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você poderá alterar após criar a VCN. Você pode segmentar uma VCN em sub-redes, que podem ter como escopo uma região ou um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não são sobrepostos com as outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.
- Serviço Data Science
Uma plataforma totalmente gerenciada sem servidor para que as equipes de ciência de dados criem, treinem e gerenciem modelos de aprendizagem de máquina. Ele pode facilmente se integrar a outros serviços OCI, como o Autonomous Data Warehouse, o Object Storage e muito mais.
- Autonomous Data Warehouse
Um banco de dados autônomo da Oracle que inclui o Oracle Machine Learning. Os cientistas de dados podem criar, avaliar, classificar e implantar modelos de machine learning usando recursos do Oracle Machine Learning no banco de dados e a interface de Notebooks relacionada. Você também pode usar o Autonomous Transaction Processing.
- VM do Aplicativo
Uma instância do OCI Compute com o Oracle Linux instalada e pronta para instalação de ferramentas e aplicativos que precisam de acesso ao banco de dados.
- Catálogo de Dados
O OCI Data Catalog é uma solução de governança e descoberta de dados de autoatendimento totalmente gerenciada para os dados da sua empresa. O serviço Data Catalog fornece um único ambiente colaborativo para gerenciar metadados técnicos, de negócios e operacionais.
- Oracle Analytics Cloud
O Oracle Analytics Cloud capacita os analistas de negócios com recursos modernos de análise de autoatendimento, com tecnologia de IA, para preparação de dados, visualização, relatórios empresariais, análise aumentada e geração e processamento de linguagem natural.
O Oracle Analytics Cloud está integrado ao Oracle Machine Learning. Essa integração permite que os analistas listem modelos disponíveis no banco de dados e usem esses modelos em análises e painéis do Oracle Analytics Cloud.
- APEX
O Oracle APEX Application Development é uma plataforma de desenvolvimento de baixo código que permite a você criar aplicativos empresariais escaláveis e seguros que você pode implantar em qualquer local. Ele está incluído no Autonomous Database e não requer instalação. Os usuários do APEX podem acessar modelos e resultados do Oracle Machine Learning.
Recomendações
Os requisitos podem diferir da arquitetura descrita aqui. Use as recomendações a seguir como ponto de partida.
- VCN
Quando você cria uma VCN, determine o número de blocos CIDR necessários e o tamanho de cada bloco com base no número de recursos que você planeja anexar a sub-redes na VCN. Use blocos CIDR que estejam dentro do espaço de endereço IP privado padrão.
Selecione blocos CIDR que não se sobreponham a nenhuma outra rede (no Oracle Cloud Infrastructure, seu data center local ou outro provedor de nuvem) para a qual você pretende configurar conexões privadas.
Depois de criar uma VCN, você poderá alterar, adicionar e remover seus blocos CIDR.
Ao projetar as sub-redes, considere seu fluxo de tráfego e os requisitos de segurança. Anexe todos os recursos dentro de uma camada ou função específica à mesma sub-rede, que pode servir como limite de segurança.
- Segurança
Use o Oracle Cloud Guard para monitorar e manter a segurança dos seus recursos no OCI de forma proativa. O Cloud Guard usa receitas de detector que você pode definir para examinar seus recursos e monitorar operadores e usuários em busca de atividades arriscadas. Quando qualquer atividade de configuração incorreta ou insegura é detectada, o Cloud Guard recomenda ações corretivas e ajuda com essas ações, com base nas receitas do respondedor que você pode definir.
Para recursos que exigem segurança máxima, a Oracle recomenda que você use zonas de segurança. Uma zona de segurança é um compartimento associado a uma receita definida pela Oracle de políticas de segurança que se baseiam nas melhores práticas. Por exemplo, os recursos em uma zona de segurança não podem ser acessados pela internet pública e devem ser criptografados usando chaves gerenciadas pelo cliente. Quando você cria e atualiza recursos em uma zona de segurança, o OCI valida as operações em relação às políticas na receita de zona de segurança e nega operações que violam qualquer uma das políticas.
- Autonomous Data Warehouse
Crie um esquema separado para uso exclusivo de cientistas de dados. Conceda ao esquema acesso somente leitura ao esquema de data warehouse principal. Essa organização permite que os cientistas de dados criem visualizações locais de dados para exploração, análise e criação de modelos. Quando necessário, os dados compartilhados podem ser copiados para seu próprio esquema em que podem ser modificados localmente.
- Máquinas Virtuais
As VMs são distribuídas em vários domínios de falha para alta disponibilidade. Recomendamos o uso de uma configuração de VM flexível para a instância de computação. Isso permitirá que você aumente ou reduza a capacidade das VMs em minutos.
- Armazenamento de Objetos
O Object Storage oferece durabilidade de dados confiável e econômica, oferecendo acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo dados de banco de dados, dados analíticos, imagens, vídeos e muito mais. Recomendamos o uso do armazenamento padrão para ingerir dados de fontes externas porque aplicativos e usuários podem acessá-los rapidamente. Você pode criar uma política de ciclo de vida para mover os dados do armazenamento padrão para o armazenamento de arquivos compactados quando não precisar mais ser acessado com frequência.
Considerações
Considere os pontos a seguir ao implantar essa arquitetura de referência.
- Segurança
Use políticas para restringir quem pode acessar os recursos do OCI que sua empresa tem e como eles podem acessá-los.
- Disponibilidade do aplicativo
Os domínios de falha fornecem a melhor resiliência em um único domínio de disponibilidade. Você pode implantar instâncias do Compute que executam as mesmas tarefas em vários domínios de falha. Este design remove um único ponto de falha introduzindo redundância.
- Custo
Avalie seus requisitos para escolher as formas de Computação apropriadas.
- Monitoramento e alertas
Configure o monitoramento e os alertas sobre o uso da CPU e da memória de seus nós para que você possa ampliar ou reduzir a forma conforme necessário.
Implantar
O código necessário para implantar esta arquitetura de referência está disponível no GitHub. Você pode colocar o código no Oracle Cloud Infrastructure Resource Manager com um único clique, criar a pilha e implantá-la. Como alternativa, faça download do código do GitHub para seu computador, personalize o código e implante a arquitetura usando a CLI do Terraform.
- Implante usando o Oracle Cloud Infrastructure Resource Manager:
- Clique em
Se você ainda não estiver conectado, informe a tenancy e as credenciais do usuário.
- Examinar e aceitar os termos e condições.
- Selecione a região na qual você deseja implantar a pilha.
- Siga os prompts na tela e as instruções para criar a pilha.
- Após criar a pilha, clique em Ações do Terraform e selecione Planejar.
- Aguarde a conclusão do job e revise o plano.
Para fazer alterações, retorne à página Detalhes da Pilha, clique em Editar Pilha e faça as alterações necessárias. Em seguida, execute a ação Plano novamente.
- Se nenhuma alteração adicional for necessária, retorne à página Detalhes da Pilha, clique em Ações do Terraform e selecione Aplicar.
- Clique em
- Implante usando o código do Terraform no GitHub:
- Vá para GitHub.
- Clone ou faça download do repositório no computador local.
- Siga as instruções no documento
README
.