Saiba como a IA e o ML da OCI aprimoram a experiência do paciente
Assim como em qualquer empresa, a assistência médica precisa ter a capacidade de acessar, analisar, manipular e armazenar grandes volumes de dados. Esse tipo de processamento de dados é fundamental para as tecnologias por trás do Oracle Cloud Infrastructure Lakehouse (data lakehouse), que facilita a inteligência artificial (IA) e aprendizado de máquina (ML) para aprimorar a experiência do paciente.
A instalação de um sistema de saúde, em termos de experiência do paciente, deve considerar:
- Obter informações precisas sobre o paciente aos médicos o mais rápido possível, com uma facilidade que elimina encargos desnecessários, permitindo que o clínico gaste o máximo de tempo possível no caso do paciente.
- Levar o paciente dos sintomas à recuperação o mais rápido possível.
- Garantir que o processo seja o mais econômico possível, independentemente de o custo ser assumido pelo paciente, seu seguro médico ou um serviço público de saúde (e.g., Serviço Nacional de Saúde no Reino Unido).
Por exemplo, um clínico geral (GP) ou um prestador de cuidados primários (PCP) acreditam que seu paciente está exibindo sinais de pneumonia. Eles encaminharam o paciente para um centro médico (hospital ou centro de imagem) para uma radiografia de tórax para investigar se pneumonia ou algo mais está causando os sintomas do paciente. O primeiro passo nesse processo é a criação de uma consulta com o centro médico e o compartilhamento do prontuário eletrônico do paciente (EMR) ou do registro eletrônico de saúde (EHR). Idealmente, esses dados seriam incorporados no data lakehouse.
A equipe de radiologia do centro médico tomaria as radiografias, mas a partir desse ponto em diante, o data lakehouse e as tecnologias relacionadas desempenham um papel ativo no processo de diagnóstico. A imagem de raios X é criada usando o sistema de informação radiológica (RIS) e armazenada usando o sistema de arquivamento de imagens e comunicação (PACS) ou uma nova geração de armazenamento de dados, como o Arquivo Neutro do Fornecedor (VNA). As imagens provavelmente são armazenadas usando um formato de imagem médica, como Digital Imaging and Communications in Medicine (DICOM), que armazena uma imagem de alta resolução com seus metadados associados, como detalhes sobre onde e quando a imagem foi gerada e o tipo de modalidade (como a imagem foi capturada). Esses metadados estão vinculados ao paciente correto e seus registros.
Uma vez capturadas as imagens, o médico revisa e interpreta cada uma para determinar as necessidades clínicas do paciente. Este é um processo demorado, muitas vezes resultando na espera de mais informações em casa.
Este playbook vai se concentrar em como um data lakehouse participa de soluções que entregam os resultados que descrevemos.
Este playbook focará nos sistemas envolvidos em um caso de uso envolvendo um hospital regional e chamará áreas relacionadas, mas não entrará em detalhes da solução.
Arquitetura
Esta arquitetura mostra um centro médico acessando e usando um data lakehouse da OCI.
- A configuração inicial provavelmente exigiria o uso do Serviço de Transferência de Dados como uma forma eficiente, econômica e rápida de migrar todos os dados existentes da solução PACS para a OCI (Oracle Cloud Infrastructure) para processamento. Se o desempenho de conectividade para operações contínuas fosse problemático, isso poderia ser estendido para transferências diárias. Além dos dados PAC, isso pode ser um meio de enviar registros de pacientes em massa e informações associadas.
- Fontes de dados adicionais, como colaboração no compartilhamento de EMRs entre os profissionais de saúde, podem incluir o GP ou PCP do paciente.
- São fornecidas funções para executar manipulações de dados complexas. Por exemplo, eles extraem os metadados de uma imagem do DICOM. Esses processos são muito complexos para serem efetivamente acionados dentro das ferramentas de persistência e da lógica de negócios. Isso significa que podemos estabelecer uma nova lógica toda vez que um novo objeto de dados não estruturado complexo é introduzido, como um novo tipo de imagem.
- Os dados de entrada e saída dos serviços suportam o compartilhamento de EHR/EMR do paciente.
- Conforme mencionado no cenário, mais dados que podem ser obtidos relacionados aos casos de uso, como insights adicionais sobre pacientes, permitem obter insights adicionais. Por exemplo, o conjunto de dados CDC Determinantes Sociais de Saúde (SDOH) fornece APIs para indicadores socioeconômicos para várias condições de saúde.
- Isso reflete o número de serviços usados direta ou indiretamente para oferecer suporte à segurança, à operabilidade da plataforma e da solução.
- Os serviços de data lakehouse são agrupados. Dependendo do caso de uso específico, nem todos os serviços poderão ser necessários.
- Presume-se que a expectativa principal seja centrada no Web Service, pois terceiros ocultarão como seus dados são tratados. Isso também reflete a direção do desenvolvimento de padrões, como FHIR.
Conforme o diagrama mostra, os dados que fluem entre o centro médico e o ambiente do OCI são protegidos por uma VPN e garantidos em termos de desempenho usando o Oracle Cloud Infrastructure FastConnect (FastConnect), apesar do alto volume de dados de imagem em movimento para frente e para trás.
A solução PACS ou VNA pode ser integrada de várias maneiras, dependendo dos recursos da solução PACS, desde simplesmente expor o armazenamento PACS a um servidor FTP restrito que pode ser regularmente consultado (e.g., a cada 10 a 15 minutos), até especificações de API alinhadas com o Modelo de Comunicação DICOM para Troca de Mensagens. Também podemos ver no diagrama de arquitetura que o uso de recursos de OCI para substituir PACS local também é uma possibilidade.
São fornecidas funções personalizadas que podem extrair metadados relacionados à imagem no DICOM. Os metadados extraídos podem ser armazenados separadamente para suportar a rápida pesquisa de conteúdo, pois as imagens não precisam ser interrogadas toda vez que uma pesquisa é realizada.
Embora a integração com outras fontes de dados possa acontecer usando vários protocolos e tecnologias, o mecanismo preferido é a adoção de APIs REST FHIR. No entanto, as ferramentas de integração disponíveis fornecem uma ampla gama de protocolos e tecnologias de integração. Observe que a imagem não pode ser suportada com FHIR, pois o padrão não suporta atualmente esses dados.
Embora os dados estejam centralizados para aproveitar o provisionamento do banco de dados, o uso do Oracle Cloud Infrastructure Data Catalog e do gateway de API permite que as organizações desenvolvam-se em direção às ideias de uma malha de dados. Em particular, a descentralização da propriedade de dados ao expor os dados de uma maneira que os proprietários de dados são confortáveis. Além disso, a API fornece um meio de obter acesso eficiente aos dados impondo o controle de acesso. Isso significa que os mesmos dados podem ser disponibilizados a diferentes consumidores para diferentes finalidades, mantendo-se sem impacto pelo comportamento e as necessidades dos consumidores (e.g., os dados são disponibilizados tanto ao pessoal móvel como aos clínicos com pacientes em plataformas de visualização médica).
Essa arquitetura oferece suporte aos seguintes serviços específicos do data lakehouse:
- Object StorageO armazenamento de objetos oferece acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo backups de bancos de dados, dados de análise e conteúdo avançado, como imagens e vídeos. Você pode armazenar de forma segura e depois recuperar dados diretamente da internet ou de dentro da plataforma da nuvem. Você pode escalar o armazenamento de forma integrada sem prejudicar o desempenho ou a confiabilidade do serviço. Use o armazenamento padrão para armazenamento "quente" que você precisa para acessar rapidamente, imediatamente e com frequência. Use o armazenamento de arquivos compactados para armazenamento "frio" que você mantém por longos períodos de tempo e raramente acessa. Nesse contexto, o Object Storage seria usado para armazenar conteúdo não estruturado, como imagens de raios X, e depois referenciado por dados mais estruturados, incluindo os metadados da imagem, para tornar as imagens rapidamente pesquisáveis. 
- Catálogo de DadosO Oracle Cloud Infrastructure Data Catalog é uma solução de descoberta e governança de dados de autoatendimento totalmente gerenciada para os dados da sua empresa. Ele fornece a engenheiros de dados, cientistas, administradores e diretores executivos um único ambiente colaborativo para gerenciar os metadados técnicos, comerciais e operacionais da organização. O Catálogo de Dados dentro de seu contexto contribuirá para entender os ativos de dados e como eles podem ser tratados dentro do lakehouse para fornecer insights adicionais. Isso abrangeria dados mantidos internamente e recursos de dados de terceiros que podem ser transferidos para o lakehouse por meio de mecanismos como chamada de API e transferência de arquivos. Outras tecnologias estão disponíveis para ingestão de dados, mas as APIs e os arquivos são os modelos mais comuns. 
- Data IntegrationUse o Oracle Cloud Infrastructure Data Integration para obter um fluxo de dados ideal entre sistemas. Ele suporta o ETL declarativo, sem código ou com pouco código e o desenvolvimento de pipeline de dados. Para o lakehouse, essa seria uma das principais ferramentas de manipulação e processamento de dados. O serviço Data Integration também pode ser aplicado para executar tarefas como transformar dados de semiestruturados em dados minimizáveis e totalmente estruturados. Execute atividades como limpeza de dados para que dados sujos ou corrompidos não possam distorcer as descobertas. 
- Fluxo de DadosO Oracle Cloud Infrastructure Data Flow é um serviço Apache Spark totalmente gerenciado que executa tarefas de processamento em grandes conjuntos de dados - sem a infraestrutura para implantar ou gerenciar. Os desenvolvedores também podem usar o Spark Streaming para executar ETL na nuvem em seus dados de streaming produzidos continuamente. Isso permite a entrega rápida de aplicativos, pois os desenvolvedores podem se concentrar no desenvolvimento de aplicativos, não no gerenciamento de infraestrutura. O serviço Data Flow ajuda a processar dados de forma mais evento ou série de timer. Isso significa que é possível realizar mais análises à medida que tudo acontece, em vez de aguardar até que todos os dados sejam recebidos. 
- Serviço Big DataO Oracle Big Data Cloud Service ajuda os profissionais de dados a gerenciar, catalogar e processar dados brutos. A Oracle oferece armazenamento de objetos e data lakes baseados no Hadoop para persistência. 
- Autonomous DatabaseO Oracle Cloud Infrastructure Autonomous Database é um ambiente de banco de dados totalmente gerenciado e pré-configurado que você pode usar para cargas de trabalho de processamento de transações e data warehousing. Não é necessário configurar ou gerenciar qualquer hardware ou instalar qualquer software. O Oracle Cloud Infrastructure controla a criação do banco de dados, bem como o backup, a aplicação de patches, o upgrade e o ajuste do banco de dados. 
Recomendações
- Rede virtual na nuvem (VCN) e sub-redeUma VCN é uma rede predefinida e personalizável que você configura em uma região do Oracle Cloud Infrastructure. Como as redes de data center tradicionais, as VCNs dão a você total controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após criar a VCN. Você pode segmentar uma VCN em sub-redes, que podem ter escopo em uma região ou em um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contínuo de endereços que não se sobrepõem às outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada. 
- Cloud GuardVocê pode usar o Oracle Cloud Guard para monitorar e manter a segurança dos seus recursos no Oracle Cloud Infrastructure. O Cloud Guard usa receitas do detector que você pode definir para examinar seus recursos em busca de pontos fracos de segurança e para monitorar operadores e usuários em busca de atividades de risco. Quando qualquer configuração incorreta ou atividade não segura é detectada, o Cloud Guard recomenda ações corretivas e auxilia na tomada dessas ações, com base em receitas do respondedor que você pode definir. 
- Zona de segurançaAs zonas de segurança garantem as melhores práticas de segurança da Oracle desde o início, impondo políticas como a criptografia de dados e a prevenção do acesso público a redes para um compartimento inteiro. Uma zona de segurança está associada a um compartimento com o mesmo nome e inclui políticas de zona de segurança ou uma "receita" que se aplica ao compartimento e seus subcompartimentos. Não é possível adicionar ou mover um compartimento padrão para um compartimento de zona de segurança. 
- Grupo de segurança de rede (NSG)O grupo de segurança de rede (NSG) atua como um firewall virtual para seus recursos de nuvem. Com o modelo de segurança de confiança zero do Oracle Cloud Infrastructure, todo o tráfego é negado, e você pode controlar o tráfego de rede dentro de uma VCN. Um NSG consiste em um conjunto de regras de segurança de entrada e saída que se aplicam somente a um conjunto especificado de VNICs em uma única VCN. 
- Balanceador de cargaO serviço Oracle Cloud Infrastructure Load Balancing fornece distribuição automatizada do tráfego de um único ponto de entrada para vários servidores no back-end. 
Considerações
Ao implantar essa arquitetura de referência, considere essas opções.
- Origens de DadosEstamos vendo a possibilidade de as soluções IoT monitorarem e reportarem continuamente dados sobre um paciente, como frequência cardíaca, e aplicativos que permitem aos pacientes simplesmente registrar eventos, como hábitos alimentares ou eventos médicos, como convulsões e convulsões. Essas informações podem fornecer uma grande quantidade de informações adicionais, ser incorporadas em registros médicos e ser analisadas usando a experiência médica suportada por IA/ML. Esses feeds de dados sugerem o uso de tecnologias de fluxo de eventos como o Kafka, que capturam esses eventos de maneira rápida e eficiente e podem armazenar os dados de maneira natural. Ao encontrar padrões e anomalias que possam ajudar no diagnóstico, geralmente, quanto mais dados sobre um paciente puderem ser capturados e organizados em (semi)dados estruturados que possam ser facilmente consultados, melhor. Assim, a obtenção de dados do paciente, como histórico familiar e dados mantidos por outras organizações médicas, com a permissão do paciente, pode revelar insights sem necessariamente revelar fatos individuais específicos. 
- DesempenhoO treinamento em IA requer o processamento de imagens de alta resolução e precisará ser repetido periodicamente (por exemplo, para acomodar formatos de imagem mais recentes ou imagens de alta qualidade). Esta atualização do modelo deve ser realizada de forma a não impactar os pacientes submetidos ao diagnóstico ou tratamento. Isso é feito executando atualizações de modelo em um ambiente isolado e depois escalando o ambiente atual para um ponto em que tanto o ambiente operacional quanto o ambiente de treinamento podem coexistir sem problemas de concorrência de recursos ou alocação de recursos. 
- SegurançaEm um contexto clínico, a segurança será fundamental, pois esses requisitos são altamente regulamentados. Não só os dados podem ser considerados de valor, mas a capacidade de interromper o acesso e a utilização dos dados através de ações acidentais ou deliberadas também é crucial. Portanto, os serviços envolvidos com esses dados precisam ser seguros. 
- DisponibilidadeA migração de serviços para ambientes de nuvem elimina vários problemas de resiliência e disponibilidade do centro médico. O provedor de nuvem não pode garantir a disponibilidade da rede. Como resultado, as opções de resiliência e fallback da rede devem pertencer ativamente para garantir a disponibilidade contínua no caso de uma falha da "última milha". Além disso, é melhor que uma organização com dependências críticas em tais cenários de falha exerça periodicamente a transição e a redução. Portanto, no caso de realmente precisar, o processo é executado como se fosse qualquer outro processo regular. 
- CustoQualquer caso de uso específico pode não exigir todos os serviços de lakehouse identificados. Estes refletem as tecnologias de comentário associadas à aplicação de uma casa de lago. Por exemplo, se o Oracle Big Data Cloud Service não for necessário, ele não deverá ser implantado. O armazenamento de objetos pode ser usado de forma inteligente colocando as imagens que não são necessárias em uma configuração de armazenamento de menor desempenho; quando um evento ocorre em relação ao paciente, o conteúdo é movido para uma configuração de armazenamento de maior desempenho. Isso acontece em muitos aspectos, como os mesmos princípios que um banco de dados aplica aos seus dados de movimentação de armazenamento dentro e fora do cache, armazenamento de acesso rápido (e.g., NVMe) e discos de rotação mais lentos. 
