Aplicação de um Data Lakehouse
Um data lakehouse pode acelerar e melhorar o processo de diagnóstico, melhorando as chances de um paciente ser recuperado.
A diferença entre PACS e VNA é a capacidade de lidar com uma maior variedade de formatos de imagem além do DICOM. No entanto, qualquer um pode apresentar desafios. As imagens exigem muita capacidade de armazenamento, portanto, o sistema de armazenamento geralmente mantém imagens de caso atuais. Imagens mais antigas provavelmente serão movidas para um armazenamento off-line mais barato, possivelmente, fazendo com que o acesso ao histórico de imagens de um paciente seja um esforço desafiador e demorado. É provável que as soluções de RIS e PACS/VNA residam no local no centro médico. Isso significa que pode ser necessário acesso à sua infraestrutura de TI. Isso também significa que o centro médico precisa empregar especialistas em armazenamento para garantir a segurança dos dados. Uma solução de VNA tem maior probabilidade de apoiar a participação no intercâmbio de informações de saúde (HIE), o que permite que os profissionais de saúde colaborem no compartilhamento de dados, na criação de redes seguras e no uso de Recursos de Interoperabilidade de Assistência Médica Rápida (FHIR) e padrões relacionados. Esta pode ser uma solução regulamentada em alguns países, como a Rede de Saúde e Assistência Social (HSCN) no Reino Unido. Os regulamentos podem causar custos adicionais para provar a conformidade.
Um data lakehouse pode acelerar significativamente o processo de jornada do paciente. A adoção de uma solução de armazenamento fornecida na nuvem fornece acesso rápido a volumes muito altos de armazenamento (mesmo armazenamento arquivado) em uma escala econômica que é improvável que um centro médico corresponda a uma solução local. Uma solução em nuvem também reduz ou remove a necessidade de centros médicos manterem as habilidades especializadas necessárias para gerenciar problemas de redundância e recuperação para manter a operação da solução.
O acesso mais rápido às imagens significa que os médicos têm mais tempo para avaliar as imagens, o que reduz o tempo que um paciente gasta esperando por um diagnóstico e tratamento. Isso também significa que grandes volumes de imagens podem ser usados para treinar recursos de AI (inteligência artificial) e ML (aprendizado de máquina) (fornecidos pelo Oracle Cloud Infrastructure Vision e Oracle Cloud Infrastructure Data Science) em coletes saudáveis versus não íntegros. Isso não só permite que a IA/ML investigue o problema primário (os sintomas atuais do paciente), mas também pode detectar outros problemas para os quais o paciente ainda não desenvolveu sintomas. Se a IA/ML detectou ou não quaisquer problemas ao avaliar os raios-x, a última palavra deve ser sempre de um ser humano. A IA de processamento de imagem pode ajudar com isso de várias maneiras com base em sua avaliação:
- A AI pode priorizar as radiografias que sugerem questões significativas em que a intervenção rápida pode fazer diferença no prognóstico do paciente. Isso pode levar o paciente a ser admitido imediatamente em vez de ser enviado para casa.
- A IA pode atuar como um segundo par de olhos, destacando anomalias para o clínico avaliador. Isso pode ajudar a identificar potencialmente subtilezas para problemas secundários que um ser humano pode perder. Uma experiência digital pode ser criada com o uso do Oracle Functions (ou Oracle Container Engine for Kubernetes) ou um painel de controle pode ser renderizado com o Oracle Visual Builder, Oracle JET ou APEX Service.
- O data lakehouse terá uma variedade de dados relacionados que podem ser misturados com a análise médica para obter insights adicionais dos dados do paciente. Isso pode ajudar a descobrir tendências inesperadas ou insights dos quais o clínico pode não estar ciente.
Por exemplo, notas nos prontuários do paciente podem adicionar variáveis como se o paciente fosse fumante, fumante ou proveniente de uma família que inclua fumantes; ou os detalhes de contato do paciente combinados com dados geográficos podem adicionar variáveis associadas a condições de vida que poderiam ter fatores complicadores (e.g., a presença de umidade ou amianto).
Sem essa assistência, avaliar esses fatores exigiria que o clínico também pensasse como um assistente social, um realtor, e aumentaria o tempo para revisar o histórico médico do paciente em detalhes, além de focar na avaliação das imagens.
Para obter essa combinação de dados, armazenamos os dados semi ou totalmente estruturados em um banco de dados como o serviço Autonomous Database, usando o serviço Data Integration para vincular os conjuntos de dados. Os dados não estruturados e semiestruturados, como as imagens no Oracle Cloud Infrastructure Object Storage, seriam integrados adicionando links aos dados estruturados, como os metadados associados às imagens. O processo de vincular imagens a dados pesquisáveis seria suportado com o uso do serviço Oracle Cloud Infrastructure Data Labeling (identificação de dados). A rotulagem de dados também pode ser usada para rotular dados estruturados de forma que os registros que representam valores discrepantes possam ser facilmente marcados e, em seguida, explicitamente incluídos ou excluídos dos processos de AI/ML.
- Os achados de AI/ML seriam relatados como preliminares (ou sujeitos a um exame clínico secundário) ao paciente e seu prestador de cuidados, portanto outras causas para os sintomas poderiam ser examinadas. O resultado líquido disso seria que o paciente é outro passo mais próximo de seu diagnóstico. Essa comunicação pode ser obtida extraindo informações de contato dos registros do paciente no Autonomous Database e usando serviços como SMS, e-mail ou notificando a equipe clínica pelo painel ou pelos frontends digitais mencionados anteriormente.
Como os dados do paciente não estão vinculados a restrições físicas de TI de um centro médico, ele pode ser referido por especialistas médicos externos em outros locais. Isso pode acontecer de forma rápida e eficiente porque a infraestrutura para trabalhar com um ou mais HIEs provavelmente estará em vigor, expandindo assim as capacidades além das capacidades de um único prestador de cuidados. Esse tipo de automação pode ser obtido por meio do Oracle Integration Cloud Service (OIC) e de um gateway de API (em uma posição de saída, para que possamos controlar e auditar a saída de dados; se APIs externas estiverem sendo usadas no sistema de pagamento por chamada, o gerenciamento de saída permitirá que esses serviços sejam controlados e evite custos excessivos). O compartilhamento de dados genérico seria gerenciado por FTP (fornecido por meio do OIC), mas a comunicação de dados não API seria sinalizada por meio de chamadas de API na primeira instância.
Figura - Cenário de experiência do paciente sem data lakehouse na OCI
Figura - Cenário de experiência do paciente com data lakehouse na OCI
Sobre como vincular dados socioeconômicos a processos de imagem clínica
Os data lakehouses, que podem ser usados para ingerir grandes volumes de dados, podem ser conectados a outras fontes de dados para facilitar a análise eficiente para os clínicos avaliarem seus pacientes.
Destacamos como o uso de um data lakehouse nos permite ingerir grandes volumes de dados e combinar diferentes fontes de dados para ajudar a fornecer um tratamento clínico adequado. A capacidade de vincular dados não médicos aos pacientes é crucial. Considere a pandemia COVID-19 ou os surtos de Ebola na África Ocidental onde esses dados vinculados ajudaram a identificar e limitar a disseminação desses vírus. Tratamentos ideais para aqueles já infectados que melhoram suas chances de recuperação, velocidade de recuperação e problemas de saúde pós-infecção (condições de depressão e ansiedade, intolerância ao exercício e fadiga) podem ser encontrados através da análise contra outros pacientes com infecções e doenças semelhantes e seus resultados.
Para obter esse tipo de vínculo, precisamos entender os dados disponíveis para nós, que é o local onde o Oracle Cloud Infrastructure Data Catalog ajuda; não apenas no rastreamento dos dados que estão sendo armazenados na própria casa do lago, mas armazenados em outras origens de dados que podem ser acessadas e usadas por meio de origens como APIs. Isso pode ser usado para gerenciar o conteúdo do data lakehouse e informar a análise de dados que está sendo executada com as ferramentas do Oracle Cloud Infrastructure Data Science para determinar as relações nos dados.
As aplicações mais comuns de mistura de dados incluem a identificação e o isolamento de focos como a Doença do Legionnaire, que tem uma taxa de mortalidade de 10% e estimou 20.000 casos por ano apenas nos Estados Unidos. Esse tipo de identificação implicaria a extração de registros EMR/EHR relevantes nas notas do Autonomous Database e digitalizadas (Oracle Cloud Infrastructure Vision) dos pacientes sobre seus movimentos e a combinação deles com dados geográficos usando o conjunto de ferramentas Data Science e os recursos de visualização de qualquer um desses produtos: Oracle Analytics Cloud, Oracle Visual Builder, Oracle JET ou APEX Service. A escolha de ferramentas depende da experiência de usuário desejada e dos dados a serem apresentados.
Organizações como o Centro de Controle de Doenças (CDC) e a Organização Mundial de Saúde (OMS) fornecem APIs conectadas a conjuntos de dados sobre fatores contribuintes à saúde. Por exemplo, dados de qualidade do ar podem ser recuperados de serviços API como o Índice de Qualidade do Ar Mundial. Esses dados são vitais para pessoas com alterações pulmonares como pneumonia, uma vez que os níveis de qualidade do ar ou toxicidade são um fator agravante significativo e podem ser difíceis de avaliar devido à variação significativa, mesmo dentro de distâncias curtas entre cada sensor. Os dados podem ser avaliados usando uma combinação de Oracle Integration Cloud Service, gateway de API, Oracle Functions (ou Oracle Container Engine for Kubernetes), Autonomous Database (conteúdo estruturado) e Oracle Cloud Infrastructure Object Storage (conteúdo não estruturado). Os processos de preparação ou limpeza de dados podem usar o Oracle Cloud Infrastructure Data Science, o Oracle Cloud Infrastructure Data Flow ou o Oracle Cloud Infrastructure Data Integration para regular o fluxo de dados dentro ou fora da plataforma. Em seguida, os fluxos fornecem um recurso complementar de API Kafka, pois permite tratar dados como uma série de eventos. Isso significa que, se um serviço externo fornecer dados em bursts de dados altamente concentrados, os dados poderão ser preparados até que fiquemos prontos para carregá-los no data lakehouse.
Para isso, precisamos:
- Capture e limpe os dados relevantes para evitar "colocar, descartar lixo".
- Traduza dados não estruturados em dados semiestruturados para facilitar a pesquisa e o interrogatório.
O uso de padrões como HL7, FHIR, SNOMED (terminologia clínica) e práticas do HIE para representar os dados permite maior interoperabilidade com DICOM para imagens. Esses padrões de domínio são criados com base em tecnologias comuns do setor, como XML, JSON, REST etc. Como resultado, os produtos Oracle podem lidar com os dados prontos para uso com soluções específicas de domínio fornecidas com essas tecnologias.

