Standardiser les données de santé à l'aide des analyses et de l'architecture d'IA

Modernisez et standardisez les données de santé, appliquez des modèles de données et extrayez des informations exploitables pour obtenir des informations et améliorer l'expérience client.

Les données sur les payeurs, les fournisseurs et les réclamations peuvent être enrichies et des techniques d'analyse avancées, y compris l'intelligence artificielle, peuvent être appliquées pour des cas d'utilisation tels que les soins aux patients et la prévention des maladies, la prise de décision basée sur des preuves dans la pré-autorisation, l'analyse, la détection et la prévention des fraudes de réclamation, et l'optimisation des paramètres d'alarme médicale pour les hôpitaux et les prestataires de soins de santé.

Architecture

Cette architecture accélère la numérisation et la modernisation des fonctions métier des soins de santé à l'aide de leurs données existantes.

Les services Oracle Cloud Infrastructure (OCI) peuvent être utilisés pour ingérer, traiter et analyser des données afin d'obtenir des informations décisionnelles, d'améliorer l'expérience client et d'améliorer l'efficacité opérationnelle. Oracle propose une pile complète et entièrement intégrée d'applications cloud et de services de plate-forme cloud.

OCI offre un moyen simple et flexible de déployer et d'adapter de grands modèles de langage. Oracle propose différents choix pour appliquer l'intelligence artificielle à vos applications métier et accélérer l'innovation à l'aide des solutions SaaS d'Oracle, de la plate-forme de données et d'IA, et d'une infrastructure réseau, de calcul, de stockage et de performances élevées et à moindre coût que tous les autres fournisseurs cloud pour créer, tester, déployer et utiliser des applications d'IA de pointe. Si vous débutez sur OCI, vous pouvez essayer cette solution gratuitement à l'aide d'Oracle Cloud Free Tier, qui fournit des crédits d'essai gratuits de 300 USD pour une période de 30 jours. Free Tier inclut également plusieurs services Always Free disponibles pour une durée illimitée, même après l'expiration de vos crédits gratuits.

Dans cette architecture de référence oracle cloud, nous pouvons implémenter et appliquer la sécurité Zero Trust, la protection des données et la confidentialité, ainsi que des solutions automatisées de journalisation et de surveillance. Les données inactives et en transit peuvent être cryptées avec les technologies de cryptage standard du secteur. La journalisation du système et la surveillance des performances des applications peuvent être implémentées à l'aide d'OCI Logging, et un pare-feu d'application Web peut être utilisé avec OCI API Gateway pour se protéger contre les attaques DDoS potentielles et les cybermenaces.

Le schéma suivant illustre cette architecture de référence.



oci-santé-santé-science-aiml-oracle.zip

L'architecture comprend les composants suivants :

  • Data Integration

    Oracle Cloud Infrastructure Data Integration est un service cloud natif, sans serveur et entièrement géré qui extrait, charge, transforme, nettoie et remodèle des données de diverses sources de données vers des services Oracle Cloud Infrastructure cible, tels qu'Autonomous Data Warehouse et Oracle Cloud Infrastructure Object Storage. Les utilisateurs conçoivent les processus d'intégration des données à l'aide d'une interface utilisateur intuitive et sans code qui optimise les flux d'intégration pour générer le moteur et l'orchestration les plus efficaces, en allouant et en redimensionnant automatiquement l'environnement d'exécution.

    L'ETL (extraction de la charge de transformation) tire parti d'un traitement évolutif entièrement géré sur Spark, et l'ELT (extraction de la charge de transformation) tire parti des fonctionnalités de propagation SQL complètes d'Autonomous Data Warehouse afin de minimiser les mouvements de données et d'améliorer le délai de rentabilisation des données nouvellement ingérées.

    Oracle Cloud Infrastructure Data Integration fournit une exploration interactive et une préparation des données, et aide les ingénieurs de données à se protéger contre les dérives de schéma en définissant des règles pour gérer les modifications de schéma.

  • GoldenGate

    Oracle Cloud Infrastructure GoldenGate est un service géré fournissant une plate-forme de maillage de données en temps réel, qui utilise la réplication pour maintenir la haute disponibilité des données, et permettant des analyses en temps réel. Les clients peuvent concevoir, exécuter et surveiller leurs solutions de réplication de données et de traitement de données en continu sans avoir à allouer ou à gérer des environnements de calcul.

  • Object Storage

    Oracle Cloud Infrastructure Object Storage fournit un accès rapide à de grandes quantités de données, structurées ou non, de tout type de contenu, y compris des sauvegardes de base de données, des données analytiques et du contenu enrichi tel que des images et des vidéos. Vous pouvez stocker les données, puis les extraire directement à partir d'Internet ou de la plate-forme cloud, et ce, en toute sécurité. Vous pouvez redimensionner le stockage sans dégradation des performances ni de la fiabilité des services. Utilisez le stockage standard pour le stockage "à chaud" auquel vous devez accéder rapidement, immédiatement et fréquemment. Utilisez le stockage d'archive pour le stockage "à froid" que vous conservez pendant de longues périodes et auquel vous accédez rarement.

  • Fonctions

    Oracle Cloud Infrastructure Functions est une plate-forme Functions-as-a-Service (FaaS) entièrement gérée, colocative, hautement évolutive, à la demande. Il est optimisé par le moteur open source du projet Fn. OCI Functions vous permet de déployer votre code et de l'appeler directement ou de le déclencher en réponse à des événements. OCI Functions utilise des conteneurs Docker hébergés dans Oracle Cloud Infrastructure Registry.

  • Flux de données

    Oracle Cloud Infrastructure Data Flow est un service entièrement géré pour exécuter des applications Apache Spark. Il permet aux développeurs de se concentrer sur leurs applications et offre un environnement d'exécution facile à utiliser. Il comporte une interface utilisateur simple avec prise en charge des API pour l'intégration aux applications et aux workflows.

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse est un service de base de données à pilotage, sécurité et réparation automatiques optimisé pour les charges de travail d'entreposage de données. Vous n'avez pas à configurer ni à gérer le matériel, ni à installer de logiciel. Oracle Cloud Infrastructure gère la création, la sauvegarde, l'application de patches, la mise à niveau et le réglage de la base de données.

  • File Storage

    Oracle Cloud Infrastructure File Storage offre un système de fichiers réseau durable, évolutif, sécurisé et adapté à l'entreprise. Vous pouvez vous connecter à OCI File Storage à partir de n'importe quelle instance Bare Metal, de machine virtuelle ou de conteneur dans un VCN. Vous pouvez également accéder à OCI File Storage à partir de l'extérieur du VCN à l'aide d'Oracle Cloud Infrastructure FastConnect et du VPN IPSec.

  • Planificateur Slurm et base de données (open source)

    Slurm est un système de gestion de cluster et de planification de travaux open source, tolérant les pannes et hautement évolutif pour les clusters Linux de grande et de petite taille.

  • Monitoring

    Le service Oracle Cloud Infrastructure Monitoring surveille activement et passivement vos ressources cloud à l'aide de mesures pour surveiller les ressources et les alarmes afin de vous informer lorsque ces mesures répondent aux critères des déclencheurs spécifiés par les alarmes.

  • Logging
    Logging est un service hautement évolutif et entièrement géré qui permet d'accéder aux types de journal suivants à partir des ressources du cloud :
    • Journaux d'audit : journaux liés aux événements émis par le service Audit.
    • Journaux de service : journaux émis par des services individuels tels qu'API Gateway, Events, Functions, Load Balancing, Object Storage et les journaux de flux VCN.
    • Journaux personnalisés : journaux contenant des informations de diagnostic issues d'applications personnalisées, d'autres fournisseurs cloud ou d'un environnement sur site.
  • Compute

    Avec Oracle Cloud Infrastructure Compute, vous pouvez provisionner et gérer des hôtes de calcul dans le cloud. Vous pouvez lancer des instances de calcul avec des formes qui répondent à vos besoins en ressources pour l'UC, la mémoire, la bande passante réseau et le stockage. Après avoir créé une instance de calcul, vous pouvez y accéder en toute sécurité, la redémarrer, attacher et détacher des volumes, et y mettre fin lorsque vous n'en avez plus besoin.

  • Base de données vectorielle (Oracle DB 23ai)

    Une base de données vectorielle est une base de données qui peut stocker et gérer de manière native des incorporations vectorielles et gérer les données non structurées qu'elles décrivent, telles que des documents, des images, des vidéos ou des fichiers audio.

  • Data Catalog

    Oracle Cloud Infrastructure Data Catalog est une solution de repérage et de gouvernance de données en libre-service entièrement gérée pour vos données d'entreprise. Elle fournit aux ingénieurs données, aux data scientists, aux architectes de données et aux directeurs des systèmes de données un environnement collaboratif unique pour gérer les métadonnées techniques, commerciales et opérationnelles de l'entreprise.

  • Langchain

    LangChain est une structure modulaire open source permettant de créer des applications à partir de grands modèles de langage (LLM). Vous pouvez utiliser LangChain pour créer des chatbots, analyser du texte, effectuer des questions/réponses à partir de données structurées, interagir avec les API et créer des applications qui utilisent l'IA générative.

  • Intégration

    Oracle Integration est un environnement entièrement géré et préconfiguré qui permet d'intégrer des applications cloud et sur site, d'automatiser les processus métier et de développer des applications visuelles. Il utilise un serveur de fichiers compatible SFTP pour stocker et extraire des fichiers et vous permet d'échanger des documents avec des partenaires commerciaux interentreprises en utilisant un portefeuille de centaines d'adaptateurs et de recettes pour vous connecter à Oracle et à des applications tierces.

Ingestion et traitement des données

  • Oracle Cloud fournit des solutions hybrides et multicloud complètes intégrant des données sur site, sur d'autres plates-formes cloud et sur Internet. La plate-forme en tant que service OCI GoldenGate et Data Integration peut être utilisée pour ingérer des données provenant de divers systèmes source en fonction du type de source. OCI GoldenGate peut être utilisé pour répliquer des données, les garder synchronisées et les réparer afin de maintenir l'intégrité et la cohérence des données. Oracle Integration peut se connecter à diverses applications d'entreprise et assimiler des données. Les transferts de données en masse peuvent être effectués à l'aide de FTP sécurisé, HL7v2 sur MLP et de services Web FHIR (Fast Healthcare Interoperability Resources) standard.
  • Les données des systèmes de santé tels que les dossiers médicaux électroniques, les informations sur les patients, les demandes de remboursement et les données sur les fournisseurs, les données des dispositifs médicaux et les informations génomiques peuvent être déplacées vers le stockage d'objets hautement disponible, durable et à faible coût d'Oracle en tant que zone intermédiaire.
  • OCI Data Flow peut être utilisé pour traiter les données brutes déclenchées par OCI Functions lorsque de nouvelles données arrivent dans la zone intermédiaire. Data Flow sur la plate-forme Oracle Cloud fournit un service de préparation et de traitement des données accéléré, sans serveur et basé sur spark, où le code peut être écrit à l'aide de PySpark, de SQL ou de Java selon vos préférences sans gérer ni gérer d'infrastructure.
  • Les données préparées et traitées peuvent être écrites dans Oracle Autonomous Data Warehouse et OCI Object Storage en tant qu'étape organisée pour le traitement et la consommation en aval. Oracle Autonomous Data Warehouse est une plate-forme de base de données analytique entièrement gérée de pointe dotée d'une évolutivité, d'une sécurité, d'une gestion et d'une haute disponibilité intégrées. Pour les données de santé, la confidentialité et la protection des informations d'identification personnelle sont de la plus haute importance. Oracle Autonomous Data Warehouse fournit toujours le cryptage des données au repos (AES256). Les données sont également cryptées en transition à l'aide de TLS 2.0. Oracle Data Safe, inclus avec Autonomous Database, fournit un centre de contrôle unifié qui vous aide à gérer les exigences quotidiennes de sécurité et de conformité des bases de données Oracle. Oracle Data Safe fournit les fonctionnalités avancées de sécurité des données requises par les services de santé, telles que le masquage des données, le brouillage dynamique des données, l'audit des activités et la gestion du pare-feu SQL.
  • Dans la couche AI, la solution se compose de Data Integration, de l'intégration AI, de clusters de GPU et de CPU pour l'entraînement et l'inférence LLM, d'outils et de bibliothèques de développement AI, de contexte et de catalogue. Pour un modèle, le service OCI Generative AI peut être utilisé pour des modèles d'IA de pointe provenant de modèles Cohere et Meta Llama 3.1, d'un cluster de GPU dédié hautes performances, d'une API de chat et d'un playground de test, de LangChain et de LlamaIndex, ainsi que d'autres intégrations open source. Oracle propose une gamme plus large de GPU tels que L40s, A10, A100 et H100, ainsi qu'une distinction rapport prix/performances attrayante par rapport aux autres hypercalculateurs.
  • Oracle propose un planificateur Slurm entièrement automatisé, prêt à être déployé dans le cadre de l'automatisation du déploiement de cluster. Slurm est un système de gestion de cluster et de planification de travaux open source, tolérant les pannes et hautement évolutif pour les clusters Linux de grande et de petite taille.
  • OCI propose la génération augmentée par extraction (RAG) en tant que service géré avec les agents OCI GenAI (le service est toujours en version bêta et prend uniquement en charge OpenSearch en tant que référentiel de base de connaissances). Oracle Database 23ai et Oracle HeatWave MySQL sont parfaits pour la recherche et le stockage de vecteurs d'IA. Grâce à la RAG, les entreprises peuvent intégrer et enrichir une réponse de modèle de langage volumineux (LLM) à l'aide de la base de connaissances existante en fonction de leurs données existantes. Par exemple, si un utilisateur pose une question, il extrait des informations qui contiennent des informations contextuelles supplémentaires et les ajoute à la question, puis fournit la question et les textes récupérés à un LLM pour augmenter la réponse du LLM et réduire l'hallucination.

Recommandations

Utilisez les recommandations suivantes comme point de départ. Vos exigences peuvent différer de l'architecture décrite ici.
  • Utilisez un réseau cloud virtuel privé pour déployer des services, et utilisez une liste de sécurité et des groupes de sécurité réseau pour restreindre l'accès involontaire.
  • Utilisez OCI Identity and Access Management pour appliquer le principal des contrôles d'accès basés sur le moindre privilège et les rôles.
  • OCI API Gateway vous permet de publier des API avec des adresses privées accessibles à partir de votre réseau. Vous pouvez les exposer sur le réseau Internet public si nécessaire. Les adresses prennent en charge la validation d'API, la transformation des demandes et des réponses, CORS, l'authentification et l'autorisation, ainsi que la limitation des demandes.
  • OCI fournit une conformité HIPAA complète et FedRAMP et d'autres normes pour les obligations réglementaires et la protection.
  • Utilisez la technologie open source pour éviter toute dépendance vis-à-vis du fournisseur sur OCI, telle que LangChain, l'API REST, Functions, et créez une couche d'abstraction pour accélérer l'innovation et la transformation.

Accusés de réception

  • Auteurs : Gautam Karmakar
  • Contributeurs : John Sulyok