Analysez et visualisez les données de santé et appliquez l'IA sur OCI pour résoudre les défis du monde réel

Oracle Cloud Infrastructure (OCI) et les services offrent de nombreuses options pour créer, déployer et surveiller des solutions analytiques évolutives et hautes performances par rapport aux données Electronic Health Record et de surveillance des patients, et fournissent un accès facile à des informations exploitables à l'aide d'une expérience utilisateur transparente via une interface Web simple et intuitive.

Les données collectées à partir de dispositifs médicaux peuvent être analysées pour optimiser les paramètres d'alarme, et l'IA peut aider à développer des applications intelligentes pour améliorer l'efficacité clinique et réduire les risques.

Pour cette architecture de référence, nous présentons un cas d'utilisation client qui utilisait Snowflake et Snowpark pour stocker et analyser des données. Cela a posé des problèmes liés à l'augmentation des coûts et à la réduction du rapport prix/performances global. Alors que de plus en plus d'hôpitaux et de prestataires de soins de santé s'inscrivaient au service, les données augmentaient à un rythme exponentiel et le coût d'analyse de centaines de téraoctets de données augmentait de manière exponentielle. La solution manquait de flexibilité pour fournir des solutions d'analyse de données adaptées aux besoins.

La gestion inefficace des données et des modèles entravait la capacité d'intégrer rapidement les clients et de mettre les produits sur le marché. La sécurité du système a été réfléchie après coup et a souvent nécessité un processus manuel pour implémenter des contrôles de sécurité appropriés à chaque couche du déploiement. Le manque de prise en charge des outils et bibliothèques open source a créé des restrictions de fournisseur et empêché la portabilité.

Architecture

OCI prend en charge les outils open source, et sa structure permet d'implémenter l'architecture en toute transparence à l'aide de ressources internes spécialisées tout en offrant une portabilité.

Dans cette architecture de référence, nous discuterons d'une conception de solution qui peut être mise en œuvre pour des cas d'utilisation, y compris l'amélioration des soins aux patients et la prévention des maladies ; la prise de décision fondée sur des preuves en pré-autorisation ; et la détection, l'analyse et l'optimisation des paramètres d'alarme médicale pour les hôpitaux et les prestataires de soins de santé.

Data Analytics et Machine Learning :

Pour le client du secteur de la santé, Oracle Autonomous Data Warehouse était une solution idéale car le client utilisait des données de transmission en continu provenant de capteurs où l'évolutivité d'Oracle Autonomous Data Warehouse et les capacités de Lakehouse étaient optimales. L'intégration facile d'Oracle Autonomous Data Warehouse à Oracle Machine Learning a aidé le client à mieux préparer et comprendre ses données lors de la phase de prétraitement. Oracle Machine Learning prend également en charge l'export de données vers et depuis les blocs-notes Jupyter, ce qui permet aux data scientists de combiner le machine learning dans la base de données d'Oracle avec d'autres bibliothèques de data science populaires. Oracle Machine Learning présente de nombreux avantages, notamment : facilité d'installation, utilisation du calcul dans la base de données, réduction des frais de gestion, calcul de base de données puissant et évolutif polyvalent pour SQL, analyses basées sur Python à grande échelle.

Grâce à Oracle Machine Learning, le client a pu installer et tester une grande variété de bibliothèques basées sur Python (y compris Panda, NumPy), exécuter l'application Julia existante et effectuer des analyses à grande échelle. Oracle Machine Learning propose également le déploiement automatique de modèles, où les modèles sont instantanément disponibles pour l'évaluation dans les applications ou les tableaux de bord d'analyse après l'entraînement et la simplification du processus de déploiement. Le client a pu transférer les mêmes champs définis par l'utilisateur et UDTF Python, ainsi que les mêmes requêtes SQL de Snowflake vers Oracle Autonomous Data Warehouse sans avoir à refactoriser le code. Pour le modèle d'apprentissage automatique, le client a utilisé la fonctionnalité AutoML, ce qui a grandement simplifié le processus d'entraînement du modèle, permettant aux utilisateurs ayant une expérience d'apprentissage automatique minimale d'obtenir la précision souhaitée et de générer des informations à partir des données des dispositifs médicaux.

Application d'IA utilisant le calcul GPU sur OCI :

OCI fournit des performances optimales pour les applications d'IA avec une infrastructure cloud de pointe optimisée par des GPU Nvidia et AMD. OCI aide à accélérer votre solution d'IA grâce à l'entraînement des modèles, à l'inférence et à l'analyse de l'IA. OCI s'associe à Nvidia pour proposer Nvidia Nemo pour le développement de bout en bout de l'IA générative et utilise les microservices d'inférence Nvidia (NIM) pour accélérer l'inférence de l'IA des modèles d'IA. Pour exécuter des applications d'IA sur l'infrastructure d'IA OCI, OCI déploie des instances de calcul de GPU avec un cluster HPC Slurm ou Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine ou OKE) à l'aide de nos piles terraform personnalisées et évolutives, y compris diverses options de stockage.

Le diagnostic médical basé sur l'IA et la gestion des données cliniques se composent de NLP/LLM pour les données du DPI, l'imagerie médicale, les données cliniques et les résultats de laboratoire. Les structures d'application Nvidia, telles que BioNemo, MONAI, le serveur d'inférence triton, ainsi que Cohere fournissent une solution qui accélère l'adoption de l'IA.

Blocs-notes et intégration Data Science :

Cette architecture de référence utilise le service Oracle Cloud Infrastructure Data Science, une plate-forme entièrement gérée permettant aux équipes d'analystes de données de créer, d'entraîner, de déployer et de gérer des modèles de machine learning (ML) à l'aide de Python avec une structure intégrée telle que Pytorch, TensorFlow et toute autre structure open source de votre choix. Ce service peut être utilisé pour créer un environnement de développement Jupyter open source avec intégration intégrée à GitHub. Le calcul de GPU Nvidia A10 peut être utilisé pour entraîner les modèles de LLM, créer un pipeline MLOps intégré à mlfow et, enfin, déployer à partir du bloc-notes vers un point de terminaison sécurisé à inférence évolutive et à faible latence et surveiller les performances du modèle. Le client peut choisir parmi une variété de GPU Nvidia pris en charge sur des métaux nu ou des instances virtuelles pour entraîner et déployer des modèles d'IA à grande échelle.

Sauvegarde et récupération après sinistre :

Pour les soins de santé, la protection et la disponibilité des données client sont extrêmement importantes. En raison de diverses réglementations, les données doivent être protégées et mises à disposition à la demande. Oracle Autonomous Database fournit des options de sauvegarde et de récupération automatisées et peut créer une base de données de répliques à l'aide d'Oracle Cloud Guard. La réplique de base de données peut également fonctionner comme une copie de secours en lecture seule de la base de données afin de réduire la charge sur la base de données principale, ce qui améliore les performances de la base de données et l'équilibrage de la charge.

Security and Access Management :

Cette architecture implémente les meilleures pratiques de sécurité d'OCI Zero Trust en utilisant les fonctionnalités de sécurité des réseaux, des données et des applications dans toutes les couches de l'architecture. Pour la sécurité du réseau, le calcul est implémenté dans un réseau privé à l'aide d'un réseau cloud virtuel (VCN) et le filtre de trafic est appliqué à l'aide d'une liste de sécurité (SL) et d'un groupe de sécurité réseau (NSG). Les données sont toujours cryptées au repos (AES256) et en transit (TLS 2.0) avec une gestion facile des certificats fournie par le client.

Oracle Data Safe, inclus dans Oracle Autonomous Database, fournit un centre de contrôle unifié qui aide à gérer les exigences quotidiennes de sécurité et de conformité des bases de données Oracle. Oracle Data Safe fournit les fonctionnalités avancées de sécurité des données requises par les services de santé, telles que le masquage des données, le brouillage dynamique des données, l'audit d'activité et la gestion du pare-feu SQL.

Oracle Cloud Infrastructure Identity and Access Management (OCI Identity and Access Management) implémente le principe du moindre privilège et de l'authentification OAuth 2.0 de l'accès utilisateur final à l'aide de l'identité. Il fournit en toute sécurité des fonctionnalités avancées telles que l'authentification à plusieurs facteurs et l'authentification par jeton (JWT).

Le schéma suivant illustre cette architecture de référence.



oci-ai-healthcare_arch-oracle.zip

L'architecture comprend les composants suivants :

  • API Gateway

    Oracle Cloud Infrastructure API Gateway vous permet de publier des API avec des adresses privées accessibles à partir de votre réseau. Vous pouvez les rendre visibles sur le réseau Internet public si nécessaire. Les adresses prennent en charge la validation d'API, la transformation des demandes et des réponses, CORS, l'authentification et l'autorisation, ainsi que la limitation des demandes.

  • Stockage d'objet

    Oracle Cloud Infrastructure Object Storage fournit un accès rapide à de grandes quantités de données, structurées ou non, de tout type de contenu, y compris des sauvegardes de base de données, des données d'analyse et du contenu enrichi tel que des images et des vidéos. Vous pouvez stocker et extraire en toute sécurité des données, directement à partir d'Internet ou de la plate-forme cloud. Vous pouvez redimensionner le stockage sans dégradation des performances ni de la fiabilité des services. Utilisez le stockage standard pour le stockage "à chaud" auquel vous devez accéder rapidement, immédiatement et fréquemment. Utilisez le stockage d'archive pour le stockage "à froid" que vous conservez pendant de longues périodes et auquel vous accédez rarement.

  • Web Application Firewall (WAF)

    Oracle Cloud Infrastructure Web Application Firewall (WAF) est un service de mise en application en périphérie basé sur les régions et compatible avec le secteur des cartes de paiement qui est attaché à un point de mise en application, tel qu'un équilibreur de charge ou un nom de domaine d'application Web. WAF protège les applications du trafic Internet malveillant et indésirable. WAF peut protéger toutes les adresses Internet, en assurant l'exécution cohérente des règles sur les différentes applications d'un client.

  • Passerelle de routage dynamique

    Le DRG est un routeur virtuel qui fournit un chemin pour le trafic de réseau privé entre les réseaux cloud virtuels de la même région, entre un VCN et un réseau en dehors de la région, tel qu'un VCN dans une autre région Oracle Cloud Infrastructure, un réseau sur site ou un réseau dans un autre fournisseur cloud.

  • Liste de sécurité

    Pour chaque sous-réseau, vous pouvez créer des règles de sécurité qui indiquent la source, la destination et le type de trafic qui doivent être autorisés à entrer et à sortir du sous-réseau.

Recommandations

Utilisez les recommandations suivantes comme point de départ. Vos exigences peuvent être différentes de l'architecture décrite ici.
  • OCI Data Integration est un service colocatif entièrement géré qui aide les ingénieurs données et les développeurs à effectuer des tâches de déplacement et de chargement de données. La solution peut utiliser le service de chargement de données d'intégration de données pour assimiler et charger des données dans une zone intermédiaire dans le stockage d'objets afin de conserver les données à long terme, à faible coût, durables et hautement évolutives. Les transferts de données en masse peuvent être effectués à l'aide de FTP sécurisé, HL7v2 sur MLP et de services Web FHIR (Fast Healthcare Interoperability Resources) standard. Les données intermédiaires peuvent être traitées, préparées et organisées pour être alimentées dans une base de données Oracle Autonomous Data Warehouse à des fins d'utilisation des applications et des utilisateurs via l'interface Web et une requête ad hoc.

    Optimisé par les processus ETL ou ELT Spark, un grand volume de données peut être assimilé à partir de diverses ressources de données, nettoyées, transformées, remodelées et chargées efficacement dans Oracle Autonomous Data Warehouse. La base de données Oracle Autonomous Data Warehouse est une base de données entièrement gérée et automatisée leader du secteur pour les charges de travail analytiques, y compris les data marts, l'entrepôt de données et les lacs de données. Il s'agit d'un réglage automatique et fournit un provisionnement, une application de patches et une maintenance automatisés, ce qui optimise les performances.

    D'autres données peuvent être analysées à l'aide du service Oracle Cloud Infrastructure Data Science. Les modèles d'IA peuvent être créés, entraînés et déployés à l'aide d'un calcul GPU à faible coût hautes performances. Les points d'accrochage Web sortants personnalisés sont conçus pour transmettre des ressources de données aux utilisateurs finaux à l'aide d'un service d'identité et d'une adresse sécurisés.

  • Utilisez un réseau cloud virtuel privé pour déployer des services, et utilisez une liste de sécurité et des groupes de sécurité réseau pour restreindre l'accès involontaire.
  • Utilisez OCI Identity and Access Management pour appliquer le principal des contrôles d'accès basés sur le moindre privilège et les rôles.
  • OCI API Gateway vous permet de publier des API avec des adresses privées accessibles à partir de votre réseau. Vous pouvez les exposer sur le réseau Internet public si nécessaire. Les adresses prennent en charge la validation d'API, la transformation des demandes et des réponses, CORS, l'authentification et l'autorisation, ainsi que la limitation des demandes.
  • OCI garantit la conformité réglementaire avec les normes majeures, notamment HIPAA et FedRAMP, fournissant une base sécurisée pour la protection des données sensibles.
  • Utilisez la technologie open source pour éviter toute dépendance vis-à-vis du fournisseur sur OCI, telle que LangChain, l'API REST, Functions, et créez une couche d'abstraction pour accélérer l'innovation et la transformation.

Accusés de réception

  • Auteurs : Gautam Karmakar, Animesh Sahay
  • Contributeur : Ruzhu Chen