NVIDIA-GPUs für Molecular Modeling and Drug Discovery auf Oracle Cloud bereitstellen
Die Envoy-Plattform von GridMarkets wird auf Oracle Cloud in Rechenzentren weltweit ausgeführt, um die Zeit, die erforderlich ist, um die Reaktion eines Wirkstoffmoleküls auf verschiedene Proteine zu simulieren, erheblich zu reduzieren.
Mit dem Aufkommen des computergestützten Drogendesigns (CADD) als Methode zur Modellierung von Arzneimitteln vor mehr als vier Jahrzehnten konnten Drogenforscher eine größere Anzahl von Molekülen untersuchen und die vielversprechendsten Drogenkandidaten schneller und billiger identifizieren als sie in einem Labor konnten. Durch die Kombination von Fortschritten bei maschinellem Lernen, Rechenleistung, Parallelisierung und cloud-nativen Simulationsplattformen wie GridMarkets konnten Arzneimittelforscher die Zeit reduzieren, die sie benötigen, um die Reaktion eines Wirkstoffmoleküls auf verschiedene Proteine von mehreren Wochen oder Monaten auf wenige Stunden zu simulieren.
Durch die Verwendung der proprietären Envoy-Anwendung GridMarkets, die in gängige Plattformen für molekulare Modellierung wie AMBER, GROMACS, NAMD und MOE integriert ist, können Drogenforscher Tausende von Liganden einreichen, die alle innerhalb eines Tages parallel laufen könnten, je nach Anzahl der Maschinen und ihrer Verarbeitungsleistung.
GridMarkets wurde 2011 von den Unternehmern Mark Ross und Hakim Karim gegründet und betreibt seine molekulare Simulationsplattform auf leistungsstarken Servern auf Oracle Cloud in Rechenzentren auf der ganzen Welt. Mit Oracle Cloud Infrastructure müssen Sie keine Anforderungen in die Queue stellen oder Simulationen planen. Stattdessen können Kunden von GridMarkets jederzeit auf eine (fast) unbegrenzte Anzahl von Maschinen zugreifen, ohne dass sie ungenutzte Kapazität bezahlen müssen, wenn sie dies nicht tun.
Innerhalb von Sekunden, nachdem Kunden die Anzahl der Maschinen auswählen, auf denen ihre Simulationen ausgeführt werden sollen, konfiguriert GridMarkets die Software- und Compute-Ressourcen, verschlüsselt die Daten und leitet die Anforderung weiter. Wenn der Job abgeschlossen ist, werden die Ergebnisse automatisch zurückgegeben und die Maschinen heruntergefahren, sodass keine verdeckenden Kosten entstehen. Da der Workflow von GridMarkets keine lokalen Ressourcen verbindet, müssen Drogenforscher nicht hinter der Firewall eines Unternehmens auf ihre Ergebnisse warten. Stattdessen können sie ihre Simulationen von einem Laptop aus überall auf der Welt aus ausführen. Mit Zero-Trust-Methoden für Defense-in-Depth-Sicherheit hat GridMarkets seine Plattform auf Oracle Cloud zum Schutz seiner eigenen Umgebung sowie des geistigen Eigentums seiner Kunden gesichert.
Architektur
GridMarkets ist eine Multicloud-Plattform, auf die über eine proprietäre Anwendung namens Envoy vom Desktop eines Endbenutzers zugegriffen wird.
Der Envoy-Client verwendet eine API, um den Zugriff auf die Head-End-Region anzufordern, die auf Oracle Cloud Infrastructure (OCI) gehostet wird. Oracle Cloud Infrastructure Load Balancing bietet High Availability (HA) für Frontend, Benutzeroberfläche und Microservices, mit denen Benutzer, Jobs, Aufgaben und Abrechnung verfolgt werden. Diese Microservices werden in Docker-Containern gehostet. Oracle MySQL Database Service stellt den Speicher für Daten bereit, die vom Frontend zusammen mit Redis und RabbitMQ für ephemere Transaktionsdaten zur Ausführung des Service erfasst wurden.
Nachdem Benutzer authentifiziert wurden und eine Verbindung zur Head-End-Region hergestellt haben, können sie die Anzahl der erforderlichen Rechner und CPUs oder GPUs für die Ausführung ihrer Simulationen anfordern. Der Head-End-Bereich bestimmt, wo die Anforderung gesendet wird. Die Anforderung kann je nach Verfügbarkeit der von GridMarkets-Clients angeforderten Gerätetypen an jeden Cloud-Serviceprovider oder jede Region in OCI gesendet werden.
Nach Abschluss der Anforderung lädt Envoy die zu modellierenden, simulierenden oder wiedergegebenen Daten in den Oracle Cloud Infrastructure Object Storage-Baustein hoch. Die Daten werden dann aus dem Objektspeicher abgerufen und in Oracle Cloud Infrastructure Block Volumes gespeichert, die an einen NAS-Filer (Scratch- und Staging-Baustein) angehängt sind, um den Speicherzugriff während der Anwendungsausführung zu beschleunigen. Basierend auf der angeforderten Compute-Ausprägung initiiert der Management Server die Anwendung, um die Daten mit dem HPC-Cluster in der angeforderten OCI-Region (CPU- oder GPU-Baustein) zu verarbeiten. Nach Abschluss der Modellierung oder Simulationen wird das Ergebnis in den Objektspeicher zurückgesendet und automatisch über den Envoy-Client an den Benutzer heruntergeladen.
Im Hintergrund plant der Management-Server die Jobs, weist Ressourcen zu, führt die Warteschlangen- und Dateiverwaltung durch und meldet Verfügbarkeits-, Nutzungs- und Abrechnungsinformationen an die Head-End-Region zurück.
Das folgende Diagramm veranschaulicht diese Referenzarchitektur.
Gridmarkets-oci-arch-oracle.zip
Auf der Roadmap für GridMarkets steht die Verwendung von NVIDIA A10 Tensor Core GPU auf virtuellen Maschinen, wenn diese Option verfügbar wird. Gridmarkets untersucht auch Optionen zur Integration von künstlicher Intelligenz (KI) und maschinellem Lernen (ML) für das Ressourcenmanagement.
Die Architektur umfasst die folgenden Komponenten:
- Mandant
Ein Mandant ist eine sichere und isolierte Partition, die Oracle in Oracle Cloud einrichtet, wenn Sie sich für Oracle Cloud Infrastructure registrieren. Sie können Ihre Ressourcen in Oracle Cloud in Ihrem Mandanten erstellen, organisieren und verwalten. Ein Mandant ist synonym zu einem Unternehmen oder einer Organisation. In der Regel verfügt ein Unternehmen über einen einzelnen Mandanten und spiegelt dessen Organisationsstruktur in diesem Mandanten wider. Ein einzelner Mandant ist in der Regel mit einem einzelnen Abonnement verknüpft, und ein einzelnes Abonnement hat in der Regel nur einen Mandanten.
- Region
Eine Oracle Cloud Infrastructure-Region ist ein lokalisierter geografischer Bereich, der mindestens ein Data Center enthält, das als Availability-Domains bezeichnet wird. Regionen sind unabhängig von anderen Regionen, und große Entfernungen können sie voneinander trennen (über Länder oder sogar Kontinente).
- Availability-Domain
Availability-Domains sind eigenständige, unabhängige Data Center innerhalb einer Region. Die physischen Ressourcen in jeder Availability-Domain sind von den Ressourcen in den anderen Availability-Domains isoliert, was eine Fehlertoleranz sicherstellt. Availability-Domains haben keine gemeinsame Infrastruktur wie Stromversorgung oder Kühlung oder das interne Availability-Domainnetzwerk. Aus diesem Grund ist es wahrscheinlich, dass ein Fehler in einer Availability-Domain sich auf die anderen Availability-Domains in der Region auswirkt.
- Virtuelles Cloud-Netzwerk (VCN) und Subnetze
Ein VCN ist ein anpassbares, softwaredefiniertes Netzwerk, das Sie in einer Oracle Cloud Infrastructure-Region einrichten. Wie herkömmliche Data Center-Netzwerke erhalten Sie mit VCNs vollständige Kontrolle über Ihre Netzwerkumgebung. Ein VCN kann mehrere sich nicht überschneidende CIDR-Blöcke aufweisen, die Sie nach dem Erstellen des VCN ändern können. Sie können ein VCN in Subnetze segmentieren, die sich auf eine Region oder eine Availability-Domain beschränken. Jedes Subnetz besteht aus einem Bereich zusammenhängender Adressen, die sich nicht mit anderen Subnetzen im VCN überschneiden. Sie können die Größe eines Subnetzes nach der Erstellung ändern. Ein Subnetz kann öffentlich oder privat sein.
- Sicherheitsliste
Für jedes Subnetz können Sie Sicherheitsregeln erstellen, die Quelle, Ziel und Typ des Traffics angeben, der in das und aus dem Subnetz zugelassen werden muss.
- Routentabelle
Virtuelle Routentabellen enthalten Regeln, mit denen Traffic von Subnetzen zu Zielen außerhalb eines VCN, normalerweise über Gateways, weitergeleitet wird.
- Internetgateway
Das Internetgateway lässt Traffic zwischen den öffentlichen Subnetzen in einem VCN und dem öffentlichen Internet zu.
- Servicegateway
Das Servicegateway ermöglicht den Zugriff von einem VCN auf andere Services wie Oracle Cloud Infrastructure Object Storage. Der Datenverkehr vom VCN zum Oracle-Service durchläuft die Oracle-Netzwerkfabric und nie das Internet.
- Load Balancer
Der Oracle Cloud Infrastructure Load Balancing-Service bietet eine automatisierte Trafficverteilung von einem einzelnen Einstiegspunkt auf mehrere Server im Backend.
- Compute
Mit dem Oracle Cloud Infrastructure Compute-Service können Sie Compute-Hosts in der Cloud bereitstellen und verwalten. Sie können Compute-Instanzen mit Ausprägungen starten, die Ihren Ressourcenanforderungen für CPU, Arbeitsspeicher, Netzwerkbandbreite und Speicher entsprechen. Nachdem Sie eine Compute-Instanz erstellt haben, können Sie sicher auf sie zugreifen, sie neu starten, Volumes anhängen und trennen und beenden, wenn Sie sie nicht mehr benötigen.
- Bare Metal
Die Bare-Metal-Server von Oracle bieten Isolation, Transparenz und Kontrolle über dedizierte Compute-Instanzen. Die Server unterstützen Anwendungen, die eine hohe Kernanzahl, große Speichermengen und eine hohe Bandbreite erfordern. Sie können bis zu 160 Cores (die größte in der Branche), 2 TB RAM und bis zu 1 PB Blockspeicher skalieren. Kunden können Cloud-Umgebungen auf den Bare Metal-Servern von Oracle mit signifikanter Performancesteigerung gegenüber anderen Public Clouds und On-Premise-Data Centern erstellen.
- Object Storage
Object Storage bietet schnellen Zugriff auf große Mengen strukturierter und unstrukturierter Daten eines beliebigen Inhaltstyps, darunter Datenbankbackups, Analysedaten und umfangreiche Inhalte, wie Bilder und Videos. Sie können Daten sicher und geschützt speichern und dann direkt aus dem Internet oder aus der Cloud-Plattform abrufen. Sie können den Speicher nahtlos skalieren, ohne dass sich die Performance oder Servicezuverlässigkeit verschlechtert. Verwenden Sie Standardspeicher für "Hot"-Speicher, auf den Sie schnell, sofort und häufig zugreifen müssen. Verwenden Sie Archivspeicher für "kalten" Speicher, den Sie über lange Zeiträume aufbewahren und selten oder selten darauf zugreifen.
- Block-Volume
Mit Block Storage Volumes können Sie Speicher-Volumes erstellen, anhängen, verbinden und verschieben und die Volume-Performance ändern, um Ihre Speicher-, Performance- und Anwendungsanforderungen zu erfüllen. Nachdem Sie ein Volume an eine Instanz angehängt und damit verbunden haben, können Sie es wie eine herkömmliche Festplatte verwenden. Sie können ein Volume auch trennen und an eine andere Instanz anschließen, ohne Daten zu verlieren.
- Oracle MySQL Database Service
Oracle MySQL Database Service ist ein vollständig verwalteter Oracle Cloud Infrastructure-(OCI-)Datenbankservice, mit dem Entwickler sichere, cloud-native Anwendungen schnell entwickeln und bereitstellen können. Oracle MySQL Database Service ist für OCI optimiert und exklusiv verfügbar und wird zu 100% von den OCI- und MySQL-Entwicklungsteams erstellt, verwaltet und unterstützt.
Oracle MySQL Database Service verfügt über eine integrierte leistungsstarke Analyse-Engine (HeatWave), um hochentwickelte Echtzeitanalysen direkt für eine betriebsbereite MySQL-Datenbank auszuführen.
- Überwachung
Der Oracle Cloud Infrastructure Monitoring-Service überwacht Ihre Cloud-Ressourcen aktiv und passiv mit Metriken, um Ressourcen und Alarme zu überwachen und Sie zu benachrichtigen, wenn diese Metriken alarmspezifische Trigger erfüllen.
- LoggingLogging ist ein hoch skalierbarer und vollständig verwalteter Service, der Zugriff auf die folgenden Logtypen aus Ihren Ressourcen in der Cloud ermöglicht:
- Auditlogs: Logs für Ereignisse, die vom Auditservice ausgegeben werden.
- Servicelogs: Von einzelnen Services ausgegebene Logs, wie API-Gateway, Events, Functions, Load Balancing, Object Storage und VCN-Flowlogs.
- Benutzerdefinierte Logs: Logs, die Diagnoseinformationen von benutzerdefinierten Anwendungen, anderen Cloud-Providern oder einer On-Premise-Umgebung enthalten.
- Ereignisse
Oracle Cloud Infrastructure-Services geben Ereignisse aus, bei denen es sich um strukturierte Nachrichten handelt, in denen die Änderungen an Ressourcen beschrieben werden. Ereignisse werden zum Erstellen, Lesen, Aktualisieren oder Löschen (CRUD-)Vorgänge, Änderungen am Lebenszyklusstatus von Ressourcen und Systemereignisse ausgegeben, die sich auf Cloud-Ressourcen auswirken.
- Email Delivery
Oracle Cloud Infrastructure Email Delivery ist ein hoch skalierbarer, kosteneffektiver und zuverlässiger E-Mail-Zustellungsservice für das Senden von anwendungsgenerierten E-Mails mit hohem Volumen für erfolgsrelevantes Marketing, Benachrichtigungen und Transaktionskommunikationen, wie Empfangsbestätigungen, Betrugserkennungs-Alerts, Multifaktor-Identitätsverifizierung und Kennwortzurücksetzungen.
Vorgestellt und bereitgestellt werden
Möchten Sie zeigen, was Sie auf Oracle Cloud Infrastructure erstellt haben? Möchten Sie Ihre Erkenntnisse, Best Practices und Referenzarchitekturen mit unserer globalen Community aus Cloud-Architekten teilen? Wir helfen Ihnen bei den ersten Schritten.
- Laden Sie die Vorlage (PPTX) herunter
Erstellen Sie eine eigene Referenzarchitektur, indem Sie die Symbole in den Beispiel-Drahtrahmen ziehen und ablegen.
- Architektur-Tutorial ansehen
Schritt-für-Schritt-Anweisungen zum Erstellen einer Referenzarchitektur.
- Diagramm einreichen
Senden Sie uns eine E-Mail mit Ihrem Diagramm. Unsere Cloud-Architekten überprüfen Ihr Diagramm und kontaktieren Sie, um Ihre Architektur zu besprechen.
Mehr erfahren
Weitere Informationen zu den Features dieser Architektur.
- Best Practices-Framework für Oracle Cloud Infrastructure
- Stellen Sie High-Performance-Computing (HPC) auf Oracle Cloud Infrastructure bereit
- Oracle High Performance Computing und GridMarkets unterstützen die Entwicklung neuer COVID-19-Medikamente (Blog)
- Oracle Cloud Infrastructure-Dokumentation
- Oracle Cloud-Kostenrechner