Informationen zur Verwendung von Oracle AI Database 26ai für Enterprise AI
- Beschleunigen Sie die Amortisierungszeit für KI, indem Sie vorhandene Oracle-residente Daten aktivieren
- Verbesserung der Antwortqualität und -konsistenz durch kuratierten, richtlinienorientierten Kontext
- Zuverlässige Skalierung auf die Leistung, Verfügbarkeit und Sicherheit der Unternehmensklasse von Oracle
- Reduzieren Sie die Komplexität der Architektur, indem Sie Datenspeicher und Vektormanagement vereinheitlichen
Architektur
Die folgende Architektur zeigt ein typisches dreistufiges Deployment von Dify auf OCI innerhalb einer OCI-Region und eines einzelnen VCN, das drei Availability-Domains für High Availability umfasst:
oracle-adb-dify-arch-oracle.zip
In der folgenden Liste werden Deployment und Konnektivität zusammengefasst:
- Ein On-Premise-Benutzer stellt über das Internet eine Verbindung zur Anwendung her.
- Anforderungen werden auf einem öffentlichen Load Balancer beendet, der von OCI Load Balancer (LB) in einem VCN bereitgestellt wird.
- Stellen Sie der Plattform einen Ingress-Controller und einen OCI Load Balancer vor, um externen Zugriff auf die Dify-Konsole und -Services zu erhalten.
- Öffentliche LBs erfordern zwei öffentliche Subnetze in verschiedenen Availability-Domains (AD) für High Availability (HA).
- Stellen Sie Dify Enterprise Edition auf OKE in einem VCN bereit, das mehrere ADs umfasst.
- Das Cluster stellt einen API-(Application Programming Interface-)Endpunkt für Kubernetes bereit und führt mehrere Worker-Knoten aus.
- Jeder Knoten hostet Anwendungspods. Verwenden Sie ein dediziertes privates Podsubnetz mit NAT-Gateways, sodass Pods eine Verbindung zum Internet herstellen, ohne öffentlich zugänglich gemacht zu werden.
- Containerimages werden über ein Servicegateway aus OCI Container Registry über Oracle Services Network (OSN) abgerufen.
- Verwenden Sie Oracle AI Database 26ai als Vektordatenbank und nutzen Sie dessen nativen Vektorspeicher/-abruf sowie Unternehmensfeatures (Partitionierung, RAC, Sharding, Exadata-Optimierung) für Skalierbarkeit und Zuverlässigkeit.
Die Architektur umfasst folgende Komponenten:
- OCI-region
Eine OCI-Region ist ein lokalisierter geografischer Bereich, der mindestens ein Data Centre enthält, das Availability-Domains hostet. Regionen sind unabhängig von anderen Regionen, und große Entfernungen können über Länder oder Kontinente voneinander getrennt werden.
- Availability-Domain
Availability-Domains sind eigenständige, unabhängige Data Center innerhalb einer Region. Die physischen Ressourcen in jeder Availability-Domain sind von den Ressourcen in den anderen Availability-Domains isoliert, was eine Fehlertoleranz sicherstellt. Availability-Domains haben keine gemeinsame Infrastruktur wie Stromversorgung oder Kühlung oder das interne Availability-Domainnetzwerk. Ein Fehler in einer Availability-Domain sollte sich also nicht auf die anderen Availability-Domains in der Region auswirken.
- Virtuelles OCI-Cloud-Netzwerk und Subnetz
Ein virtuelles Cloud-Netzwerk (VCN) ist ein anpassbares, softwaredefiniertes Netzwerk, das Sie in einer OCI-Region einrichten. Wie herkömmliche Data Center-Netzwerke erhalten Sie über VCNs die Kontrolle über Ihre Netzwerkumgebung. Ein VCN kann mehrere nicht überschneidende CIDR-Blöcke aufweisen, die Sie nach dem Erstellen des VCN ändern können. Sie können ein VCN in Subnetze segmentieren, die sich auf eine Region oder eine Availability-Domain beschränken. Jedes Subnetz besteht aus einem Bereich zusammenhängender Adressen, die sich nicht mit anderen Subnetzen im VCN überschneiden. Sie können die Größe eines Subnetzes nach der Erstellung ändern. Ein Subnetz kann öffentlich oder privat sein.
- Load Balancer
Oracle Cloud Infrastructure Load Balancer bietet eine automatisierte Trafficverteilung von einem einzigen Einstiegspunkt auf mehrere Server.
- OCI Kubernetes Engine
Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine oder OKE) ist ein vollständig verwalteter, skalierbarer und hochverfügbarer Service, mit dessen Hilfe Sie Ihre containerisierten Anwendungen in der Cloud bereitstellen können. Sie geben die Compute-Ressourcen an, die Ihre Anwendungen benötigen, und OKE stellt sie auf OCI in einem vorhandenen Mandanten bereit. OKE automatisiert mit Kubernetes das Deployment, die Skalierung und die Verwaltung containerisierter Anwendungen über Hostscluster hinweg.
- Oracle AI Database 26ai
Mit Oracle AI Database 26ai mit AI Vector Search können Sie Daten nach Bedeutung und nicht nach Schlüsselwörtern abfragen. Vektor-Darstellungen (Einbettungen) erfassen die Semantik von Text, Bildern, Audio und mehr, damit Sie ähnliche Inhalte effizient finden können. Integrierte SQL-Distanzfunktionen ermöglichen Ähnlichkeitssuchen mit Vektoren. Sie können semantische Ähnlichkeit und andere Suchkriterien kombinieren, um große Sprachmodelle (RAG) für genauere und relevantere Antworten zu erstellen.
- Oracle Autonomous AI Database
Oracle Autonomous AI Database bietet eine benutzerfreundliche, vollständig autonome (selbstverwaltete) Datenbank, die sich elastisch skalieren läßt und schnelle Abfrageperformance bietet. Als Service ist keine Datenbankadministration erforderlich. Sie müssen keine Hardware konfigurieren oder verwalten und keine Software installieren. Es verarbeitet automatisch Provisioning, Backup, Patching und Upgrade sowie das Erweitern oder Verkleinern der Datenbank und ist ein elastischer Service. Entwickeln Sie skalierbare KI-gestützte Apps mit beliebigen Daten mithilfe integrierter KI-Funktionen. Nutzen Sie das große Sprachmodell (LLM) Ihrer Wahl und stellen Sie es in der Cloud oder in Ihrem Data Center bereit.
Anwendungsfälle
Während Unternehmen KI-Entwicklungspläne auf der Grundlage großer Sprachmodelle (LLM) und privater Daten implementieren, bietet Oracle AI Database 26ai mit seinen doppelten Vorteilen des nativen Vektormanagements und ausgereiften Funktionen der Unternehmensklasse eine stabile, effiziente und niedrigschwellige Datenplattformlösung für das Dify Oracle AI Database Agent-Entwicklungsframework und KI-Anwendungen, die auf Dify basieren.
- Ressourcenwiederverwendung und Kostenoptimierung: Unternehmen müssen keine dedizierten Vektordatenbanken mehr kaufen und können vorhandene Oracle AI Database-Ressourcen vollständig wiederverwenden, wodurch die Beschaffungs- und Wartungskosten für Hardware erheblich gesenkt werden.
- Kapazitätsskalierbarkeit: Wenn multimodale Daten (wie industrielle Bilder und Audiologs) in KI-Anwendungen von Unternehmen immer häufiger werden, kann Oracle AI Database 26ai die multimodalen Vektorabruffunktionen weiter erweitern und umfassendere KI-Unterstützung für Szenarien wie Smart Manufacturing und medizinische Diagnose bieten.
- Stabilitätsgarantie: Mit der jahrelangen Erfahrung von Oracle AI Database in den Bereichen Partitionierung, RAC und Exadata-Optimierung kann Oracle AI Database 26ai problemlos Datenvolumen auf Petabyte-Ebene und Szenarien mit hoher Währung verarbeiten und so einen stabilen 24/7-Betrieb für KI-Anwendungen in Unternehmen gewährleisten.
Oracle AI Database 26ai ist nicht nur der Hauptanbieter des Vektordatenmanagements für Unternehmen, sondern auch die wichtigste technische Grundlage für die Förderung der Transformation von Unternehmen vom Datenspeicher zum KI-Value Mining und bietet soliden technischen Support für intelligente Upgrades für Unternehmen.
Hinweise
Berücksichtigen Sie diese Optionen bei der Integration von Dify in OCI.
- Verwenden Sie private Subnetze für App-/Datenebenen, wenn möglich NSGs über Sicherheitslisten.
- Verwenden Sie OCI Vault für Secrets (API-Schlüssel, DB-Zugangsdaten), am wenigsten privilegierte IAM-Policys und OCI Logging, Monitoring und Alarme zur Beobachtbarkeit.
- Berücksichtigen Sie mehrere Availability-Domainknotenpools und Load-Balancer-Health Checks für High Availability und Autoscaling.
Erforderliche Services und Rollen
Für diese Lösung sind die folgenden Services und Rollen erforderlich:
- Oracle Cloud Infrastructure
- Oracle Autonomous AI Database
- OCI Kubernetes Engine
- Dify Enterprise Edition
Dies sind die Rollen, die für jeden Service erforderlich sind.
| Servicename: Rolle | Erforderlich für... |
|---|---|
| Dify: Benutzer | Erstellen Sie einen Benutzer Dify, der durch den Kennwortstandard-Tablespace mit der Benutzer-Quota unlimited identifiziert wird.
|
Dify: DB_DEVELOPER_ROLE |
Ermöglicht Administratoren das schnelle Zuweisen von Berechtigungen, die Entwickler zum Entwerfen, Erstellen und Bereitstellen von Anwendungen für Oracle Database benötigen. |
Informationen zu Ihren Anforderungen finden Sie unter Produkte, Lösungen und Services von Oracle.
