KI-Modelle für Unternehmen in OCI Generative AI
Verwenden Sie Unternehmens-KI-Modelle in OCI Generative AI, um auf vortrainierte gehostete Modelle zuzugreifen, unterstützte benutzerdefinierte Modelle zu importieren und Modelle für Unternehmensinferenz-Workloads bereitzustellen.
Dieser Abschnitt enthält Links zu den in OCI Generative AI verfügbaren Modellen und zu den Ressourcen, die zum Bereitstellen, Verwalten und Skalieren dieser Modelle in OCI verwendet werden.
Was Sie mit KI-Modellen in Unternehmen tun können
Verwenden Sie KI-Modelle für Unternehmen, wenn Sie:
- Inferenz mit vortrainierten gehosteten Modellen ausführen
- Unterstützte benutzerdefinierte Modelle importieren und hosten
- Wählen Sie On-Demand- und dedizierte Deployment-Optionen
- Modelle auf dedizierten KI-Clustern für Produktions-Workloads bereitstellen
- Endpunkte und privaten Netzwerkzugriff verwalten
- Modell und regionale Verfügbarkeit prüfen
- Preis- und Performanceüberlegungen verstehen
OCI Generative AI unterstützt wichtige Modellaufgaben wie:
- Chat zur Konversationsgenerierung
- Einbettungen für semantische Suche, Empfehlung, Klassifizierung und Clustering
- Rank für die Bestellung von Dokumenten nach Relevanz für eine Abfrage
Modellverwendungsoptionen
OCI Generative AI unterstützt mehrere Möglichkeiten zur Verwendung von Modellen:
- Vorgeschulte gehostete Modelle für verwaltete Inferenz über OCI
- Importierte Modelle für unterstütztes Deployment benutzerdefinierter Modelle
- On-Demand-Modus für gemeinsam verwalteten Zugriff
- Dedizierter Modus für isoliertes Modell, das auf dedizierten KI-Clustern bereitgestellt wird
Mit diesen Optionen können Sie von Experimenten zur Produktion wechseln und gleichzeitig die Kontrollebene, die Performanceisolation und das Infrastrukturmanagement auswählen, die zu Ihrer Workload passen.
Modellinfrastruktur und -management
Enterprise AI Models in OCI Generative AI werden von Deployment- und Managementressourcen unterstützt, wie:
- Dedizierte KI-Cluster für isoliertes Modellhosting
- Endpunkte zum Servieren von Modelltraffic
- Private Endpunkte für sicheren Netzwerkzugriff
- Regionale Modellverfügbarkeit für die Deployment-Planung
- Performance- und Kostenrichtlinien für Produktions-Workloads
Themen in diesem Bereich
Verwenden Sie die folgenden Themen, um mehr über Enterprise AI Models in OCI Generative AI zu erfahren:
-
Vorgeschulte Grundmodelle für generative KI
Erfahren Sie mehr über die vortrainierten gehosteten Modelle, die in OCI Generative AI verfügbar sind.
-
Validierte Modelle für Import
Prüfen Sie die unterstützten benutzerdefinierten Modelle, die Sie in OCI Generative AI importieren können.
-
On-Demand- und dedizierte Modi für OCI Generative AI-Modelle
Machen Sie sich mit den Deployment-Optionen für die Ausführung von Modellen in gemeinsam genutzten oder dedizierten Umgebungen vertraut.
-
Dedizierte KI-Cluster verwalten
Erfahren Sie, wie Sie dedizierte KI-Cluster für das Modellhosting erstellen und verwalten.
-
Dedizierte KI-Clusterperformancebenchmarks
Prüfen Sie die Benchmark-Richtlinien für die dedizierte KI-Clusterperformance.
- Generative KI-Regionen
Erfahren Sie, wo OCI Generative AI verfügbar ist.
- Generative KI-Modelle nach Region
Prüfen Sie die Modellverfügbarkeit nach OCI-Region.
-
Endpunkte verwalten
Erfahren Sie, wie Sie Endpunkte für den Modellzugriff verwalten.
-
Private Endpoints verwalten
Erfahren Sie, wie Sie den privaten Netzwerkzugriff für OCI Generative AI konfigurieren.
-
Kosten in generativer KI berechnen
Überprüfen Sie die Preisüberlegungen für die Nutzung von OCI Generative AI.