KI-Modelle für Unternehmen in OCI Generative AI

Verwenden Sie Unternehmens-KI-Modelle in OCI Generative AI, um auf vortrainierte gehostete Modelle zuzugreifen, unterstützte benutzerdefinierte Modelle zu importieren und Modelle für Unternehmensinferenz-Workloads bereitzustellen.

Dieser Abschnitt enthält Links zu den in OCI Generative AI verfügbaren Modellen und zu den Ressourcen, die zum Bereitstellen, Verwalten und Skalieren dieser Modelle in OCI verwendet werden.

Was Sie mit KI-Modellen in Unternehmen tun können

Verwenden Sie KI-Modelle für Unternehmen, wenn Sie:

  • Inferenz mit vortrainierten gehosteten Modellen ausführen
  • Unterstützte benutzerdefinierte Modelle importieren und hosten
  • Wählen Sie On-Demand- und dedizierte Deployment-Optionen
  • Modelle auf dedizierten KI-Clustern für Produktions-Workloads bereitstellen
  • Endpunkte und privaten Netzwerkzugriff verwalten
  • Modell und regionale Verfügbarkeit prüfen
  • Preis- und Performanceüberlegungen verstehen

OCI Generative AI unterstützt wichtige Modellaufgaben wie:

  • Chat zur Konversationsgenerierung
  • Einbettungen für semantische Suche, Empfehlung, Klassifizierung und Clustering
  • Rank für die Bestellung von Dokumenten nach Relevanz für eine Abfrage

Modellverwendungsoptionen

OCI Generative AI unterstützt mehrere Möglichkeiten zur Verwendung von Modellen:

  • Vorgeschulte gehostete Modelle für verwaltete Inferenz über OCI
  • Importierte Modelle für unterstütztes Deployment benutzerdefinierter Modelle
  • On-Demand-Modus für gemeinsam verwalteten Zugriff
  • Dedizierter Modus für isoliertes Modell, das auf dedizierten KI-Clustern bereitgestellt wird

Mit diesen Optionen können Sie von Experimenten zur Produktion wechseln und gleichzeitig die Kontrollebene, die Performanceisolation und das Infrastrukturmanagement auswählen, die zu Ihrer Workload passen.

Modellinfrastruktur und -management

Enterprise AI Models in OCI Generative AI werden von Deployment- und Managementressourcen unterstützt, wie:

  • Dedizierte KI-Cluster für isoliertes Modellhosting
  • Endpunkte zum Servieren von Modelltraffic
  • Private Endpunkte für sicheren Netzwerkzugriff
  • Regionale Modellverfügbarkeit für die Deployment-Planung
  • Performance- und Kostenrichtlinien für Produktions-Workloads

Themen in diesem Bereich

Verwenden Sie die folgenden Themen, um mehr über Enterprise AI Models in OCI Generative AI zu erfahren: