Importierte Modelle verwalten (Neu)

Neben der Verwendung der gehosteten vortrainierten Modelle in OCI Generative AI können Sie unterstützte Open-Source- und Drittanbietermodelle (z. B. von Hugging Face) in OCI Generative AI importieren, hosten, Endpunkte erstellen und wie jedes andere Modell verwenden.

Umarmende Gesichtsvoraussetzungen

Bevor Sie ein Modell direkt von Hugging Face importieren:

  • Entscheiden Sie, welches unterstützte Modell von Hugging Face importiert werden soll, und beachten Sie die empfohlene Größe der dedizierten KI-Clustereinheit.
  • Um auf einige Modelle zuzugreifen und diese zu verwenden, benötigen Sie ein Hugging Face-Token, insbesondere die neueren und gated Versionen wie Llama 3 und Llama 3.1. Generieren Sie für diese Modelle ein Zugriffstoken aus Ihren Hugging Face-Kontoeinstellungen unter Zugriffstoken. Stellen Sie sicher, dass sie über die erforderlichen Berechtigungen verfügt (mindestens Lesezugriff).

Object Storage - Voraussetzungen

Bevor Sie ein Modell aus einem Object Storage-Bucket importieren:

  • Wenn Sie kein OCI-Administrator sind, bitten Sie einen, Ihnen die IAM-Berechtigung zur Verwaltung von Object Storage in Ihrem Compartment zu erteilen:
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
                                
  • Entscheiden Sie sich für ein Modell, das mit dem /v1/chat/completions-Endpunkt funktioniert. Nur diese Modelle werden unterstützt.
  • Stellen Sie sicher, dass das Modell nur eine der folgenden Funktionen unterstützt:
    • TEXT_TO_TEXT: Text ein, Text aus
    • IMAGE_TEXT_TO_TEXT: Bild oder Text oder beides in, Text heraus
    • EMBEDINGUNG: Text in, Vektoreinbettungen heraus
    • RERANK: Abfragen und Kandidatendokumente, Relevanzscores und eine neu geordnete Liste
  • Speichern Sie Modellartefakte in einem Objektspeicher-Bucket.
  • Wichtig: Die Konfigurationsdatei muss für einen erfolgreichen Import config.json lauten, ähnlich wie die meisten Hugging Face-Modelle.

Ressourcenanforderung und Preisfindung

Um ein importiertes Modell zu erreichen, erstellen Sie einen Endpunkt für dieses Modell in einem dedizierten KI-Cluster. In der folgenden Tabelle können Sie dedizierte KI-Clusterressourcen anfordern, bevor Sie ein Modell importieren.

Dedizierte KI-Clustereinheitengrößen für importierte Modelle
Größe der dedizierten KI-Clustereinheit Limitname Erforderliche Einheiten anfordern Anzahl AI-Einheiten
A10_X1 dedicated-unit-a10-count 1 1,77
A10_X2 dedicated-unit-a10-count 2 3,54
A10_X4 dedicated-unit-a10-count 4 7,08
A100_40G_X1 dedicated-unit-a100-40g-count 1 2,7
A100_40G_X2 dedicated-unit-a100-40g-count 2 5,4
A100_40G_X4 dedicated-unit-a100-40g-count 4 10,8
A100_40G_X8 dedicated-unit-a100-40g-count 8 21,6
A100_80G_X1 dedicated-unit-a100-80g-count 1 3,24
A100_80G_X2 dedicated-unit-a100-80g-count 2 6,48
A100_80G_X4 dedicated-unit-a100-80g-count 4 12,96
A100_80G_X8 dedicated-unit-a100-80g-count 8 25,92
H100_X1 dedicated-unit-h100-count 1 6,01
H100_X2 dedicated-unit-h100-count 2 12,02
H100_X4 dedicated-unit-h100-count 4 24,04
H100_X8 dedicated-unit-h100-count 8 48,08
H200_X1 dedicated-unit-h200-count 1 6,22
H200_X2 dedicated-unit-h200-count 2 12,44
H200_X4 dedicated-unit-h200-count 4 24,88
H200_X8 dedicated-unit-h200-count 8 49,76
Tipp

Informationen zum Anfordern der Ressourcen für die empfohlene Größe einer dedizierten KI-Clustereinheit finden Sie unter Ressourcengrenzwert anfordern.

Um den Preis zu berechnen, multiplizieren Sie den Preis für KI-Einheit pro Stunde für Oracle Cloud Infrastructure Generative AI - Modellimport auf der Seite Preisfindungsseiteninformationen mit der Anzahl der KI-Einheiten auf dieser Seite.