Importierte Modelle verwalten (Neu)
Neben der Verwendung der gehosteten vortrainierten Modelle in OCI Generative AI können Sie unterstützte Open-Source- und Drittanbietermodelle (z. B. von Hugging Face) in OCI Generative AI importieren, hosten, Endpunkte erstellen und wie jedes andere Modell verwenden.
Umarmende Gesichtsvoraussetzungen
Bevor Sie ein Modell direkt von Hugging Face importieren:
- Entscheiden Sie, welches unterstützte Modell von Hugging Face importiert werden soll, und beachten Sie die empfohlene Größe der dedizierten KI-Clustereinheit.
- Um auf einige Modelle zuzugreifen und diese zu verwenden, benötigen Sie ein Hugging Face-Token, insbesondere die neueren und gated Versionen wie Llama 3 und Llama 3.1. Generieren Sie für diese Modelle ein Zugriffstoken aus Ihren Hugging Face-Kontoeinstellungen unter Zugriffstoken. Stellen Sie sicher, dass sie über die erforderlichen Berechtigungen verfügt (mindestens Lesezugriff).
Object Storage - Voraussetzungen
Bevor Sie ein Modell aus einem Object Storage-Bucket importieren:
- Wenn Sie kein OCI-Administrator sind, bitten Sie einen, Ihnen die IAM-Berechtigung zur Verwaltung von Object Storage in Ihrem Compartment zu erteilen:
allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket> - Entscheiden Sie sich für ein Modell, das mit dem
/v1/chat/completions-Endpunkt funktioniert. Nur diese Modelle werden unterstützt. - Stellen Sie sicher, dass das Modell nur eine der folgenden Funktionen unterstützt:
- TEXT_TO_TEXT: Text ein, Text aus
- IMAGE_TEXT_TO_TEXT: Bild oder Text oder beides in, Text heraus
- EMBEDINGUNG: Text in, Vektoreinbettungen heraus
- RERANK: Abfragen und Kandidatendokumente, Relevanzscores und eine neu geordnete Liste
- Speichern Sie Modellartefakte in einem Objektspeicher-Bucket.
- Wichtig: Die Konfigurationsdatei muss für einen erfolgreichen Import
config.jsonlauten, ähnlich wie die meisten Hugging Face-Modelle.
Ressourcenanforderung und Preisfindung
Um ein importiertes Modell zu erreichen, erstellen Sie einen Endpunkt für dieses Modell in einem dedizierten KI-Cluster. In der folgenden Tabelle können Sie dedizierte KI-Clusterressourcen anfordern, bevor Sie ein Modell importieren.
| Größe der dedizierten KI-Clustereinheit | Limitname | Erforderliche Einheiten anfordern | Anzahl AI-Einheiten |
|---|---|---|---|
| A10_X1 | dedicated-unit-a10-count |
1 | 1,77 |
| A10_X2 | dedicated-unit-a10-count |
2 | 3,54 |
| A10_X4 | dedicated-unit-a10-count |
4 | 7,08 |
| A100_40G_X1 | dedicated-unit-a100-40g-count |
1 | 2,7 |
| A100_40G_X2 | dedicated-unit-a100-40g-count |
2 | 5,4 |
| A100_40G_X4 | dedicated-unit-a100-40g-count |
4 | 10,8 |
| A100_40G_X8 | dedicated-unit-a100-40g-count |
8 | 21,6 |
| A100_80G_X1 | dedicated-unit-a100-80g-count |
1 | 3,24 |
| A100_80G_X2 | dedicated-unit-a100-80g-count |
2 | 6,48 |
| A100_80G_X4 | dedicated-unit-a100-80g-count |
4 | 12,96 |
| A100_80G_X8 | dedicated-unit-a100-80g-count |
8 | 25,92 |
| H100_X1 | dedicated-unit-h100-count |
1 | 6,01 |
| H100_X2 | dedicated-unit-h100-count |
2 | 12,02 |
| H100_X4 | dedicated-unit-h100-count |
4 | 24,04 |
| H100_X8 | dedicated-unit-h100-count |
8 | 48,08 |
| H200_X1 | dedicated-unit-h200-count |
1 | 6,22 |
| H200_X2 | dedicated-unit-h200-count |
2 | 12,44 |
| H200_X4 | dedicated-unit-h200-count |
4 | 24,88 |
| H200_X8 | dedicated-unit-h200-count |
8 | 49,76 |
Informationen zum Anfordern der Ressourcen für die empfohlene Größe einer dedizierten KI-Clustereinheit finden Sie unter Ressourcengrenzwert anfordern.
Um den Preis zu berechnen, multiplizieren Sie den Preis für KI-Einheit pro Stunde für Oracle Cloud Infrastructure Generative AI - Modellimport auf der Seite Preisfindungsseiteninformationen mit der Anzahl der KI-Einheiten auf dieser Seite.
Aufgaben zum Importieren eines Modells
- Importieren Sie das Modell mit einer der folgenden Optionen:
- Erstellen Sie ein dediziertes KI-Hostcluster für das importierte Modell mit einer empfohlenen Einheitenausprägung.
- Endpunkte erstellen.
- Rufen Sie das Modell über die OCI Generative AI-API, das SDK oder das Modell im Playground verwenden auf.
Importierte Modelle verwalten
Nachdem Sie die Voraussetzungen erfüllt und ein Modell importiert haben, können Sie die folgenden Aufgaben für die importierten Modelle ausführen: