Zahlung für On-Demand-Inferenzierung

Sie erhalten die folgenden Vorteile durch das Festschreiben von On-Demand-Inferenzen in OCI Generative AI:

  • Niedrige Barriere für die Nutzung generativer KI.
  • Zugriff auf alle verfügbaren Grundmodelle für generative KI.
  • Ideal zum Experimentieren und Auswerten der Modelle.
  • Pay as you go für Transaktionen. Weitere Informationen finden Sie im folgenden Hinweis.
Hinweis

Wenn On-Demand inferenziert wird, zahlen Sie für die folgenden Zeichenlängen:

  • Chat: Prompt-Länge (in Zeichen) + Antwortlänge (in Zeichen)
  • Texteinbettungen: Eingabelänge (in Zeichen)

Auf der Seite Preise wird 1 character als 1 transaction berechnet.

Wenn Sie grundlegende Modelle hosten oder sie auf dedizierten KI-Clustern optimieren, wird Ihnen die Einheitenzeit und nicht die Transaktion in Rechnung gestellt. In diesem Fall erfahren Sie unter Für dedizierte KI-Cluster bezahlen, wie Sie die Kosten des dedizierten KI-Clusters berechnen.

Modelle mit On-Demand-Preisen abgleichen

Siehe die folgenden Tabellen, um ein Basismodell mit seinem Produktnamen auf der Seite "Preisfindung" abzugleichen. Auf der Preisseite wird der Preis für 10.000 On-Demand-Transaktionen aufgeführt, wenn der Playground, die API oder die CLI für Inferenzen verwendet werden.

Chatmodelle

Modellname OCI-Modellname Preisfindungsseite - Produktname
Cohere Command A cohere.command-a-03-2025 Large Cohere
Cohere Command R 08-2024 cohere.command-r-08-2024 Small Cohere
Cohere Command R+ 08-2024 cohere.command-r-plus-08-2024 Large Cohere
Cohere Command R cohere.command-r-16k (veraltet) Small Cohere
Cohere Command R+ cohere.command-r-plus (veraltet) Large Cohere
Meta Llama 4 Maverick meta.llama-4-maverick-17b-128e-instruct-fp8 Meta Llama 4 Maverick
Meta Llama 4 Scout meta.llama-4-scout-17b-16e-instruct Meta Llama 4 Scout
Meta Llama 3.3 meta.llama-3.3-70b-instruct Large Meta
Meta Llama 3.2 11B Vision meta.llama-3.2-11b-vision-instruct Large Meta
Meta Llama 3.2 90B Vision meta.llama-3.2-90b-vision-instruct Large Meta
Meta Llama 3.1 (70B) meta.llama-3.1-70b-instruct Large Meta
Meta Llama 3.1 (405B) meta.llama-3.1-405b-instruct Meta Llama 3.1 405B
Meta Llama 3 meta.llama-3-70b-instruct (veraltet) Large Meta
Wichtig

Die für den On-Demand-Modus unterstützten Zusammenfassungs- und Textgenerierungsmodelle sind jetzt eingezogen. Wir empfehlen, stattdessen die chat-modelle zu verwenden.

Modelle einbetten

Modellname OCI-Modellname Preisfindungsseite - Produktname
Cohere Englisches Bild einbetten V3 cohere.embed-english-image-v3.0 Embed Cohere
Cohere Embed Multilingual Image V3 cohere.embed-multilingual-image-v3.0 Embed Cohere
Cohere Embed English Light Image V3 cohere.embed-english-light-image-v3.0 Embed Cohere
Cohere Embed Multilingual Light Image V3 cohere.embed-multilingual-light-image-v3.0 Embed Cohere
Cohere Embed English V3 cohere.embed-english-v3.0 Embed Cohere
Cohere Embed Multilingual V3 cohere.embed-multilingual-v3.0 Embed Cohere
Cohere Embed English Light V3 cohere.embed-english-light-v3.0 Embed Cohere
Cohere Embed Multilingual Light V3 cohere.embed-multilingual-light-v3.0 Embed Cohere

Chatbeispiel

Paul ruft das Modell meta.llama-3.3-70b-instruct mit der folgenden Eingabeaufforderung auf, die 220 characters lang ist:

Generieren Sie eine Produktneigung für ein an USB angeschlossenes kompaktes Mikrofon, das Surround-Sound aufnehmen kann. Das Mikrofon ist am nützlichsten bei der Aufnahme von Musik oder Gesprächen. Das Mikrofon kann auch für die Aufzeichnung von Podcasts nützlich sein.

Die Antwort vom Modell ist 2,205 characters lang. Paul will die Kosten für diesen Aufruf wissen. Hier sind die Schritte zur Berechnung der Kosten.

  1. Berechnen Sie die Prompt- und Antwortlänge (in Zeichen).

    Addieren wir die Länge der Eingabeaufforderung (220 Zeichen) und die Länge der Modellantwort (1.618 Zeichen).

    prompt + response length = 220 + 2,205 = 2,425 characters
  2. Berechnen Sie die Anzahl der Transaktionen.

    Die Preise werden für 10.000 Transaktionen aufgeführt.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    2,425 characters = 2,425 transactions
  3. Gehen Sie zu KI-Preise, und finden Sie unter OCI Generative AI unter Oracle Cloud Infrastructure Generative AI - Large Meta die <Large-Meta-unit-price>.
    Paul verwendet das meta.llama-3.3-70b-instruct-Modell, das mit dem Produkt übereinstimmt, Generative AI OCI - Large Meta auf der Seite AI Pricing für generative KI.
  4. Berechnen Sie den Preis für 1.838 Zeichen.
    price = (2,425 transactions )/ (10,000 transactions) x $<Large-Meta-unit-price>
Tipp

Neben der Preisberechnung können Sie die Kosten schätzen, indem Sie die Kategorie KI und maschinelles Lernen auswählen und den Kostenrechner für OCI Generative AI laden.

Beispiel für Texteinbettungen

Gina wandelt Kundenverträge in Einbettungen für eine neue semantische Suchanwendung um. Im Durchschnitt nimmt Gina 16 Dokumente pro Stunde auf. Jedes Dokument ist etwa 1,000 characters lang. Gina möchte eine Schätzung der monatlichen Rechnung für die Generierung dieser Einbettungen erhalten. So berechnen Sie die Kosten:

  1. Berechnen Sie die Eingabelänge (in Zeichen).

    Fassen wir die Länge des Eingabezeichens für jede Stunde zusammen.

    input character length for 16 documents = 16 x 1,000 = 16,000 characters per hour
  2. Gehen Sie zu KI-Preise und finden Sie unter OCI Generative AI unter Oracle Cloud Infrastructure Generative AI - Embed Cohere die <Embed-Cohere-unit-price>.
    Gina verwendet das cohere.embed-Modell, das mit dem Produkt übereinstimmt, Oracle Cloud Infrastructure Generative AI - Embed Cohere auf der Seite AI Pricing für generative KI.
  3. Berechnen Sie die Anzahl der Transaktionen pro Stunde.

    Gina nimmt 16.000 Zeichen pro Stunde auf. Die Preise werden für 10.000 Transaktionen aufgeführt.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    16,000 characters = 16,000 transactions
  4. Finden Sie den Stundenpreis für die 16.000 Zeichen, die Gina stündlich aufnimmt.
    hourly price = 
    (16,000 transactions ) / (10,000 transactions) x $<Embed-Cohere-unit-price>
  5. Finden Sie den monatlichen Preis für den längsten Monat des Jahres.
    One month = 31 x 24 hours = 744 hours
    monthly price = 744 hours x hourly price