Für On Demand-Inferenzierung zahlen
Sie erhalten die folgenden Vorteile bei der Verpflichtung zur On-Demand-Inferenzierung in OCI Generative AI:
- Geringe Barriere für den Einsatz generativer KI.
- Zugriff auf alle verfügbaren Grundmodelle für generative KI.
- Ideal zum Experimentieren und Auswerten der Modelle.
- Pay as you go für Transaktionen. Weitere Einzelheiten finden Sie in der folgenden Anmerkung.
Bei On-Demand-Inferenzierung zahlen Sie für die folgenden Zeichenlängen:
- Chat: Prompt-Länge (in Zeichen) + Antwortlänge (in Zeichen)
- Texteinbettungen: Eingabelänge (in Zeichen)
Auf der Preisfindungsseite wird 1 character als 1 transaction berechnet.
Wenn Sie grundlegende Modelle hosten oder auf dedizierten KI-Clustern optimieren, werden Ihnen die Stunde und nicht die Transaktion in Rechnung gestellt. In diesem Fall wird unter Für dedizierte KI-Cluster bezahlen beschrieben, wie die dedizierten KI-Clusterkosten berechnet werden.
Modelle mit On-Demand-Preisen vergleichen
Auf der Preisseite wird der Preis für 10.000 On-Demand-Transaktionen oder 1.000.000 Token aufgeführt, wenn der Playground, die API oder die CLI für Inferenzen verwendet werden.
Gehen Sie zur Seite vorgeschulte Modelle, und wählen Sie das Modell aus, mit dem Sie arbeiten möchten. Suchen Sie im Abschnitt On-Demand-Modus die Informationen zur Preisseite für das Modell. Lesen Sie anschließend die Beispiele in diesem Abschnitt, um zu erfahren, wie Sie die Kosten basierend auf der Anzahl der Eingabe- und Ausgabezeichen berechnen.
Chatbeispiel
Paul ruft das Modell meta.llama-3.3-70b-instruct mit dem folgenden Prompt auf, der 220 characters lang ist:
Generieren Sie eine Produktneigung für ein kompaktes USB-Mikrofon, das Surround-Sound aufnehmen kann. Das Mikrofon ist am nützlichsten bei der Aufnahme von Musik oder Gesprächen. Das Mikrofon kann auch für die Aufzeichnung von Podcasts nützlich sein.
Die Antwort des Modells ist 2,205 characters lang. Paulus möchte die Kosten für diesen Anruf kennen. Hier sind die Schritte, um die Kosten zu berechnen.
Neben der Berechnung des Preises können Sie die Kostenschätzung vornehmen, indem Sie die Kategorie KI und maschinelles Lernen auswählen und den Kostenrechner für OCI Generative AI laden.
Beispiel für Texteinbettungen
Gina konvertiert Kundenverträge in Einbettungen für eine neue semantische Suchanwendung. Im Durchschnitt nimmt Gina 16 Dokumente pro Stunde auf. Jedes Dokument ist ca. 1,000 characters lang. Gina möchte eine Schätzung der monatlichen Rechnung für die Generierung dieser Einbettungen erhalten. Hier sind die Schritte, um die Kosten zu berechnen.