Überblick über den Service für generative KI

OCI Generative AI ist ein vollständig verwalteter Oracle Cloud Infrastructure-Service zum Erstellen, Bereitstellen und Betreiben generativer KI-Anwendungen im Unternehmensmaßstab.

Hauptfeatures

OCI Generative AI unterstützt diese wichtigsten generativen KI-Anwendungsfälle:

  • Chat für Konversationserfahrungen wie Beantwortung von Fragen und virtuelle Assistenten
  • Einbettungen für semantische Suche, Empfehlung, Klassifizierung und Clustering
  • Rank für die Bestellung von Dokumenten nach Relevanz für eine Abfrage
  • OpenAI-kompatible APIs zur Integration mit vorhandenen Tools und SDKs

Modellverwendungsoptionen

Sie können OCI Generative AI auf folgende Weise verwenden:

  • Verwenden Sie vortrainierte gehostete Modelle über den Playground, die API oder die CLI.
  • Importieren, optimieren und hosten Sie benutzerdefinierte Modelle in dedizierten KI-Clustern.
  • Wechseln Sie mit Enterprise Controls von Experimenten zur Produktion.

KI-Funktionen für Unternehmen

OCI Generative AI umfasst KI-Funktionen für Unternehmen zur Erstellung von Agent-Anwendungen der Produktionsklasse.

Diese Features umfassen:

  • OCI-Antwort-API
    • OpenAI Responses-kompatible API für Modellinteraktionen und Agent-Workflows
    • Unterstützt Orchestrierung, Argumentation, Werkzeugnutzung, Arbeitsspeicher und Routing mit mehreren Modellen
  • Tools
    • Dateisuche
    • Code-Interpreter
    • Funktionsaufruf für lokale Tools
    • MCP - Remote-MCP-Server aufrufen
    • Container-API
    • Vector Stores-API
    • Datei-API
  • Arbeitsspeicher
    • Unterhaltungs-API
    • Langzeitgedächtnis
    • Kurzzeitgedächtnis-Kontextverdichtung
  • Projekte
    • Personal-Workloads nach Projekt organisieren
    • Unterhaltungen, Dateien, Container und Speicher isolieren
    • Datenaufbewahrung und Speichereinstellungen konfigurieren
  • Anwendungen
    • Vollständig verwaltetes Hosting für Agent-Anwendungen
    • Unterstützung für Anwendungen, die mit Open-Source-Frameworks oder MCP-Servern erstellt wurden
    • Integrierte Sicherheitssteuerelemente
    • Unterstützung öffentlicher und privater Endpunkte
  • Vektorspeicher
    • Verwalteter Vektorspeicher
    • Dateiaufnahme
    • Semantische Suchfunktion
    • Metadatenfilterung
    • Unterstützung für RAG- und NL2SQL-Anwendungsfälle
  • NL2SQL
    • Nimmt Kundenschemainformationen auf
    • Reichert Schemadaten in einen semantischen Vektorspeicher an
    • Akzeptiert Abfragen in natürlicher Sprache und erstellt SQL
    • Wird berechtigungsgesteuert ausgeführt, ohne Datenbankinhalt zu verschieben oder zu kopieren
  • KI-API-Schlüssel für Unternehmen
    • OCI-spezifische API-Schlüssel für Enterprise AI-Services
    • Automatische Drehung

Plattformvorteile

  • Schnellere Erstellung produktionsfähiger KI-Anwendungen
  • Reduzierung der betrieblichen Komplexität
  • Anwendung von Governance- und Sicherheitskontrollen für Unternehmen
  • Verwenden Sie eine einheitliche Plattform für generative KI, Abruf, Speicher, Tools und verwaltetes Hosting