Anwendung erstellen

Erstellen Sie eine Anwendung im OCI Generative AI-Service.

Anwendungen definieren eine verwaltete Laufzeit für gehostete Deployments, einschließlich Skalierung, verwaltetem Speicher, Netzwerk und Authentifizierungseinstellungen. In dieser Aufgabe werden die Schritte zum Erstellen einer Anwendung mit der Oracle Cloud-Konsole dokumentiert.

Tipp

Nachdem Sie eine Anwendung erstellt haben, können Sie ihre Details anzeigen und andere Aufgaben ausführen, wie z.B. das Verschieben in ein anderes Compartment, das Verwalten ihrer Tags oder das Löschen. Verwenden Sie das Menü Aktionen (drei Punkte) in der Konsole, um auf diese Aufgaben zuzugreifen. Sie können auch ein Deployment für die Anwendung auf ihrer Detailseite erstellen. Weitere Informationen finden Sie unter Anwendungen auflisten.

Um eine Anwendung zu erstellen, wählen Sie auf der Listenseite Anwendung erstellen aus. Wenn Sie Hilfe beim Suchen der Listenseite benötigen, finden Sie weitere Informationen unter Anwendungen auflisten.

  1. (Optional) Fügen Sie unter Umgebungsvariablen die für den Container erforderlichen Umgebungsvariablen hinzu.
  2. (Optional) Wählen Sie unter Networking den Networkingtyp für ausgehenden Traffic (Egress) aus, und wählen Sie einen Endpunkttyp (öffentlich oder privat) für den Zugriff auf das aktive Deployment für diese Anwendung aus.
  3. Wählen Sie unter Authentifizierung eine Identitätsdomainkonfiguration aus, und geben Sie die erforderlichen OAuth-Einstellungen (Geltungsbereich und Zielgruppe) an.
  4. Prüfen Sie die Einstellungen, und wählen Sie Anwendung erstellen aus.

Grundlegende Informationen

  1. Geben Sie einen Namen für die Anwendung ein.
    Beginnen Sie den Namen mit einem Buchstaben oder Unterstrich, gefolgt von Buchstaben, Zahlen, Bindestrichen und Unterstrichen. Die Länge kann 1 bis 255 Zeichen betragen.
  2. (Optional) Geben Sie eine Bezeichnung für die Anwendung an.
  3. Wählen Sie ein Compartment für die Erstellung der Anwendung aus. Das Standard-Compartment ist mit der Listenseite identisch. Sie können jedoch jedes Compartment auswählen, für das Sie die Berechtigung zur Arbeit haben.

Tags

  1. (Optional) Wählen Sie Tag hinzufügen aus, und weisen Sie diesem Vektorspeicher Tags zu. Siehe Ressourcentags.
  2. Wählen Sie Erstellen aus.

Skalierung

  1. Bei Autoscaling definieren Sie, wie das gehostete Deployment skaliert wird, um die Last zu bewältigen.
    • Minimale Replikate

      Lässt mindestens so viele Replikate zu jeder Zeit laufen. Muss kleiner/gleich der maximalen Replikation sein. Der Standardwert ist 1.

    • Maximale Anzahl Replikate

      Begrenzt die Anzahl der Replikate. Neue Replikate werden hinzugefügt, wenn die Last steigt, bis zu diesem Grenzwert. Standard ist 3 (maximal 30). Setzen Sie diesen Wert auf das Mindestreplikat, um die automatische Skalierung zu deaktivieren.

  2. Wählen Sie eine Nebenläufigkeitsmetrik aus.
    Diese Einstellung fügt Replikate hinzu, wenn Hintergrundprozesse diesen Wert überschreiten, bis hin zu den maximal festgelegten Replikaten. Bereich: 1–500.
    • CPU-Auslastung (%)

      Fügt Replikate hinzu, wenn die CPU-Auslastung diesen Prozentsatz überschreitet, und zwar bis zu den maximal festgelegten Replikaten. Bereich: 50–95%.

    • Speicherauslastung (%)

      Fügt Replikate hinzu, wenn die Speicherauslastung diesen Prozentsatz überschreitet, und zwar bis zu den maximal festgelegten Replikaten. Bereich: 50–95%.

    • Hintergrundprozesse

      Fügt Replikate hinzu, wenn Hintergrundprozesse diesen Wert überschreiten, bis hin zu den maximal festgelegten Replikaten. Bereich: 1–500.

    • Anforderungen pro Sekunde (RPS)

      Lässt mindestens so viele Replikate zu jeder Zeit laufen. Muss kleiner/gleich der maximalen Replikattemperatur sein. Der Standardwert ist 1.

Speicher (optional)

Wenn der Agent den vom Service verwalteten Speicher verwenden muss, können Sie PostgreSQL, OCI Cache und Oracle Autonomous Database auswählen.

Aktivieren Sie den verwalteten Speicher für gehostete Deployments, die mit dieser Anwendung verknüpft sind. Verwalteter Speicher wird vom Service erstellt und verwaltet und ist nur über das gehostete Deployment zugänglich, das mit dieser Anwendung verknüpft ist. Verbindungsdetails werden dem Container über Umgebungsvariablen bereitgestellt.

  1. Wenn der Agent den verwalteten Speicher des Service verwenden muss, aktivieren Sie eine der folgenden Optionen.
    • OCI PostgreSQL

      Aktivieren Sie OCI PostgreSQL, um eine verwaltete Datenbank für Deployments in dieser Anwendung bereitzustellen.

      In der Dropdown-Liste "Speicherauswahl" wird eine Liste der verfügbaren verwalteten PostgreSQL-DB-Systeme angezeigt. Nachdem Sie ein Speichersystem ausgewählt haben, wird eine Liste der Anwendungen aufgeführt, die diesen Speicher verwenden. So können Sie verstehen, welche Anwendungen das ausgewählte DB-System gemeinsam verwenden.

      Für diese Option:
      • Geben Sie den Umgebungsvariablennamen ein, der die OCI-Verbindungs-URI PostgreSQL empfängt. Der Service fügt die Verbindungszeichenfolge zur angegebenen Umgebungsvariablen hinzu. Sie müssen denselben Namen wie der Umgebungsvariablenname in Ihrem Code verwenden.
      • Speicher: Wählen Sie aus, ob Sie einen Speicher erstellen oder einen vorhandenen verwenden möchten. Wenn Sie einen vorhandenen Speicher auswählen, teilt die Anwendung diesen OCI PostgreSQL mit anderen Anwendungen im Mandanten. Jeder Anwendung wird jedoch eine dedizierte Datenbank zugewiesen, und diese Anwendung hat nur Berechtigungen für den Zugriff auf ihre dedizierte Datenbank.
    • OCI-Cache
      Aktivieren Sie OCI Cache, um einen verwalteten Cache für Deployments in dieser Anwendung bereitzustellen. Für diese Option:
      • Geben Sie den Umgebungsvariablennamen ein, der die OCI-Cache-Verbindungs-URI empfängt
      • Speicher: Wählen Sie aus, ob Sie einen Speicher erstellen oder einen vorhandenen verwenden möchten.
    • Oracle Autonomous Database
      Aktivieren Sie Oracle Autonomous Database, um eine verwaltete Datenbank für Deployments in dieser Anwendung bereitzustellen. Für diese Option:
      • Geben Sie den Umgebungsvariablennamen ein, der die Autonomous Database-Verbindungs-URI empfängt
      Zusätzlich zur Verbindungszeichenfolge mountet der Service die Datenbankbenutzerzugangsdaten in der lokalen Containerdatei unter
      /mnt/secrets/adb/username
      /mnt/secrets/adb/password
  2. (Optional) Geben Sie unter Umgebungsvariablen eine oder mehrere Umgebungsvariablen für das Deployment ein.

    Wenn der Code benutzerdefinierte Umgebungsvariablen konsumieren muss, können Sie diese Variablen in diesem Abschnitt definieren, und diese Umgebungsvariablen werden dem Containerprofil hinzugefügt.

    • Nur Text

      Definieren Sie für jede Variable einen Schlüssel (den Namen der Umgebungsvariablen) und den zugehörigen Wert.

    • OCI-Vault

      Definieren Sie für jede Variable einen Schlüssel (den Umgebungsvariablennamen) und das Secret im Vault, indem Sie die folgenden Informationen auswählen:

      • Vault Compartment
      • Vault
      • Vault Secret
      Der Service fügt die Vault-Informationen als JSON-Datei in einen Container ein. Beispiel-JSON-Code:
      {
          "vaultId":<vault-ocid>,
          "key":<the secret in the vault>
      }

Networking (optional)

Wählen Sie aus, wie Deployments in dieser Anwendung ausgehenden Traffic (Egress) weiterleiten und wie Clients auf den Deployment-Endpunkt zugreifen.

  1. Wählen Sie unter Networking eine der folgenden Optionen aus.
    • Standard (serviceverwaltet)

      Ermöglicht ausgehenden Zugriff auf OCI-Services und das öffentliche Internet über ein serviceverwaltetes Netzwerk.

    • Benutzerdefiniert (vom Kunden verwaltet)
      Leitet ausgehenden Traffic über ein VCN und ein Subnetz in Ihrem Mandanten mit einer privaten Endpunktverbindung (PE/RCE) weiter. Empfohlen für private, unternehmensintegrierte Deployments. Wählen Sie für diese Option Folgendes aus:
      • VCN-Compartment
      • VCN
      • Subnetz-Compartment
      • Subnetz
      Hinweis

      Wenn Sie "Benutzerdefiniert" auswählen, wird der gesamte Egress-Traffic an das Subnetz des VCN weitergeleitet. Wenn der Agent auch Internetzugriff benötigt, können Sie ein öffentliches Subnetz verwenden und die Routing-Tabelle konfigurieren. Siehe Internetgateway.
  2. Wählen Sie aus, ob über einen öffentlichen oder privaten Endpunkt auf das aktive Deployment für diese Anwendung zugegriffen wird.
    • Öffentlich

      Zugriff von außerhalb des VCN.

    • Privat

      Nur über das VCN zugänglich.

      Wichtig

      Sie müssen einen privaten Endpunkt für generative KI verwenden. Wenn Sie keinen haben, erstellen Sie einen privaten Endpunkt für generative KI.

      Wählen Sie die folgenden Informationen aus:

      • Compartment des privaten Endpunkts
      • Privater Endpunkt

    Nachdem die Anwendung erstellt wurde, können Sie über diesen privaten Endpunkt entweder mit dem FQDN oder der IP-Adresse auf die Anwendung zugreifen. Beispiel-FQDN:

    https://<pe-name>.pe.inference.generativeai.<region>
    .oci.oraclecloud.com/20251112/hostedApplications/{your_application_ocid}

Authentifizierung

Führen Sie die Aufgaben unter Authentifizierung für Agentic Support einrichten aus, bevor Sie diese Aufgabe starten.

  1. Wählen Sie OCI-Identitätsdomain zur Authentifizierung aus.
    Diese Domain ist dieselbe Identitätsdomain wie die integrierte Anwendung, die Sie in Schritt 2 erstellt haben. Eine Anwendung in der Identitätsdomain erstellen gehört dazu.
  2. Wählen Sie die Identitätsdomaininformationen aus, oder fügen Sie sie ein.
    • Vorhandene Identitätsdomain wählen

      Ermöglicht ausgehenden Zugriff auf OCI-Services und das öffentliche Internet über ein serviceverwaltetes Netzwerk.

      • Identitätsdomain-Compartment
      • Identitätsdomain
    • Identitätsdomain-URL einfügen

      Beispiel: https://idcs-xxx.identity.oraclecloud.com:443

  3. Geben Sie für die Identitätsdomain Werte für die folgenden Parameter ein:
    • Geltungsbereich

      Gibt an, welche Aktionen das Zugriffstoken zulässt (Berechtigungen). Beispiele: user.read , email.

    • Zielgruppe

      Gibt an, für welchen Service oder welche API das Zugriffstoken bestimmt ist. Das Token wird nur akzeptiert, wenn der Zielgruppenanspruch mit dem Zielressourcenserver übereinstimmt.

      Um den Wert zu ermitteln, gehen Sie zur Identitätsdomainkonsole, und ermitteln Sie die integrierte Anwendung, die Sie in Schritt 2 erstellt haben. Anwendung in der Identitätsdomain erstellen. Wählen Sie OAuth-Konfiguration aus, kopieren Sie Primäre Zielgruppe, und fügen Sie sie hier ein.

      Beispiele:
      https://api.example.com
      https://my-service.internal
      urn:my-resource-server
      ocid1.resourceServer.oc1..xxxx

Prüfen und erstellen

Prüfen Sie die Auswahl, und wählen Sie Erstellen aus, wenn Sie mit der Auswahl zufrieden sind.

Hinweis

Die Zeit für die Erstellung einer Anwendung hängt von den Ressourcen für die Anwendung ab.

  • Wenn Managed Storage aktiviert ist, stellt der Service eine dedizierte Speicherinstanz bereit, die einige Minuten dauern kann.

  • Wenn benutzerdefiniertes Networking ausgewählt ist, stellt der Service die erforderlichen Netzwerk-Bridging-Ressourcen bereit. Dies kann auch einige Minuten dauern.