Creazione di un'applicazione

Crea un'applicazione nel servizio OCI Generative AI.

Le applicazioni definiscono un runtime gestito per le distribuzioni in hosting, incluse le impostazioni di scalabilità, storage gestito, networking e autenticazione. Questo task documenta i passi per la creazione di un'applicazione utilizzando la console di Oracle Cloud.

Suggerimento

Dopo aver creato un'applicazione, è possibile visualizzarne i dettagli ed eseguire altri task, ad esempio aggiornarla, spostarla in un altro compartimento, gestirne le tag o eliminarla. Per accedere a questi task, utilizzare il menu Azioni (tre punti) nella console. È inoltre possibile creare una o più distribuzioni per l'applicazione e attivare una distribuzione per renderla la versione in esecuzione. Per ulteriori informazioni, vedere Elenco delle applicazioni.

Per creare un'applicazione, nella pagina elenco selezionare Crea applicazione. Per assistenza nella ricerca della pagina di elenco, vedere Elenco delle applicazioni.

  1. (Facoltativo) In Variabili di ambiente, aggiungere le variabili di ambiente richieste dal contenitore.
  2. (Facoltativo) In Networking, selezionare il tipo di rete per il traffico in uscita (ad es.), quindi selezionare un tipo di endpoint (pubblico o privato) per accedere alla distribuzione attiva per questa applicazione.
  3. In Autenticazione, selezionare una configurazione del dominio di Identity e fornire le impostazioni OAuth necessarie (ambito e audience).
  4. Rivedere le impostazioni e selezionare Crea applicazione.

informazioni di base

  1. Immettere un nome per l'applicazione.
    Iniziare il nome con una lettera o un carattere di sottolineatura seguito da lettere, numeri, trattini o caratteri di sottolineatura. La lunghezza può essere compresa tra 1 e 255 caratteri.
  2. (Facoltativo) Immettere la descrizione dell'applicazione.
  3. Selezionare un compartimento in cui creare l'applicazione. Il compartimento predefinito è uguale alla pagina di elenco, ma è possibile selezionare qualsiasi compartimento nel quale si è autorizzati a lavorare.

Tag

  1. (Facoltativo) Selezionare Aggiungi tag e assegnare tag a questa memoria di vettore. Vedere Tag risorsa.
  2. Selezionare Crea.

Ridimensionamento

  1. Per la Ridimensionamento automatico, definisci il modo in cui la distribuzione ospitata si ridimensiona per gestire il carico.
    • Numero minimo di repliche

      Mantiene in esecuzione almeno tutte queste repliche. Deve essere minore o uguale al numero massimo di repliche. L'impostazione predefinita è 1.

    • Numero massimo di repliche

      Limita il numero di repliche. Nuove repliche vengono aggiunte all'aumentare del carico, fino a questo limite. Il valore predefinito è 3 (massimo 30). Impostare lo stesso valore per la replica minima per disabilitare il ridimensionamento automatico.

  2. Selezionare una metrica Valuta.
    Questa impostazione aggiunge le repliche quando le richieste concorrenti superano questo valore, fino al numero massimo di repliche impostate. Intervallo: da 1 a 500.
    • Utilizzo CPU (%)

      Aggiunge le repliche quando l'utilizzo della CPU supera questa percentuale, fino al numero massimo di repliche impostate. Intervallo: 50–95%.

    • Utilizzo memoria (%)

      Aggiunge le repliche quando l'utilizzo della memoria supera questa percentuale, fino al numero massimo di repliche impostate. Intervallo: 50–95%.

    • Richieste concorrenti

      Aggiunge le repliche quando le richieste concorrenti superano questo valore, fino al numero massimo di repliche impostate. Intervallo: da 1 a 500.

    • Richieste al secondo (RPS)

      Mantiene in esecuzione almeno tutte queste repliche. Deve essere minore o uguale al numero massimo di repliche. L'impostazione predefinita è 1.

Storage (facoltativo)

Se l'agente deve utilizzare lo storage gestito dal servizio, puoi selezionare PostgreSQL, OCI Cache e Oracle Autonomous Database.

Abilita lo storage gestito per le distribuzioni hosted associate a questa applicazione. Lo storage gestito viene creato e gestito dal servizio ed è accessibile solo dalla distribuzione hosted associata a questa applicazione. I dettagli di connessione vengono forniti al contenitore tramite le variabili di ambiente.

  1. Se l'agente deve utilizzare lo storage gestito del servizio, abilitare una delle opzioni riportate di seguito.
    • PostgreSQL OCI

      Abilitare OCI PostgreSQL per fornire un database gestito per le distribuzioni in questa applicazione.

      Nell'elenco a discesa di selezione dello storage verrà visualizzata una lista di sistemi DB PostgreSQL gestiti disponibili. Dopo aver selezionato un sistema di storage, la console visualizzerà una lista di applicazioni che attualmente utilizzano tale storage sotto l'elenco a discesa, consentendoti di capire quali applicazioni condividono il sistema DB selezionato.

      Per questa opzione:
      • Immettere il nome della variabile di ambiente che riceve l'URI di connessione PostgreSQL OCI. Il servizio aggiunge la stringa di connessione alla variabile di ambiente specificata. È necessario utilizzare lo stesso nome della variabile di ambiente nel codice.
      • Memorizzazione: selezionare se crearne una o utilizzarne una esistente. Se si seleziona uno storage esistente, l'applicazione condivide questa OCI PostgreSQL con altre applicazioni nella tenancy. Tuttavia, a ogni applicazione viene assegnato un database dedicato e questa applicazione dispone solo delle autorizzazioni per accedere al proprio database dedicato.
    • Cache OCI
      Abilitare la cache OCI per fornire una cache gestita per le distribuzioni in questa applicazione. Per questa opzione:
      • Immettere il nome della variabile di ambiente che riceve l'URI di connessione alla cache OCI
      • Memorizzazione: selezionare se crearne una o utilizzarne una esistente.
    • Oracle Autonomous Database
      Consente a Oracle Autonomous Database di fornire un database gestito per le distribuzioni in questa applicazione. Per questa opzione:
      • Immettere il nome della variabile di ambiente che riceve l'URI di connessione di Autonomous Database
      Oltre alla stringa di connessione, il servizio attiva la credenziale utente del database nel file locale del contenitore in
      /mnt/secrets/adb/username
      /mnt/secrets/adb/password
  2. (Facoltativo) Per le variabili di ambiente, immettere una o più variabili di ambiente per la distribuzione.

    Se il codice deve utilizzare variabili di ambiente personalizzate, è possibile definire tali variabili in questa sezione e queste variabili di ambiente vengono aggiunte al profilo del contenitore.

    • Testo non codificato

      Per ogni variabile, definire una chiave (il nome della variabile di ambiente) e il relativo valore.

    • Vault OCI

      Per ogni variabile, definire una chiave (il nome della variabile di ambiente) e il segreto nel vault selezionando le seguenti informazioni:

      • Compartimento vault
      • Vault
      • Segreto vault
      Il servizio aggiunge le informazioni del vault in un contenitore sotto forma di file JSON. Codice JSON di esempio:
      {
          "vaultId":<vault-ocid>,
          "key":<the secret in the vault>
      }

Networking (facoltativo)

Selezionare il modo in cui le distribuzioni in questa applicazione instradano il traffico in uscita (ad esempio) e il modo in cui i client accedono all'endpoint di distribuzione.

  1. Per Networking, selezionare una delle opzioni seguenti.
    • Predefinito (gestito dal servizio)

      Consente l'accesso in uscita ai servizi OCI e alla rete Internet pubblica tramite una rete gestita dal servizio.

    • Personalizzato (gestito dal cliente)
      Esegue l'instradamento del traffico in uscita tramite una VCN e una subnet nella tenancy utilizzando una connessione endpoint privato (PE/RCE). Consigliato per distribuzioni private integrate nelle aziende. Per questa opzione selezionare:
      • Compartimento VCN
      • VCN
      • Compartimento subnet
      • Subnet
      Nota

      Se si seleziona Personalizzato, tutto il traffico in uscita viene instradato alla subnet della VCN. Se l'agente richiede anche l'accesso a Internet, è possibile utilizzare una subnet pubblica e configurare la tabella di instradamento. Vedere Gateway Internet.
  2. Selezionare se l'accesso alla distribuzione attiva per questa applicazione avviene tramite un endpoint pubblico o privato.
    • Pubblico

      Accessibile dall'esterno della VCN.

    • Privato

      Accessibile solo dall'interno della VCN.

      Importante

      È necessario utilizzare un endpoint privato AI generativa. Se non ne hai uno, creare un endpoint privato AI generativa.

      Selezionare le informazioni riportate di seguito.

      • Compartimento endpoint privato
      • Endpoint privato

    Dopo la creazione dell'applicazione, è possibile accedere all'applicazione tramite questo endpoint privato utilizzando il nome FQDN o l'indirizzo IP. Esempio di FQDN:

    https://<pe-name>.pe.inference.generativeai.<region>
    .oci.oraclecloud.com/20251112/hostedApplications/{your_application_ocid}

Autenticazione

Eseguire i task in Impostazione dell'autenticazione per il supporto Agentic prima di avviare questo task.

  1. Selezionare Dominio di Identity OCI per l'autenticazione.
    Questo dominio è lo stesso dominio di Identity dell'applicazione integrata creata al Passo 2. Creare un'applicazione nel dominio di Identity a cui appartiene.
  2. Selezionare o incollare le informazioni sul dominio di Identity.
    • Selezionare un dominio di identità esistente

      Consente l'accesso in uscita ai servizi OCI e alla rete Internet pubblica tramite una rete gestita dal servizio.

      • Compartimento del dominio di identità
      • Dominio di Identity
    • Incolla un URL del dominio di identità

      Esempio: https://idcs-xxx.identity.oraclecloud.com:443

  3. Per il dominio di Identity immettere i valori per i parametri seguenti:
    • Ambito

      Specifica le azioni consentite dal token di accesso (autorizzazioni). Esempi: user.read , email.

    • Destinatari

      Specifica a quale servizio o API è destinato il token di accesso. Il token è accettato solo quando la richiesta di audience corrisponde al server delle risorse di destinazione.

      Per trovare il valore, andare alla console del dominio di Identity e scoprire l'applicazione integrata creata al Passo 2. Creare un'applicazione nel dominio di Identity. Selezionare Configurazione OAuth, copiare Audience principale e incollare qui.

      Esempi:
      https://api.example.com
      https://my-service.internal
      urn:my-resource-server
      ocid1.resourceServer.oc1..xxxx

Rivedi e crea

Rivedere le selezioni e, se si è soddisfatti, selezionare Crea.

Nota

Il tempo necessario per la creazione di un'applicazione dipende dalle risorse dell'applicazione.

  • Se lo storage gestito è abilitato, il servizio esegue il provisioning di un'istanza di storage dedicata, che potrebbe richiedere diversi minuti.

  • Se è selezionata l'opzione rete personalizzata, il servizio esegue il provisioning delle risorse di bridge di rete necessarie. Questa operazione potrebbe richiedere anche alcuni minuti.