23 Computazione AI

In questo capitolo viene descritto l'uso di risorse di elaborazione specializzate per alimentare gli agenti AI in Oracle AI Data Platform Workbench.

Un cluster di calcolo AI consente di ospitare gli agenti nelle aree di lavoro di AI Data Platform Workbench. I calcoli AI possono essere collegati agli agenti per eseguire l'esperienza di gioco e ospitare gli agenti distribuiti per i carichi di lavoro di produzione.

Dove trovare la computazione AI

Puoi gestire la computazione AI dalla pagina Compute, accessibile dal riquadro di navigazione a sinistra nel workbench di AI Data Platform. Fare clic sulla scheda Computazione AI per visualizzare i cluster di computazione AI disponibili nell'area di lavoro.


La pagina Compute viene aperta con la scheda Computazione AI selezionata.

La scheda Computazione AI è la pagina di arrivo principale per le risorse di calcolo AI nell'area di lavoro attualmente selezionata. Fornisce azioni tabella, filtri, ordinamento e informazioni sullo stato.

Colonna o controllo Scopo
Filter Cercare una risorsa nella tabella in base al nome o al testo visibile.
Somma (+) Avvia la creazione di una nuova computazione AI.
Elimina Rimuovi calcoli AI selezionati.
Nome calcolo AI Nome della risorsa di computazione. Fare clic sul nome di calcolo AI per aprire la pagina dei dettagli della risorsa.
Condizione Stato corrente del ciclo di vita, ad esempio Creazione, Attivo o Aggiornamento.
N. di repliche Numero di repliche di computazione associate alla computazione AI.
N. di agenti Numero di agenti ospitati nella computazione AI. Il conteggio viene visualizzato come collegamento quando sono presenti agenti.
Configurazione Riepilogo della forma di computazione delle repliche nella computazione AI, ad esempio 1 OCPU, 16 GB o 2 OCPU, 32 GB.
Aggiornato da / Aggiornato il / Creato il Informazioni di audit per l'aggiornamento e la creazione più recenti.
Menu Azione (...) Aprire azioni specifiche della risorsa per la riga selezionata.

Nota

Un segno di spunta verde indica una risorsa attiva. Un spinner indica un'operazione in corso, ad esempio Creazione o Aggiornamento. Attendere che una risorsa sia attiva prima di fare affidamento su di essa per il lavoro di produzione.

Fare clic sul nome di una computazione AI nella scheda Computazione AI consente di visualizzare informazioni dettagliate su tale computazione AI. La vista Calcolo AI dispone di quattro schede: Agenti, Dettagli, Utilizzo della computazione e Autorizzazioni.

Scheda Agenti

La scheda Agenti elenca gli agenti ospitati nella risorsa di computazione AI. Se un agente non viene distribuito, la computazione AI ospita l'esperienza di gioco necessaria per lo sviluppo e il test iterativi. Se l'agente viene distribuito, l'intelligenza artificiale calcolata ospita l'endpoint di distribuzione dell'agente per i carichi di lavoro di produzione.


Pagina Computazione AI aperta con la scheda Agenti selezionata.

Elemento scheda Agenti Descrizione
Filtra per nome agente Cercare la lista di agenti associata.
Nome agente Nome dell'agente associato alla risorsa di computazione.
Modalità di redazione Modalità di creazione dell'agente. Valori di Visual o Code.
Distribuzione Stato di distribuzione. Gli agenti ospitati nella computazione AI non possono essere distribuiti (il playground è ospitato nella computazione AI) o distribuiti (quando la computazione ospita l'endpoint di distribuzione dell'agente)
Stato URI/URI Informazioni dell'URI dell'endpoint quando un agente viene distribuito e ha un URI.
Computazione AI Calcolo associato all'endpoint di produzione dell'agente.
Data creazione/aggiornamento in data/aggiornamento di Creazione e aggiornamento dei metadati per l'agente.

Scheda Dettagli

La scheda Dettagli contiene un riepilogo della forma e dello storage configurati per ogni replica della computazione AI.


Pagina di calcolo AI aperta con la scheda Dettagli selezionata.

Elemento scheda Dettagli Descrizione
Forma driver Forma GPU selezionata per la computazione AI. AMD è la forma del driver per tutta la computazione AI.
OCPU Numero selezionato di OCPU per la computazione AI.
Memoria (GB) Memoria di calcolo AI in GB.
Volume a blocchi La dimensione del volume a blocchi della computazione AI in GB.

Scheda Utilizzo calcolo

Utilizzare la scheda Utilizzo della computazione per esaminare la CPU, la memoria e l'utilizzo della rete nel tempo. Ciò è utile quando si decide se ridimensionare repliche, OCPU o memoria verso l'alto o verso il basso. Non sono previsti tempi di inattività durante un'operazione di computazione AI di scale out/in.


Pagina AI Compute aperta con la scheda Utilizzo computazione selezionata.

Nota

Ogni serie temporale corrisponde a una replica diversa. Ad esempio, se crei una computazione AI con due repliche, due serie temporali verranno visualizzate proprio come mostra lo screenshot precedente.
Elemento scheda Utilizzo calcolo Descrizione
Filtri applicati Scegliere la data/ora di inizio e di fine per la vista utilizzo.
Visualizza Scegliere la metrica. Le opzioni sono le seguenti:
  • Utilizzo CPU
  • Utilizzo della memoria
  • Byte ricevuti dalla rete
  • Byte trasmessi dalla rete
Periodo di tempo Scegliere tra un periodo di tempo personalizzato o gli ultimi 7 giorni.
ID replica Filtrare le metriche in base a un ID replica specifico o mostrare tutte le repliche di computazione.
aggregazione Scegliere l'intervallo di aggregazione per il grafico. Le opzioni sono Auto, 1min, 5 min, 15min, 30min e 60min.

Scheda Autorizzazioni

La scheda Autorizzazione fornisce una tabella di tutte le entità che dispongono dell'autorizzazione per questa computazione AI. Utilizzare questa scheda per aggiungere principal, modificare il livello di autorizzazione o altrimenti modificare le autorizzazioni.


Pagina AI Compute aperta con la scheda Autorizzazioni selezionata.

Elemento scheda Autorizzazioni Descrizione
Nome principal Nome del principal o del ruolo.
Tipo di principal Tipo di principal. UTENTE o RUOLO.
Autorizzazione Livello di autorizzazione.
Sarà ereditato Se le autorizzazioni concesse per un oggetto padre concedono autorizzazioni agli oggetti contenuti.

Creare un cluster AI

Puoi creare cluster di calcolo AI per eseguire agenti AI nella tua AI Data Platform.

  1. Nella home page, andare all'area di lavoro.
  2. Fare clic su Crea, quindi su Computazione AI.
  3. Fornire il nome e la descrizione del cluster di computazione AI.
  4. Impostare il numero di repliche di computazione. Le repliche ridimensionano il pool di computazione. Ogni replica ospita una copia di tutti gli agenti ospitati nella computazione AI.

    Nota

    Il numero massimo di repliche è 10. Se è necessario aumentare il limite di replica, contattare il rappresentante Oracle.
  5. Impostare il numero di OCPU in ogni replica. Puoi scegliere 1, 2, 4, 8, 16, 32 o 64 OCPU.
  6. Impostare la memoria (in GB) per replica. L'intervallo di memoria consentito varia in base al numero di OCPU:
    OCPU Memoria
    1 OCPU 16 o 32 GB
    2 OCPU 16, 32 o 64 GB
    4 OCPU 32, 64 o 128 GB
    8 OCPU 32. 64, 128 o 256 GB
    16 OCPU 64, 128, 256, oppure 512 GB
    32 OCPU 128, 256 o 512 GB
    64 OCPU 256, 512 o 1024 GB
  7. Rivedere le unità AIDP corrispondenti che una configurazione di calcolo AI di questo tipo costa all'ora.
  8. Fare clic su Crea. La nuova risorsa viene visualizzata nell'elenco in stato Creazione. Lo stato diventa Attivo dopo il completamento del provisioning.

Modifica un cluster AI

È possibile modificare le impostazioni di configurazione di un calcolo AI mediante l'operazione Modifica.

Il completamento della modifica della OCPU o della memoria per il cluster di computazione AI può richiedere diversi minuti. È inoltre possibile interrompere le query con tempi di esecuzione lunghi nell'agente.
  1. Nella home page, andare all'area di lavoro.
  2. Fai clic su Computazione, quindi fai clic sulla scheda Computazione AI.
  3. Accanto al cluster di calcolo AI che si desidera modificare, fare clic su Icona a tre punti Azioni Azioni, quindi fare clic su Modifica. Puoi anche fare clic sul nome della computazione AI, quindi fare clic su Modifica in alto a destra.

    Pagina Compute aperta nella scheda Computazione AI. Il menu Azioni per un calcolo AI è aperto e Modifica è evidenziato.


    Pagina AI Compute aperta. Il pulsante Modifica nella parte superiore destra della schermata è evidenziato.

  4. Modificare il nome, la descrizione, il numero di repliche di computazione, il conteggio di OCPU per replica e la memoria per replica. Le modifiche alla computazione AI vengono completate senza tempi di inattività.
  5. Fare clic su Aggiorna. Lo stato di computazione AI viene visualizzato come Aggiornamento mentre è in corso l'aggiornamento.

Eliminare un cluster AI

Puoi eliminare i cluster di computazione AI inutilizzati o non più necessari.

  1. Passare all'area di lavoro e fare clic su Computazione, quindi fare clic sulla scheda Computazione AI.
  2. Avanti al cluster AI che si desidera eliminare, fare clic su Icona a tre punti Azioni Azioni e fare clic su Elimina.
  3. Fare clic su Elimina.

    Pagina di calcolo AI con menu Azioni aperto ed Elimina evidenziato

Arresta un cluster AI

Puoi interrompere una computazione AI per arrestare tutti gli agenti in esecuzione nella computazione AI. La computazione viene liberata e la misurazione si interrompe.

Abbiamo consigliato di arrestare una computazione AI ogni volta che gli agenti ospitati nella computazione non sono in uso.
  1. Nella home page, andare all'area di lavoro.
  2. Fai clic su Computazione, quindi fai clic sulla scheda Computazione AI.
  3. Avanti al cluster AI che si desidera arrestare, fare clic su Icona a tre punti Azioni Azioni e fare clic su Arresta.

    Pagina di calcolo AI con menu Azioni aperta e fermata evidenziata

Avvia un cluster AI

È possibile avviare una computazione AI arrestata in precedenza.

  1. Nella home page, andare all'area di lavoro.
  2. Fai clic su Computazione, quindi fai clic sulla scheda Computazione AI.
  3. Avanti al cluster AI che si desidera avviare, fare clic su Icona a tre punti Azioni Azioni e fare clic su Avvia.

    Pagina di calcolo AI con menu Azioni aperto e Avvio evidenziato

Riavviare un cluster AI

Puoi riavviare una computazione AI attiva per rilevare modifiche o aggiornamenti recenti.

Nota

Gli agenti ospitati nella computazione attiva verranno interrotti al riavvio.
  1. Nella home page, andare all'area di lavoro.
  2. Fai clic su Computazione, quindi fai clic sulla scheda Computazione AI.
  3. Avanti al cluster AI da avviare, fare clic su Icona a tre punti Azioni Azioni e fare clic su Riavvia.

    Pagina di calcolo AI con menu Azioni aperto e Riavvia evidenziato