Creazione di un endpoint negli agenti dell'intelligenza artificiale generativa
-
Nella pagina della lista Agenti selezionare il nome dell'agente per il quale si desidera creare un endpoint.
Per informazioni su come trovare la pagina della lista, vedere Elenco degli agenti
- In Risorse, selezionare Endpoint.
- Selezionare Crea endpoint.
-
Immettere i valori seguenti:
- Nome: un nome che inizia con una lettera o un carattere di sottolineatura, seguito da lettere, numeri, trattini o caratteri di sottolineatura. La lunghezza può essere compresa tra 1 e 255 caratteri.
- Descrizione: una descrizione facoltativa.
- Abilita sessione: abilitare questa funzione per mantenere il contesto della sessione di chat. Impossibile modificare questa opzione in un secondo momento.
- Se si abilita la sessione, specificare il timeout inattività in secondi. Il timeout di inattività predefinito è di 3600 secondi (1 ora). Ciò significa che dopo la mancanza di attività tra l'utente e l'agente per 1 ora, la sessione termina automaticamente e le seguenti conversazioni non mantengono il contesto della conversazione precedente. È possibile impostarlo a partire da 1 ora e fino a 7 giorni.
-
Abilita la memorizzazione di risultati di output di grandi dimensioni: abilitare questa funzione per memorizzare risposte di grandi dimensioni dall'agente nello storage degli oggetti. Questa funzione si applica solo allo strumento SQL.
Nota
Quando l'esecuzione SQL è abilitata in uno strumento SQL ed è abilitata questa funzione, gli agenti AI generativi memorizzano l'output in un file.csv
solo se il comando SQL restituisce più di 100 righe. Gli agenti AI generativi non memorizzano i risultati SQL di meno di 100 righe. -
Se si abilita la memorizzazione dei risultati di output di grandi dimensioni, specificare i dettagli dello storage degli oggetti riportati di seguito per memorizzare l'output.
- bucket
- Prefisso oggetto, se si dispone di cartelle
- Periodo di conservazione in minuti. Immettere un numero massimo di 1.440 che corrisponda a 24 ore. Il valore predefinito è 360 minuti, ovvero 6 ore.
-
Selezionare se abilitare i guardrail seguenti.
- Moderazione contenuto per l'input (prompt utente), l'output (risposta generata) o entrambi:
- Disabilita: non applicare la moderazione del contenuto.
- Blocca: consente di identificare e applicare la moderazione del contenuto.
- Informa: non applicare la moderazione del contenuto, ma informare l'utente se l'agente rileva il contenuto che richiede la moderazione.
- Protezione dell'iniezione di prompt (PI):
- Disabilita: non applicare la protezione PI.
- Blocco: consente di identificare e proteggere dall'inserimento rapido.
- Informa: non applicare la protezione PI, ma si propone di informare l'utente se l'agente rileva il contenuto che richiede la protezione PI.
-
Protezione delle informazioni di identificazione personale (PII) per l'input (prompt utente), l'output (risposta generata) o entrambi:
- Disabilita: non applicare la protezione PII.
- Blocco: consente di identificare e proteggere le informazioni personali.
- Informa: non applica la protezione PII, ma mira a informare l'utente se l'agente rileva il contenuto che richiede la protezione PII.
- Moderazione contenuto per l'input (prompt utente), l'output (risposta generata) o entrambi:
-
Selezionare se abilitare le seguenti opzioni per l'endpoint.
- Abilita trace: indica se tenere traccia e visualizzare la cronologia delle conversazioni, inclusi sia il prompt originale che la risposta generata, durante la conversazione chat. Se non si abilita questa funzione ora, è sempre possibile aggiungerla in un secondo momento modificando l'endpoint.
- Abilita citazione: indica se visualizzare i dettagli sull'origine delle informazioni per ogni risposta chat. Se non si abilita questa funzione ora, è sempre possibile aggiungerla in un secondo momento modificando l'endpoint.
- Abilita multilingua: indica se supportare la chat nelle seguenti lingue: arabo, inglese, francese, tedesco, italiano, giapponese, portoghese e spagnolo. Quando è disabilitata, l'inglese è la lingua predefinita.
- Abilita umano nel loop: indica se è richiesto un input umano, ad esempio la conferma della risposta generata da un agente prima di poter utilizzare la risposta.
Se non si abilitano queste funzioni ora, è sempre possibile aggiungerle in un secondo momento modificando l'endpoint.
- (Facoltativo) Selezionare Mostra opzioni avanzate e aggiungere una o più tag all'endpoint. Se si dispone delle autorizzazioni per creare una risorsa, si dispone dell'autorizzazione per aggiornarne le tag. Per assistenza, vedere Concetti dello spazio di nomi tag e tag.
- Selezionare Crea.