Modelli e aree di intelligenza artificiale generativa per gli agenti AI aziendali

Gli agenti AI aziendali nell'AI generativa OCI supportano un sottoinsieme di modelli e aree pre-addestrate dell'AI generativa OCI. In questa pagina sono elencati i modelli e le aree supportati per l'inferenza di runtime e la memoria del progetto.

Per chiamare i modelli

Per endpoint e strumenti compatibili con OCI-OpenAI
Nota

I seguenti modelli sono supportati per i endpoint compatibili con OCI OpenAI e gli strumenti compatibili con OpenAI.

Modelli chat disponibili

Gli agenti possono chiamare i seguenti modelli di chat per casi d'uso di inferenza identici:

Piattaforma AI Google Vertex
OpenAI Open Source
Piattaforma xAI
Importante

Chiamate esterne ai modelli xAI Grok

I modelli xAI Grok sono ospitati in un data center OCI, in una tenancy di cui è stato eseguito il provisioning per xAI. I modelli xAI Grok, a cui è possibile accedere tramite il servizio OCI Generative AI, sono gestiti da xAI.

Regioni commerciali disponibili (OC1)

È possibile accedere a modelli di inferenza agenti in una o più delle aree OC1 riportate di seguito.

Nome dell'area Posizione Identificativo dell'area Chiave area
Brasile (Est) - San Paolo San Paolo sa-saopaulo-1 GRU
Germania (Centro) - Francoforte Francoforte eu-frankfurt-1 FRA
India (Sud) - Hyderabad Hyderabad ap-hyderabad-1 HYD
Giappone centrale (Osaka) Osaka ap-osaka-1 KIX
Arabia Saudita centrale (Riad) Riyad me-riyadh-1 RUH
Regno Unito (Sud) - Londra Londra uk-london-1 LHR
Stati Uniti (Est) - Ashburn Ashburn us-ashburn-1 IAD
Stati Uniti (Midwest) - Chicago Chicago us-chicago-1 ORD
Stati Uniti (Ovest) - Phoenix Phoenix us-phoenix-1 PHX

Informazioni su Aree e domini di disponibile.

Nota

  • UAE East (Dubai): gli endpoint e gli strumenti compatibili con OCI-OpenAI non sono disponibili in quest'area.
  • Disponibilità: non tutti i modelli elencati sono disponibili nelle aree elencate precedenti. Per le aree supportate per modello e i dettagli di distribuzione, vedere la pagina Modelli per area.
  • Chiamate esterne: per le note sui modelli con chiamate esterne, vedere Chiamate esterne.

Per abilitare la memoria del progetto

Per compattazione memoria a breve termine (cronologia conversazione)

Quando si crea un progetto, è possibile abilitare la compattazione della memoria a breve termine per le conversazioni e le risposte correlate al progetto. Vedere la tabella riportata di seguito per i modelli e le aree disponibili per la compattazione della memoria.

Region Codice area Modello di memoria a breve termine
Brasile (Est) - San Paolo sa-saopaulo-1
Germania (Centro) - Francoforte eu-frankfurt-1
Regno Unito (Sud) - Londra uk-london-1
India (Sud) - Hyderabad ap-hyderabad-1
Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago) us-ahsburn-1 (dall'area all'area us-chicago-1)
Giappone centrale (Osaka) ap-osaka-1
Arabia Saudita centrale (Riad) me-riyadh-1
Stati Uniti (Midwest) - Chicago us-chicago-1
Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago) us-phoenix-1(da un'area all'altra a us-chicago-1)

Per l'estrazione delle informazioni chiave per la memoria a lungo termine

cappello

Quando si crea un progetto, è possibile abilitare l'estrazione delle informazioni dalle conversazioni e dalle risposte per una funzione di memoria a lungo termine. Si seleziona un modello di estrazione che mira a estrarre le informazioni chiave dalle conversazioni. Vedere la tabella riportata di seguito per le aree e il modello supportati per l'estrazione delle informazioni chiave da utilizzare per la memoria a lungo termine.

Region Modello di estrazione disponibile
Available Commercial Region (OC1) come riferimento incrociato con le region che OpenAI gpt-oss-120b sono disponibili OpenAI gpt-oss-120b
Per memorizzare le informazioni chiave come integrazioni per la memoria a lungo termine

Quando si crea un progetto, è possibile selezionare un modello di incorporamento per memorizzare le memorie estratte come vettori ricercabili. Il modello di incorporamento disponibile dipende dall'area del progetto. Vedere la tabella riportata di seguito per il modello di incorporamento disponibile in ogni area.

Region Codice area Modello incorporamento disponibile
Brasile (Est) - San Paolo sa-saopaulo-1 Incorporamento Cohere multilingue 3 (obsoleto)
Germania (Centro) - Francoforte eu-frankfurt-1 Incorporamento Cohere multilingue 3 (obsoleto)
Regno Unito (Sud) - Londra uk-london-1 Incorporamento Cohere multilingue 3 (obsoleto)
India (Sud) - Hyderabad ap-hyderabad-1 Incorpora immagine multilingue 3 Cohere (obsoleto)
Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago) us-ahsburn-1 Cohere Embed 4
Giappone centrale (Osaka) ap-osaka-1 Cohere Embed 4
Arabia Saudita centrale (Riad) me-riyadh-1 Cohere Embed 4
Stati Uniti (Midwest) - Chicago us-chicago-1 Cohere Embed 4
Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago) us-phoenix-1 Cohere Embed 4

Chiamate esterne

Chiamate esterne ai modelli xAI Grok

Importante

Chiamate esterne ai modelli xAI Grok

I modelli xAI Grok sono ospitati in un data center OCI, in una tenancy di cui è stato eseguito il provisioning per xAI. I modelli xAI Grok, a cui è possibile accedere tramite il servizio OCI Generative AI, sono gestiti da xAI.

Chiamate esterne ai modelli Google

Importante

Chiamate esterne a Google Gemini 2.5 Pro per le aree degli Stati Uniti

Il modello Google Gemini 2.5 Pro a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Google Gemini 2.5 Pro (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Google Gemini 2.5 Pro, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.

Importante

Chiamate esterne a Gemini 2.5 Flash per le aree degli Stati Uniti

Il modello Gemini 2.5 Flash a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.

Importante

Chiamate esterne a Gemini 2.5 Flash-Lite per le aree degli Stati Uniti

Il modello Gemini 2.5 Flash-Lite a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash-Lite (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash-Lite, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.