Modelli e aree di intelligenza artificiale generativa per gli agenti AI aziendali
Gli agenti AI aziendali nell'AI generativa OCI supportano un sottoinsieme di modelli e aree pre-addestrate dell'AI generativa OCI. In questa pagina sono elencati i modelli e le aree supportati per l'inferenza di runtime e la memoria del progetto.
Per chiamare i modelli
I seguenti modelli sono supportati per i endpoint compatibili con OCI OpenAI e gli strumenti compatibili con OpenAI.
Modelli chat disponibili
Gli agenti possono chiamare i seguenti modelli di chat per casi d'uso di inferenza identici:
- Piattaforma AI Google Vertex
- OpenAI Open Source
- Piattaforma xAI
Chiamate esterne ai modelli xAI Grok
I modelli xAI Grok sono ospitati in un data center OCI, in una tenancy di cui è stato eseguito il provisioning per xAI. I modelli xAI Grok, a cui è possibile accedere tramite il servizio OCI Generative AI, sono gestiti da xAI.
Regioni commerciali disponibili (OC1)
È possibile accedere a modelli di inferenza agenti in una o più delle aree OC1 riportate di seguito.
| Nome dell'area | Posizione | Identificativo dell'area | Chiave area |
|---|---|---|---|
| Brasile (Est) - San Paolo | San Paolo |
sa-saopaulo-1
|
GRU
|
| Germania (Centro) - Francoforte | Francoforte |
eu-frankfurt-1
|
FRA
|
| India (Sud) - Hyderabad | Hyderabad |
ap-hyderabad-1
|
HYD
|
| Giappone centrale (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Arabia Saudita centrale (Riad) | Riyad |
me-riyadh-1
|
RUH
|
| Regno Unito (Sud) - Londra | Londra |
uk-london-1
|
LHR
|
| Stati Uniti (Est) - Ashburn | Ashburn |
us-ashburn-1
|
IAD
|
| Stati Uniti (Midwest) - Chicago | Chicago |
us-chicago-1
|
ORD
|
| Stati Uniti (Ovest) - Phoenix | Phoenix |
us-phoenix-1
|
PHX
|
Informazioni su Aree e domini di disponibile.
- UAE East (Dubai): gli endpoint e gli strumenti compatibili con OCI-OpenAI non sono disponibili in quest'area.
- Disponibilità: non tutti i modelli elencati sono disponibili nelle aree elencate precedenti. Per le aree supportate per modello e i dettagli di distribuzione, vedere la pagina Modelli per area.
- Chiamate esterne: per le note sui modelli con chiamate esterne, vedere Chiamate esterne.
Per abilitare la memoria del progetto
Quando si crea un progetto, è possibile abilitare la compattazione della memoria a breve termine per le conversazioni e le risposte correlate al progetto. Vedere la tabella riportata di seguito per i modelli e le aree disponibili per la compattazione della memoria.
| Region | Codice area | Modello di memoria a breve termine |
|---|---|---|
| Brasile (Est) - San Paolo | sa-saopaulo-1 |
|
| Germania (Centro) - Francoforte | eu-frankfurt-1 |
|
| Regno Unito (Sud) - Londra | uk-london-1 |
|
| India (Sud) - Hyderabad | ap-hyderabad-1 |
|
| Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago) | us-ahsburn-1 (dall'area all'area us-chicago-1) |
|
| Giappone centrale (Osaka) | ap-osaka-1 |
|
| Arabia Saudita centrale (Riad) | me-riyadh-1 |
|
| Stati Uniti (Midwest) - Chicago | us-chicago-1 |
|
| Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago) | us-phoenix-1(da un'area all'altra a us-chicago-1) |
Per l'estrazione delle informazioni chiave per la memoria a lungo termine
cappello
Quando si crea un progetto, è possibile abilitare l'estrazione delle informazioni dalle conversazioni e dalle risposte per una funzione di memoria a lungo termine. Si seleziona un modello di estrazione che mira a estrarre le informazioni chiave dalle conversazioni. Vedere la tabella riportata di seguito per le aree e il modello supportati per l'estrazione delle informazioni chiave da utilizzare per la memoria a lungo termine.
| Region | Modello di estrazione disponibile |
|---|---|
| Available Commercial Region (OC1) come riferimento incrociato con le region che OpenAI gpt-oss-120b sono disponibili | OpenAI gpt-oss-120b |
Quando si crea un progetto, è possibile selezionare un modello di incorporamento per memorizzare le memorie estratte come vettori ricercabili. Il modello di incorporamento disponibile dipende dall'area del progetto. Vedere la tabella riportata di seguito per il modello di incorporamento disponibile in ogni area.
| Region | Codice area | Modello incorporamento disponibile |
|---|---|---|
| Brasile (Est) - San Paolo | sa-saopaulo-1 |
Incorporamento Cohere multilingue 3 (obsoleto) |
| Germania (Centro) - Francoforte | eu-frankfurt-1 |
Incorporamento Cohere multilingue 3 (obsoleto) |
| Regno Unito (Sud) - Londra | uk-london-1 |
Incorporamento Cohere multilingue 3 (obsoleto) |
| India (Sud) - Hyderabad | ap-hyderabad-1 |
Incorpora immagine multilingue 3 Cohere (obsoleto) |
| Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago) | us-ahsburn-1 |
Cohere Embed 4 |
| Giappone centrale (Osaka) | ap-osaka-1 |
Cohere Embed 4 |
| Arabia Saudita centrale (Riad) | me-riyadh-1 |
Cohere Embed 4 |
| Stati Uniti (Midwest) - Chicago | us-chicago-1 |
Cohere Embed 4 |
| Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago) | us-phoenix-1
|
Cohere Embed 4 |
Chiamate esterne
Chiamate esterne ai modelli xAI Grok
Chiamate esterne ai modelli xAI Grok
I modelli xAI Grok sono ospitati in un data center OCI, in una tenancy di cui è stato eseguito il provisioning per xAI. I modelli xAI Grok, a cui è possibile accedere tramite il servizio OCI Generative AI, sono gestiti da xAI.
Chiamate esterne ai modelli Google
Chiamate esterne a Google Gemini 2.5 Pro per le aree degli Stati Uniti
Il modello Google Gemini 2.5 Pro a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Google Gemini 2.5 Pro (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Google Gemini 2.5 Pro, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.
Chiamate esterne a Gemini 2.5 Flash per le aree degli Stati Uniti
Il modello Gemini 2.5 Flash a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.
Chiamate esterne a Gemini 2.5 Flash-Lite per le aree degli Stati Uniti
Il modello Gemini 2.5 Flash-Lite a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash-Lite (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash-Lite, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.