Modelli e aree di intelligenza artificiale generativa per API Agentic
Questa pagina elenca il sottoinsieme di modelli e aree pre-addestrati supportati per le funzioni di autenticazione nell'AI generativa OCI.
Le caratteristiche Agentic includono:
- Inferenza autentica (chiamate chat runtime) utilizzata dagli agenti durante il runtime.
- Modelli di memoria di progetto utilizzati quando si aggiungono estrazione della memoria a lungo termine e compattazione della memoria a breve termine a un progetto di AI generativa OCI.
1. Modelli di inferenza Agentic (Runtime)
Modelli chat disponibili per gli agenti
Gli agenti possono chiamare i seguenti modelli di chat per casi d'uso di inferenza identici:
- Piattaforma AI Google Vertex
- OpenAI Open Source
- Piattaforma xAI
Regioni disponibili
È possibile accedere a modelli di inferenza identici in una o più delle seguenti aree OC1:
- America del Nord
-
- Stati Uniti (Est) - Ashburn
- Stati Uniti (Midwest) - Chicago
- Stati Uniti (Ovest) - Phoenix
- Sud America
-
- Brasile (Est) - San Paolo
- Europa (UE)
-
- Germania (Centro) - Francoforte
- Regno Unito (Sud) - Londra
- Medio Oriente (ME)
-
- Arabia Saudita centrale (Riad)
-
Nota
L'API Agentic non è disponibile negli Emirati Arabi Uniti (Est) (Dubai).
- Asia Pacifico (AP)
-
- India (Sud) - Hyderabad
- Giappone centrale (Osaka)
Non tutti i modelli sono disponibili in ogni area dell'elenco precedente. Per le aree supportate per modello e i dettagli di distribuzione, vedere la pagina Modelli per area.
Modelli di memoria progetto (impostazioni progetto)
Quando si crea un progetto e si abilitano le funzioni di memoria, si selezionano i modelli per:
- Compattazione della memoria a breve termine (compattazione della cronologia delle conversazioni)
- Estrazione della memoria a lungo termine (ha lo scopo di estrarre le informazioni chiave dalle conversazioni)
- Integrazioni della memoria a lungo termine (conserva le memorie estratte come vettori ricercabili)
2.1 Compattazione della memoria a breve termine (compattazione della cronologia di conversazione)
I progetti possono utilizzare i seguenti modelli per la compattazione della memoria a breve termine:
| Region | Codice area | Incorpora modello |
|---|---|---|
| Brasile (Est) - San Paolo | sa-saopaulo-1 |
|
| Germania (Centro) - Francoforte | eu-frankfurt-1 |
|
| Regno Unito (Sud) - Londra | uk-london-1 |
|
| India (Sud) - Hyderabad | ap-hyderabad-1 |
|
| Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago) | us-ahsburn-1 (dall'area all'area us-chicago-1) |
|
| Giappone centrale (Osaka) | ap-osaka-1 |
|
| Arabia Saudita centrale (Riad) | me-riyadh-1 |
|
| Stati Uniti (Midwest) - Chicago | us-chicago-1 |
|
| Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago) | us-phoenix-1(da un'area all'altra a us-chicago-1) |
|
2.2 Memoria a lungo termine
- Modello di estrazione (tutte le aree supportate)
- OpenAI gpt-oss-120b
- Modello di incorporamento
-
Il modello di incorporamento utilizzato per memorizzare le memorie estratte come vettori ricercabili dipende dall'area Progetto:
Region Codice area Incorpora modello Brasile (Est) - San Paolo sa-saopaulo-1Cohere Embed Multilingue 3 Germania (Centro) - Francoforte eu-frankfurt-1Cohere Embed Multilingue 3 Regno Unito (Sud) - Londra uk-london-1Cohere Embed Multilingue 3 India (Sud) - Hyderabad ap-hyderabad-1Cohere Embed Immagine multilingue 3 Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago) Vedere visite esterne
us-ahsburn-1(dall'area all'areaus-chicago-1)Cohere Embed 4 Giappone centrale (Osaka) ap-osaka-1Cohere Embed 4 Arabia Saudita centrale (Riad) me-riyadh-1Cohere Embed 4 Stati Uniti (Midwest) - Chicago us-chicago-1Cohere Embed 4 Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago) Vedere visite esterne
us-phoenix-1(dall'area all'areaus-chicago-1)Cohere Embed 4
Note e limiti noti
- UAE East (Dubai): l'API Agentic non è disponibile in quest'area.
- Disponibilità: le aree elencate per i modelli di inferenza identici in questa pagina indicano dove sono supportate le funzioni identiche. La disponibilità dei singoli modelli potrebbe comunque variare all'interno di tali aree.
Chiamate esterne ai modelli Google
Chiamate esterne a Google Gemini 2.5 Pro per le aree degli Stati Uniti
Il modello Google Gemini 2.5 Pro a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Google Gemini 2.5 Pro (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Google Gemini 2.5 Pro, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.
Chiamate esterne a Gemini 2.5 Flash per le aree degli Stati Uniti
Il modello Gemini 2.5 Flash a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.
Chiamate esterne a Gemini 2.5 Flash-Lite per le aree degli Stati Uniti
Il modello Gemini 2.5 Flash-Lite a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash-Lite (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash-Lite, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.