Modelli e aree di intelligenza artificiale generativa per API Agentic

Questa pagina elenca il sottoinsieme di modelli e aree pre-addestrati supportati per le funzioni di autenticazione nell'AI generativa OCI.

Le caratteristiche Agentic includono:

  • Inferenza autentica (chiamate chat runtime) utilizzata dagli agenti durante il runtime.
  • Modelli di memoria di progetto utilizzati quando si aggiungono estrazione della memoria a lungo termine e compattazione della memoria a breve termine a un progetto di AI generativa OCI.

1. Modelli di inferenza Agentic (Runtime)

Regioni disponibili

È possibile accedere a modelli di inferenza identici in una o più delle seguenti aree OC1:

America del Nord
  • Stati Uniti (Est) - Ashburn
  • Stati Uniti (Midwest) - Chicago
  • Stati Uniti (Ovest) - Phoenix
Sud America
  • Brasile (Est) - San Paolo
Europa (UE)
  • Germania (Centro) - Francoforte
  • Regno Unito (Sud) - Londra
Medio Oriente (ME)
  • Arabia Saudita centrale (Riad)
  • Nota

    L'API Agentic non è disponibile negli Emirati Arabi Uniti (Est) (Dubai).
Asia Pacifico (AP)
  • India (Sud) - Hyderabad
  • Giappone centrale (Osaka)
Importante

Non tutti i modelli sono disponibili in ogni area dell'elenco precedente. Per le aree supportate per modello e i dettagli di distribuzione, vedere la pagina Modelli per area.

Modelli di memoria progetto (impostazioni progetto)

Quando si crea un progetto e si abilitano le funzioni di memoria, si selezionano i modelli per:

  • Compattazione della memoria a breve termine (compattazione della cronologia delle conversazioni)
  • Estrazione della memoria a lungo termine (ha lo scopo di estrarre le informazioni chiave dalle conversazioni)
  • Integrazioni della memoria a lungo termine (conserva le memorie estratte come vettori ricercabili)

2.1 Compattazione della memoria a breve termine (compattazione della cronologia di conversazione)

I progetti possono utilizzare i seguenti modelli per la compattazione della memoria a breve termine:

Region Codice area Incorpora modello
Brasile (Est) - San Paolo sa-saopaulo-1
Metadati
OpenAI Open Source
Germania (Centro) - Francoforte eu-frankfurt-1
Piattaforma AI Google Vertex
Metadati
OpenAI Open Source
Regno Unito (Sud) - Londra uk-london-1
Piattaforma AI Google Vertex
Metadati
OpenAI Open Source
India (Sud) - Hyderabad ap-hyderabad-1
Piattaforma AI Google Vertex
Metadati
OpenAI Open Source
Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago) us-ahsburn-1 (dall'area all'area us-chicago-1)
Piattaforma AI Google Vertex
Metadati
OpenAI Open Source
Giappone centrale (Osaka) ap-osaka-1
Piattaforma AI Google Vertex
Metadati
OpenAI Open Source
Arabia Saudita centrale (Riad) me-riyadh-1
Metadati
OpenAI Open Source
Stati Uniti (Midwest) - Chicago us-chicago-1
Piattaforma AI Google Vertex
Metadati
OpenAI Open Source
Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago) us-phoenix-1(da un'area all'altra a us-chicago-1)
Piattaforma AI Google Vertex
Metadati
OpenAI Open Source

2.2 Memoria a lungo termine

Modello di estrazione (tutte le aree supportate)
OpenAI gpt-oss-120b
Modello di incorporamento

Il modello di incorporamento utilizzato per memorizzare le memorie estratte come vettori ricercabili dipende dall'area Progetto:

Region Codice area Incorpora modello
Brasile (Est) - San Paolo sa-saopaulo-1 Cohere Embed Multilingue 3
Germania (Centro) - Francoforte eu-frankfurt-1 Cohere Embed Multilingue 3
Regno Unito (Sud) - Londra uk-london-1 Cohere Embed Multilingue 3
India (Sud) - Hyderabad ap-hyderabad-1 Cohere Embed Immagine multilingue 3
Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago)

Vedere visite esterne

us-ahsburn-1 (dall'area all'area us-chicago-1) Cohere Embed 4
Giappone centrale (Osaka) ap-osaka-1 Cohere Embed 4
Arabia Saudita centrale (Riad) me-riyadh-1 Cohere Embed 4
Stati Uniti (Midwest) - Chicago us-chicago-1 Cohere Embed 4
Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago)

Vedere visite esterne

us-phoenix-1 (dall'area all'area us-chicago-1) Cohere Embed 4

Note e limiti noti

  • UAE East (Dubai): l'API Agentic non è disponibile in quest'area.
  • Disponibilità: le aree elencate per i modelli di inferenza identici in questa pagina indicano dove sono supportate le funzioni identiche. La disponibilità dei singoli modelli potrebbe comunque variare all'interno di tali aree.

Chiamate esterne ai modelli Google

Importante

Chiamate esterne a Google Gemini 2.5 Pro per le aree degli Stati Uniti

Il modello Google Gemini 2.5 Pro a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Google Gemini 2.5 Pro (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Google Gemini 2.5 Pro, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.

Importante

Chiamate esterne a Gemini 2.5 Flash per le aree degli Stati Uniti

Il modello Gemini 2.5 Flash a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.

Importante

Chiamate esterne a Gemini 2.5 Flash-Lite per le aree degli Stati Uniti

Il modello Gemini 2.5 Flash-Lite a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash-Lite (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash-Lite, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.