Modelli e aree di intelligenza artificiale generativa per gli agenti AI aziendali

Gli agenti AI aziendali nell'AI generativa OCI supportano un sottoinsieme di modelli e aree pre-addestrate dell'AI generativa OCI. In questa pagina sono elencati i modelli e le aree supportati per l'inferenza di runtime e la memoria del progetto.

Per chiamare i modelli

Nota

I seguenti modelli sono supportati per i endpoint compatibili con OCI OpenAI e gli strumenti compatibili con OpenAI.

Modelli chat disponibili

Gli agenti possono chiamare i seguenti modelli di chat per casi d'uso di inferenza identici:

Piattaforma AI Google Vertex

OpenAI Open Source

Piattaforma xAI

Importante

Chiamate esterne ai modelli xAI Grok

I modelli xAI Grok sono ospitati in un data center OCI, in una tenancy di cui è stato eseguito il provisioning per xAI. I modelli xAI Grok, a cui è possibile accedere tramite il servizio OCI Generative AI, sono gestiti da xAI.

Regioni commerciali disponibili (OC1)

È possibile accedere a modelli di inferenza agenti in una o più delle aree OC1 riportate di seguito.


Nome dell'area	Posizione	Identificativo dell'area	Chiave area
Brasile (Est) - San Paolo	San Paolo	`sa-saopaulo-1`	`GRU`
Germania (Centro) - Francoforte	Francoforte	`eu-frankfurt-1`	`FRA`
India (Sud) - Hyderabad	Hyderabad	`ap-hyderabad-1`	`HYD`
Giappone centrale (Osaka)	Osaka	`ap-osaka-1`	`KIX`
Arabia Saudita centrale (Riad)	Riyad	`me-riyadh-1`	`RUH`
Regno Unito (Sud) - Londra	Londra	`uk-london-1`	`LHR`
Stati Uniti (Est) - Ashburn	Ashburn	`us-ashburn-1`	`IAD`
Stati Uniti (Midwest) - Chicago	Chicago	`us-chicago-1`	`ORD`
Stati Uniti (Ovest) - Phoenix	Phoenix	`us-phoenix-1`	`PHX`

Informazioni su Aree e domini di disponibile.

Nota

UAE East (Dubai): gli endpoint e gli strumenti compatibili con OCI-OpenAI non sono disponibili in quest'area.
Disponibilità: non tutti i modelli elencati sono disponibili nelle aree elencate precedenti. Per le aree supportate per modello e i dettagli di distribuzione, vedere la pagina Modelli per area.
Chiamate esterne: per le note sui modelli con chiamate esterne, vedere Chiamate esterne.

Nota

I seguenti modelli sono supportati per gli strumenti xAI-Compatible utilizzati con l'API OCI Responses.

Modelli xAI supportati

Nota

I seguenti modelli xAI sono supportati per l'API Risposte OCI.

Aree supportate

È possibile accedere ai modelli xAI chiamando gli endpoint nelle seguenti aree OCI1:


Nome dell'area	Posizione	Identificativo dell'area	Chiave area
Stati Uniti (Est) - Ashburn	Ashburn	`us-ashburn-1`	`IAD`
Stati Uniti (Midwest) - Chicago	Chicago	`us-chicago-1`	`ORD`
Stati Uniti (Ovest) - Phoenix	Phoenix	`us-phoenix-1`	`PHX`

Importante

Chiamate esterne ai modelli xAI Grok

Per abilitare la memoria del progetto

Quando si crea un progetto, è possibile abilitare la compattazione della memoria a breve termine per le conversazioni e le risposte correlate al progetto. Vedere la tabella riportata di seguito per i modelli e le aree disponibili per la compattazione della memoria.


Region	Codice area	Modello di memoria a breve termine
Brasile (Est) - San Paolo	`sa-saopaulo-1`	Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
Germania (Centro) - Francoforte	`eu-frankfurt-1`	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
Regno Unito (Sud) - Londra	`uk-london-1`	Google Gemini 2.5 Flash Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
India (Sud) - Hyderabad	`ap-hyderabad-1`	Google Gemini 2.5 Flash Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago)	`us-ahsburn-1` (dall'area all'area `us-chicago-1`)	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 4 Maverick Meta Llama 4 Scout Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
Giappone centrale (Osaka)	`ap-osaka-1`	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
Arabia Saudita centrale (Riad)	`me-riyadh-1`	Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
Stati Uniti (Midwest) - Chicago	`us-chicago-1`	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 4 Maverick Meta Llama 4 Scout Meta Llama 3.3 (70B) OpenAI gpt-oss-120b
Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago)	`us-phoenix-1`(da un'area all'altra a `us-chicago-1`)	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 4 Maverick Meta Llama 4 Scout Meta Llama 3.3 (70B) OpenAI gpt-oss-120b

Per l'estrazione delle informazioni chiave per la memoria a lungo termine

cappello

Quando si crea un progetto, è possibile abilitare l'estrazione delle informazioni dalle conversazioni e dalle risposte per una funzione di memoria a lungo termine. Si seleziona un modello di estrazione che mira a estrarre le informazioni chiave dalle conversazioni. Vedere la tabella riportata di seguito per le aree e il modello supportati per l'estrazione delle informazioni chiave da utilizzare per la memoria a lungo termine.


Region	Modello di estrazione disponibile
Available Commercial Region (OC1) come riferimento incrociato con le region che OpenAI gpt-oss-120b sono disponibili	OpenAI gpt-oss-120b

Quando si crea un progetto, è possibile selezionare un modello di incorporamento per memorizzare le memorie estratte come vettori ricercabili. Il modello di incorporamento disponibile dipende dall'area del progetto. Vedere la tabella riportata di seguito per il modello di incorporamento disponibile in ogni area.


Region	Codice area	Modello incorporamento disponibile
Brasile (Est) - San Paolo	`sa-saopaulo-1`	Incorporamento Cohere multilingue 3 (obsoleto)
Germania (Centro) - Francoforte	`eu-frankfurt-1`	Incorporamento Cohere multilingue 3 (obsoleto)
Regno Unito (Sud) - Londra	`uk-london-1`	Incorporamento Cohere multilingue 3 (obsoleto)
India (Sud) - Hyderabad	`ap-hyderabad-1`	Incorpora immagine multilingue 3 Cohere (obsoleto)
Stati Uniti orientali (Ashburn) (dall'area al Midwest degli Stati Uniti (Chicago)	`us-ahsburn-1`	Cohere Embed 4
Giappone centrale (Osaka)	`ap-osaka-1`	Cohere Embed 4
Arabia Saudita centrale (Riad)	`me-riyadh-1`	Cohere Embed 4
Stati Uniti (Midwest) - Chicago	`us-chicago-1`	Cohere Embed 4
Stati Uniti occidentali (Phoenix) (dalla regione al Midwest degli Stati Uniti (Chicago)	`us-phoenix-1`	Cohere Embed 4

Chiamate esterne

Chiamate esterne ai modelli xAI Grok

Importante

Chiamate esterne ai modelli xAI Grok

Chiamate esterne ai modelli Google

Importante

Chiamate esterne a Google Gemini 2.5 Pro per le aree degli Stati Uniti

Il modello Google Gemini 2.5 Pro a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Google Gemini 2.5 Pro (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Google Gemini 2.5 Pro, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.

Importante

Chiamate esterne a Gemini 2.5 Flash per le aree degli Stati Uniti

Il modello Gemini 2.5 Flash a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.

Importante

Chiamate esterne a Gemini 2.5 Flash-Lite per le aree degli Stati Uniti

Il modello Gemini 2.5 Flash-Lite a cui è possibile accedere tramite il servizio OCI Generative AI nelle aree degli Stati Uniti è ospitato esternamente da Google. Pertanto, una chiamata a un modello Gemini 2.5 Flash-Lite (tramite il servizio OCI Generative AI) determina una chiamata a una posizione Google. Per Gemini 2.5 Flash-Lite, viene utilizzata una posizione regionale di Google Americas, che indirizza la richiesta solo a una posizione di Google Americas. L'elaborazione del machine learning si svolge all'interno di una sede di Google Americas.

Documentazione dell'infrastruttura Oracle Cloud

Modelli e aree di intelligenza artificiale generativa per gli agenti AI aziendali

Per chiamare i modelli

Modelli chat disponibili

Regioni commerciali disponibili (OC1)

Modelli xAI supportati

Aree supportate

Per abilitare la memoria del progetto

Per l'estrazione delle informazioni chiave per la memoria a lungo termine

Chiamate esterne

Chiamate esterne ai modelli xAI Grok

Chiamate esterne ai modelli Google