Distribuzione modello
Attenersi alla procedura riportata di seguito per distribuire i modelli con le azioni rapide AI.
Creazione distribuzione modello
È possibile creare una distribuzione modello dai modelli di base con il tag Pronto per la distribuzione in Esplora modelli o con modelli ottimizzati. Quando crei una distribuzione modello nelle azioni rapide AI, stai creando una distribuzione modello di OCI Data Science, che è una risorsa gestita nel servizio OCI Data Science. È possibile distribuire il modello come endpoint HTTP in OCI.
È necessario disporre dei criteri necessari per utilizzare la distribuzione del modello di Data Science. È possibile selezionare la forma di computazione per la distribuzione del modello. È possibile impostare la registrazione per monitorare la distribuzione del modello. Il log è facoltativo, ma si consiglia di risolvere gli errori con la distribuzione del modello. È necessario disporre del criterio necessario per abilitare il log. Per ulteriori informazioni sui log, vedere Log di distribuzione modello. Nell'opzione avanzata, puoi selezionare il numero di istanze da distribuire e la larghezza di banda del load balancer.
Per ulteriori informazioni e suggerimenti sulla distribuzione dei modelli, vedere Distribuzione dei modelli sul sito GitHub.
Per accedere alle distribuzioni dei modelli utilizzando gli endpoint privati, creare una sessione notebook con il tipo di rete impostato su Networking personalizzato. L'uscita personalizzata deve risiedere nella stessa VCN e subnet della risorsa endpoint privato.
È possibile distribuire i modelli utilizzando tre opzioni nella pagina Distribuisci modello:
- Distribuisci modello singolo: distribuisci un modello in una forma di computazione.
- Distribuisci più modelli: distribuisci più modelli su una singola istanza di computazione.
- Distribuisci stack di modelli: distribuisci un modello di base e più varianti ottimizzate come stack su una singola forma di computazione.
Questa sezione descrive ogni opzione di distribuzione.
Per un elenco completo dei parametri e dei valori per i comandi CLI delle azioni rapide AI, vedere CLI Azioni rapide AI.
Impossibile eseguire questo task utilizzando l'API.
Richiama distribuzione modello in azioni rapide AI
Puoi richiamare la distribuzione dei modelli in Azioni rapide AI dall'SDK CLI o Python.
Per ulteriori informazioni, vedere la sezione Suggerimenti per la distribuzione dei modelli in GitHub.
Artifact modello
Dove trovare gli artifact del modello.
Quando un modello viene scaricato in un'istanza di distribuzione modello, viene scaricato nella cartella /opt/ds/model/deployed_model/<object_storage_folder_name_and_path> .
Uso delle distribuzioni dei modelli in Autonomous Database Select AI
Puoi rendere disponibili le distribuzioni dei modelli create con AI Quick Actions per l'esecuzione di query in linguaggio naturale con Oracle Autonomous Database Select AI.
Requisiti indispensabili
- Distribuzione del modello completata e OCID distribuzione modello.
- Istanza di Autonomous Database con Select AI abilitata. Vedere Seleziona l'AI con Autonomous Database.
- Autorizzazioni Oracle Cloud Infrastructure (OCI) necessarie per creare credenziali e profili.
- In Autonomous Database, creare una credenziale per accedere alla distribuzione del modello.
BEGIN DBMS_CLOUD.create_credential( credential_name => '<CREDENTIAL_NAME>', user_ocid => '<USER_OCID>', tenancy_ocid => '<TENANCY_OCID>', private_key => '<PRIVATE_KEY>', fingerprint => '<FINGERPRINT>' ); END; /Sostituire ogni segnaposto con valori specifici:
<CREDENTIAL_NAME>: nome della credenziale<USER_OCID>: OCID utente OCI<TENANCY_OCID>: OCID tenancy OCI<PRIVATE_KEY>: chiave privata API in formato PEM<FINGERPRINT>: impronta della chiave pubblica API
Per informazioni dettagliate, vedere Gestione delle credenziali.
- Creare un profilo Select AI per connettere il database autonomo al modello distribuito.
BEGIN DBMS_CLOUD_AI.CREATE_PROFILE( profile_name => '<PROFILE_NAME>', attributes => ' { "credential_name": "<CREDENTIAL_NAME>", "model": "<MODEL_NAME>", "provider": "openai", "provider_endpoint": "<MODEL_DEPLOYMENT_OCID>", "conversation": "", "object_list": [ {"owner": "ADMIN", "name": "customers"} ] }' ); END; /Sostituire i segnaposto:<PROFILE_NAME>: nome del profilo.<CREDENTIAL_NAME>: nome della credenziale dal passo 1.<MODEL_NAME>: nome del modello distribuito (ad esempio,odsc_2025llm).<MODEL_DEPLOYMENT_OCID>: OCID di distribuzione modello.- Aggiornare
"object_list"per riflettere lo schema e la tabella che si desidera esporre.