Distribuzione modello
Attenersi alla procedura riportata di seguito per distribuire i modelli con le azioni rapide AI.
Creazione distribuzione modello
È possibile creare una distribuzione modello dai modelli di base con il tag Pronto per la distribuzione in Esplora modelli o con modelli con ottimizzazione. Quando crei una distribuzione di modelli in Azioni rapide AI, stai creando una distribuzione di modelli di OCI Data Science, una risorsa gestita nel servizio OCI Data Science. Puoi distribuire il modello come endpoint HTTP in OCI.
È necessario disporre dei criteri necessari per utilizzare la distribuzione del modello di Data Science. È possibile selezionare la forma di computazione per la distribuzione del modello. È possibile impostare il log per monitorare la distribuzione del modello. La registrazione è facoltativa, ma si consiglia di facilitare la risoluzione degli errori con la distribuzione del modello. Per abilitare il log, è necessario disporre del criterio necessario. Per ulteriori informazioni sui log, vedere Log di distribuzione dei modelli. Sotto l'opzione avanzata, puoi selezionare il numero di istanze da distribuire e la larghezza di banda del load balancer.
Per ulteriori informazioni e suggerimenti sulla distribuzione dei modelli, vedere Distribuzione dei modelli sul sito GitHub.
Per un elenco completo dei parametri e dei valori per i comandi CLI delle azioni rapide AI, vedere CLI Azioni rapide AI.
Impossibile eseguire questo task utilizzando l'API.
Richiama distribuzione modello in azioni rapide AI
Puoi richiamare la distribuzione dei modelli in Azioni rapide AI dall'SDK CLI o Python.
Per ulteriori informazioni, vedere la sezione Suggerimenti per la distribuzione dei modelli in GitHub.
Artifact modello
Dove trovare gli artifact del modello.
Quando un modello viene scaricato in un'istanza di distribuzione modello, viene scaricato nella cartella /opt/ds/model/deployed_model/<object_storage_folder_name_and_path>
.