Despliegue de modelo
Siga estos pasos para desplegar modelos con acciones rápidas de IA.
Creación de despliegue de modelo
Puede crear un despliegue de modelo a partir de los modelos básicos con la etiqueta Listo para desplegar en el explorador de modelos o con modelos ajustados. Al crear un despliegue de modelo en acciones rápidas de IA, está creando un despliegue de modelo de OCI Data Science, que es un recurso gestionado en el servicio OCI Data Science. Puede desplegar el modelo como puntos finales HTTP en OCI.
Debe tener la política necesaria para utilizar el despliegue del modelo de Data Science. Puede seleccionar la unidad de computación para el despliegue del modelo. Puede configurar el registro para supervisar el despliegue del modelo. El registro es opcional, pero se recomienda encarecidamente que ayude a solucionar errores con el despliegue del modelo. Debe tener la política necesaria para activar el registro. Consulte Logs de despliegue de modelo para obtener más información sobre los logs. En la opción avanzada, puede seleccionar el número de instancias que desea desplegar y el ancho de banda del equilibrador de carga.
Consulte Despliegue de modelos en GitHub para obtener más información y consejos sobre el despliegue de modelos.
Para acceder a despliegues de modelo mediante puntos finales privados, cree una sesión de bloc de notas con el tipo de red definido en redes personalizadas. La salida personalizada debe residir en la misma VCN y subred que el recurso de punto final privado.
Puede desplegar modelos mediante tres opciones en la página Desplegar modelo:
- Desplegar un solo modelo: despliegue un modelo en una unidad de computación.
- Desplegar varios modelos: despliegue varios modelos en una única instancia informática.
- Desplegar pila de modelos: despliegue un modelo base y varias variantes ajustadas como una pila en una sola unidad de computación.
En esta sección, se describe cada opción de despliegue.
Para obtener una lista completa de parámetros y valores para los comandos de la CLI de acciones rápidas de AI, consulte AI Quick Actions CLI.
Esta tarea no se puede realizar con la API.
Invocar despliegue de modelo en acciones rápidas de IA
Puede llamar al despliegue de modelos en acciones rápidas de IA desde la CLI o el SDK de Python.
Para obtener más información, consulte la sección sobre consejos para el despliegue de modelos en GitHub.
Artefactos de modelos
Dónde encontrar artefactos de modelo.
Cuando se descarga un modelo en una instancia de despliegue de modelo, se descarga en la carpeta /opt/ds/model/deployed_model/<object_storage_folder_name_and_path> .
Uso de despliegues de modelo en Autonomous Database Select AI
Puede hacer que los despliegues de modelos creados con acciones rápidas de IA estén disponibles para consultas de lenguaje natural con Oracle Autonomous Database Select AI.
Requisitos previos
- Despliegue de modelos finalizado y OCID de despliegue de modelos.
- Instancia de Autonomous Database con la opción Select AI activada. Consulte Seleccionar IA con Autonomous Database.
- Permisos necesarios de Oracle Cloud Infrastructure (OCI) para crear credenciales y perfiles.
- En la instancia de Autonomous Database, cree una credencial para acceder al despliegue del modelo.
BEGIN DBMS_CLOUD.create_credential( credential_name => '<CREDENTIAL_NAME>', user_ocid => '<USER_OCID>', tenancy_ocid => '<TENANCY_OCID>', private_key => '<PRIVATE_KEY>', fingerprint => '<FINGERPRINT>' ); END; /Sustituya cada marcador de posición por valores específicos:
<CREDENTIAL_NAME>: nombre de la credencial<USER_OCID>: OCID de usuario de OCI<TENANCY_OCID>: OCID de arrendamiento de OCI<PRIVATE_KEY>: clave privada de API en formato PEM<FINGERPRINT>: huella de clave pública de API
Consulte Gestión de Credenciales para obtener más información.
- Cree un perfil Select AI para conectar la base de datos autónoma a su modelo desplegado.
BEGIN DBMS_CLOUD_AI.CREATE_PROFILE( profile_name => '<PROFILE_NAME>', attributes => ' { "credential_name": "<CREDENTIAL_NAME>", "model": "<MODEL_NAME>", "provider": "openai", "provider_endpoint": "<MODEL_DEPLOYMENT_OCID>", "conversation": "", "object_list": [ {"owner": "ADMIN", "name": "customers"} ] }' ); END; /Sustituya los marcadores de posición:<PROFILE_NAME>: nombre del perfil.<CREDENTIAL_NAME>: nombre de la credencial del paso 1.<MODEL_NAME>: nombre del modelo desplegado (por ejemplo,odsc_2025llm).<MODEL_DEPLOYMENT_OCID>: OCID de Despliegue de Modelo.- Actualice
"object_list"para reflejar el esquema y la tabla que desea exponer.