Variáveis do Ambiente de Implantação do Modelo
Ao criar um recurso de implantação de modelo, você pode fornecer variáveis de ambiente personalizadas como parte da configuração padrão. Essas variáveis de ambiente estão disponíveis para uso dentro do contêiner no runtime.
Formatar restrição
- A chave deve ter menos de 32 caracteres.
- A chave deve conter apenas letras, dígitos e sublinhado (_).
- A chave deve começar com uma letra.
- A chave deve ter pelo menos 2 caracteres.
- A chave não deve terminar com sublinhado. Por exemplo, TEST_.
- A chave, se adicionada, não pode ficar vazia. O valor pode estar vazio.
- O valor pode ser qualquer caractere.
- A chave não pode ser variáveis de ambiente fornecidas pelo serviço.
- Se as portas forem passadas como uma variável de ambiente, limite-as entre 1024 e 65535 e exclua também as portas 24224, 8446, 8447.
Restrição de tamanho
Os valores individuais não têm limites de tamanho específicos. As variáveis de ambiente gerais, incluindo pares de chave/valor, são limitadas a 2048 bytes. Se o tamanho for maior que 2048 bytes, especifique as variáveis de ambiente usando o artefato de modelo ou use o OCI Object Storage para extrair os dados.
Variáveis de Ambiente Fornecidas pelo Serviço
O serviço tem variáveis de ambiente reservadas dentro do contêiner no runtime para registro em log ou outro uso funcional. Essas variáveis de ambiente não podem ser substituídas.
Nome | Contêiner Personalizado | Contêiner Padrão |
---|---|---|
MODEL_DEPLOYMENT_OCID |
OCID do recurso de implantação de modelo. | OCID do recurso de implantação de modelo. |
MODEL_SERVING_PYTHON_VERSION |
Nenhum. | A versão do Python de runtime.yaml usada para serviço de modelo. |
TENANCY_OCID |
OCID da Tenancy. | OCID da Tenancy. |
CONTAINER_CUSTOM_IMAGE |
Caminho da imagem do contêiner (com tag ou compilação) fornecido por meio do objeto de configuração do ambiente de API. | Nenhum. |
Variáveis de Ambiente do Aplicativo
Essas variáveis de ambiente controlam funcionalmente como a implantação de modelo é criada e podem ser substituídas ou configuradas pelos clientes informando a configuração padrão.
Nome | Contêiner Personalizado | Contêiner Gerenciado |
---|---|---|
WEB_CONCURRENCY |
Com base na memória disponível e no tamanho do artefato de modelo, um método heurístico calcula o número de colaboradores necessários para execução dentro do contêiner personalizado. Os clientes também podem substituir a variável ou passar uma variável de simultaneidade personalizada conforme necessário. | Com base na memória disponível e no tamanho do artefato de modelo, um método heurístico calcula o número de colaboradores necessários para execução dentro do contêiner personalizado. Os clientes também podem substituir a variável ou passar uma variável de simultaneidade personalizada conforme necessário. |
CONTAINER_TYPE |
Tipo de contêiner viz TRITON. Somente TRITON é suportado. | Nenhum. |