xAI Grok Code Fast 1 (Beta)
Pre-General Availability: 2025-09-12
Esta documentação está em um status de Pré-disponibilidade Geral (Pré-GA) e destina-se somente a fins de demonstração e uso preliminar. O documento pode não ser específico para o equipamento ("hardware") no qual você está usando o programa de computador ("software"). A Oracle Corporation e suas empresas afiliadas não fornecem quaisquer garantias relacionadas à documentação e estão isentas de qualquer responsabilidade decorrente de perdas, despesas ou danos incorridos no uso desta documentação.
Esta documentação não é um compromisso da Oracle em entregar qualquer material, código, funcionalidade ou serviços. Esta documentação e os programas e serviços Pré-GA da Oracle estão sujeitos a alterações a qualquer momento sem aviso prévio e, portanto, não devem ser considerados na tomada de decisões de compra. O desenvolvimento, a liberação e a data de disponibilidade de quaisquer recursos ou funcionalidades para programas e serviços Pré-GA da Oracle são de critério exclusivo da Oracle. Todas as datas de lançamento ou outras previsões de eventos futuros estão sujeitas a alterações. A disponibilidade futura de qualquer programa ou serviço futuro da Oracle não deverá ser considerada na celebração de qualquer contrato de licença ou de serviço com a Oracle.
Consulte Avisos Legais da Oracle.
O modelo xAI Grok Code Fast 1 é um modelo de IA focado em codificação que se destaca em tarefas comuns de codificação de alto volume, como depuração e edição, e foi projetado especificamente para fluxos de trabalho de codificação agênticos. Com sua velocidade, eficiência e baixo custo, este modelo é versátil em toda a pilha de desenvolvimento de software e proficiente em TypeScript, Python, Java, Rust, C++ e Go. Use esse modelo para criar projetos de zero a um, responder a perguntas da base de código, executar correções de bugs e codificação ágil.
Disponível nestas regiões
- Leste dos EUA (Ashburn) (somente sob demanda)
- Centro-Oeste dos EUA (Chicago) (somente sob demanda)
- Oeste dos EUA (Phoenix) (somente sob demanda)
Chamadas Externas
Os modelos xAI Grok são hospedados em um data center da OCI, em uma tenancy provisionada para xAI. Os modelos xAI Grok, que podem ser acessados por meio do serviço OCI Generative AI, são gerenciados pelo xAI.
Principais Recursos
- Nome do modelo na OCI Generative AI:
xai.grok-code-fast-1
- Disponível sob Demanda: Acesse esse modelo sob demanda, por meio do playground da Console ou da API.
- Somente Modo de Texto: Informe a entrada de texto e obtenha a saída de texto. Imagens e entradas de arquivos, como arquivos de áudio, vídeo e documento, não são suportadas.
- Conhecimento: Tem um profundo conhecimento em finanças, assistência médica, direito e ciência.
- Tamanho do Contexto: 256.000 tokens (o tamanho máximo do prompt + da resposta é de 256.000 tokens para cada execução). No playground, o comprimento da resposta é limitado a 16.000 tokens para cada execução.
- Excels Nestes Casos de Uso: Codificação ágil
- Chamada de Função: Sim, por meio da API.
- Saídas Estruturadas: Sim.
- Tem Motivo: Não.
- Limite de Conhecimento: Nenhuma data limite conhecida
Para obter detalhes sobre os principais recursos, consulte a documentação do Grok Code Fast 1 e o cartão de modelo.
Modo sob Demanda
Você pode alcançar os modelos básicos pré-treinados no serviço Generative AI por meio de dois modos: sob demanda e dedicado.
Os modelos Grok só estão disponíveis no modo sob demanda.
Veja a seguir os principais recursos do modo sob demanda:
-
Você paga conforme usa para cada chamada de inferência quando usa os modelos no playground ou quando chama os modelos por meio da API.
- Baixa barreira para começar a usar IA generativa.
- Ótimo para experimentação, prova de conceito e avaliação de modelo.
- Disponível para os modelos pré-treinados em regiões não listadas como (somente cluster de IA dedicado).
Nome do Modelo | Nome do Modelo do OCI | Obtendo Acesso |
---|---|---|
xAI Grok Code Fast 1 (Beta) | xai.grok-code-fast-1 |
Contact Oracle Beta Programs |
Data de Liberação
Modelo | Data de Liberação da Disponibilidade Geral | Data de Aposentadoria Sob Demanda | Data de Baixa do Modo Dedicado |
---|---|---|---|
xai.grok-code-fast-1 |
2,025-9-12 | Provisório | Este modelo não está disponível para o modo dedicado. |
Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.
Parâmetros de Modelo
Para alterar as respostas do modelo, você pode alterar os valores dos parâmetros a seguir no playground ou na API.
- Máximo de tokens de saída
-
O número máximo de tokens que você deseja que o modelo gere para cada resposta. Estime quatro caracteres por token. Como você está solicitando um modelo de chat, a resposta depende do prompt e cada resposta não necessariamente usa o máximo de tokens alocados. O comprimento máximo de prompt + saída é de 256.000 tokens para cada execução.
Dica
Para entradas grandes com problemas difíceis, defina um valor alto para o parâmetro de tokens de saída máxima. - Temperatura
-
O nível de aleatoriedade usado para gerar o texto de saída. Mín.: 0, Máx.: 2
Dica
Comece com a temperatura definida como 0 ou menos de um e aumente a temperatura conforme você gera novamente os prompts para uma saída mais criativa. As altas temperaturas podem introduzir alucinações e informações factualmente incorretas. - Top p
-
Um método de amostragem que controla a probabilidade cumulativa dos principais tokens a serem considerados para o próximo token. Atribua a
p
um número decimal entre 0 e 1 para a probabilidade. Por exemplo, insira 0,75 para os 75% principais a serem considerados. Definap
como 1 para considerar todos os tokens.