Creación de incrustaciones de texto en IA generativa
Use los modelos embebidos de Cohere en OCI Generative AI para convertir texto en incrustaciones vectoriales para usar en aplicaciones para búsquedas semánticas, clasificación de texto o agrupación de clusters de texto.
Los datos de entrada para incrustaciones de texto deben tener los siguientes requisitos:
- Puede agregar frases, frases o párrafos para incrustar una frase a la vez o cargando un archivo.
- Solo se permiten los archivos con extensión
.txt
. - Si utiliza un archivo de entrada, cada frase, frase o párrafo de entrada del archivo debe estar separado por un carácter de nueva línea.
- Se permiten un máximo de 96 entradas para cada ejecución.
- En la consola, cada entrada debe tener menos de 512 tokens para los modelos de solo texto.
- Si una entrada es demasiado larga, seleccione si desea cortar el inicio o el final del texto para que se ajuste al límite de token mediante la definición del parámetro Truncar en Iniciar o Fin. Si una entrada supera el límite de token 512 y el parámetro Truncar se define en Ninguno, aparece un mensaje de error.
- Para los modelos de texto e imagen, puede tener archivos e entradas que suman hasta 128.000 tokens.
- Para los modelos de incrustación de texto e imagen, como Cohere Embed English Image V3, puede agregar texto o agregar solo una imagen. Para la imagen, puede utilizar API. La entrada de imagen no está disponible en la consola. Para API, introduzca una imagen codificada base64 en cada ejecución. Por ejemplo, una imagen de 512 x 512 se convierte en aproximadamente 1.610 tokens.
Para crear incrustaciones de texto, utilice la operación embed-text-result.
Introduzca el siguiente comando para obtener una lista de opciones para crear incrustaciones de texto.
oci generative-ai-inference embed-text-result embed-text -h
Para obtener una lista completa de parámetros y valores para los comandos de la CLI de OCI Generative AI, consulte CLI de inferencia de IA generativa y CLI de gestión de IA generativa.
Ejecute la operación EmbedText para crear incrustaciones de texto.
Para obtener más información sobre el uso de la API y la firma de solicitudes, consulte la documentación de la API de REST y Credenciales de seguridad. Para obtener información sobre los SDK, consulte Los SDK y la CLI.