Informazioni sull'integrazione dei modelli nell'AI generativa

I modelli di incorporamento dell'AI generativa OCI trasformano ogni frase, frase o paragrafo immesso in un array con 384 (modelli leggeri) o 1024 numeri, a seconda del modello di incorporamento selezionato.

È possibile utilizzare queste incorporazioni per trovare la somiglianza in frasi simili nel contesto o nella categoria. Gli embeddings sono in genere memorizzati in un database vettoriale. Gli embeddings sono per lo più utilizzati per ricerche semantiche in cui la funzione di ricerca si concentra sul significato del testo che sta cercando piuttosto che trovare risultati basati su parole chiave.

Scelta di un modello
  • Utilizzare i modelli Cohere Embed English per generare incorporazioni di testo da documenti inglesi.
  • Utilizzare i modelli multilingue Cohere Embed quando:
Crea incorporamenti da un'immagine
Per i modelli incorporati di testo e immagine, ad esempio Cohere Embed English Image V3, è possibile aggiungere testo o aggiungere solo un'immagine. Per l'immagine, è possibile utilizzare l'API. Input immagine non disponibile nella console. Per l'API, inserire un'immagine con codifica base64 in ogni esecuzione. Ad esempio, un'immagine 512 x 512 viene convertita in circa 1.610 token.
Dimensioni input
  • È possibile aggiungere frasi, frasi o paragrafi per incorporare una frase alla volta o caricando un file.
  • Sono consentiti solo file con estensione .txt.
  • Se si utilizza un file di input, ogni frase, frase o paragrafo di input nel file deve essere separato da un carattere di nuova riga.
  • Sono consentiti al massimo 96 input per ogni esecuzione.
  • Nella console, ogni input deve essere inferiore a 512 token per i modelli di solo testo.
  • Se un input è troppo lungo, selezionare se interrompere l'inizio o la fine del testo per rientrare nel limite del token impostando il parametro Truncate su Start o End. Se un input supera il limite di 512 token e il parametro Truncate è impostato su Nessuno, viene visualizzato un messaggio di errore.
  • Per i modelli di testo e immagine, è possibile disporre di file e input che sommano tutti fino a 128.000 token.
Visualizzazione degli embeddings

Per visualizzare gli output con incorporamenti, i vettori di output vengono proiettati in due dimensioni e rappresentati come punti nella console di Oracle Cloud. I punti che sono vicini insieme corrispondono a frasi che il modello considera simili. Selezionare Esporta output per ottenere un array di vettori 1024 per ogni incorporamento salvato in un file JSON.

Casi d'uso

I seguenti casi d'uso sono ideali per incorporazioni di testo.

  • Ricerca semantica: consente di eseguire ricerche nelle trascrizioni delle chiamate, nelle origini knowledge interne e così via.

  • Classificazione del testo: consente di classificare l'intento nei log di chat dei clienti e nei ticket di supporto.
  • Clustering di testo: identifica gli argomenti salienti nelle recensioni dei clienti o nei nuovi dati.
  • Sistemi di raccomandazione: rappresentano le descrizioni dei podcast, ad esempio come funzione numerica da utilizzare in un modello di raccomandazione.

Integrazione parametro modello

Quando si utilizzano i modelli di incorporamento, è possibile ottenere un output diverso modificando il parametro seguente.

Tronca

Indica se troncare i token di inizio o di fine in una frase, quando tale frase supera il numero massimo di token consentiti. Ad esempio, una frase ha 516 token, ma la dimensione massima del token è 512. Se si sceglie di troncare la fine, gli ultimi 4 token di quella frase vengono tagliati.