Seleziona concetti AI

Esplora i concetti e i termini relativi a Select AI.

Azioni

Un'azione in Select AI è una parola chiave che indica a Select AI di eseguire un comportamento diverso quando si agisce sul prompt. Specificando un'azione, gli utenti possono indicare a Select AI di elaborare il prompt del linguaggio naturale per generare codice SQL, rispondere a un prompt chat, narrare l'output, visualizzare l'istruzione SQL o spiegare il codice SQL, utilizzando gli LLM per interagire in modo efficiente con i dati all'interno del loro ambiente di database.

Per informazioni sulle azioni di selezione AI supportate, vedere Usa parola chiave AI per immettere i prompt.

Profilo AI

Un profilo AI è una specifica che include il provider AI da utilizzare e altri dettagli relativi AI metadati e agli oggetti di database necessari per generare risposte AI prompt in linguaggio naturale. Vedere CREATE_PROFILE Procedure e Attributi profilo.

Provider AI

Un provider AI in Select AI si riferisce al provider di servizi che fornisce l'LLM o il trasformatore o entrambi per l'elaborazione e la generazione di risposte AI prompt in linguaggio naturale. Questi provider offrono modelli in grado di interpretare e convertire il linguaggio naturale per i casi d'uso evidenziati nel concetto LLM. Consulta la sezione Seleziona il provider AI e gli LLM per i provider supportati.

Conversazioni

Le conversazioni in Select AI rappresentano uno scambio interattivo tra l'utente e il sistema, consentendo agli utenti di eseguire query o interagire con il database tramite una serie di prompt in linguaggio naturale. Select AI incorpora fino a 10 prompt precedenti nella richiesta corrente tramite conversazioni basate su sessione, creando un prompt aumentato inviato all'LLM. Select AI supporta più conversazioni personalizzabili che possono essere configurate tramite API di conversazione dal package DBMS_CLOUD_AI. Vedere Seleziona conversazioni AI.

Credenziali database

Le credenziali del database sono credenziali di autenticazione utilizzate per accedere e interagire con i database. In genere sono costituiti da un nome utente e una password, a volte integrati da fattori di autenticazione aggiuntivi come i token di sicurezza. Queste credenziali vengono utilizzate per stabilire una connessione sicura tra un'applicazione o un utente e un database, in modo che solo individui o sistemi autorizzati possano accedere e manipolare i dati memorizzati nel database.

Allucinazione in LLM

L'allucinazione nel contesto dei modelli linguistici di grandi dimensioni si riferisce a un fenomeno in cui il modello genera testo non corretto, privo di senso o non correlato al prompt di input. Nonostante sia il risultato del tentativo del modello di generare testo coerente, queste risposte possono contenere informazioni fabbricate, fuorvianti o puramente immaginative. L'allucinazione può verificarsi a causa di pregiudizi nei dati di addestramento, mancanza di una corretta comprensione del contesto o limitazioni nel processo di addestramento del modello.

IAM

Oracle Cloud Infrastructure Identity and Access Management (IAM) ti consente di controllare l'accesso alle tue risorse cloud. È possibile controllare il tipo di accesso di un gruppo di utenti e a quali risorse specifiche. Per ulteriori informazioni, vedere Panoramica di Identity and Access Management.

Perfezionamento iterativo

La raffinatezza iterativa è un processo di miglioramento graduale di una soluzione o di un modello attraverso cicli ripetuti di aggiustamenti basati sul feedback o sulla valutazione. Inizia con un'approssimazione iniziale, la perfeziona passo dopo passo e continua fino a raggiungere l'accuratezza o il risultato desiderato. Ogni iterazione si basa sulla precedente, incorporando correzioni o ottimizzazioni per avvicinarsi all'obiettivo.

Nella generazione del sintetico di testo, la ridefinizione iterativa può essere utile per l'elaborazione di file o documenti di grandi dimensioni. Il processo divide il testo in blocchi di dimensioni gestibili, ad esempio, che rientrano nei limiti di token di un LLM, genera un riepilogo per un chunk e quindi migliora il riepilogo incorporando sequenzialmente i chunk seguenti.

Casi d'uso per il perfezionamento iterativo:

  • Ideale per situazioni in cui l'accuratezza e la coerenza contestuali sono fondamentali, ad esempio quando si riassumono testi complessi o altamente interconnessi in cui ogni parte si basa sul precedente.
  • Ideale per attività su scala ridotta in cui l'elaborazione sequenziale è accettabile.

Vedere Tecniche di riepilogo.

Modello linguistica di grandi dimensioni (LLM)

Un Large Language Model (LLM) si riferisce a un tipo avanzato di modello di intelligenza artificiale addestrato su enormi quantità di dati di testo per supportare una serie di casi d'uso a seconda dei dati di addestramento. Ciò include la comprensione e la generazione di un linguaggio simile a quello umano, nonché il codice software e le query di database. Questi modelli sono in grado di eseguire una vasta gamma di attività di elaborazione del linguaggio naturale, tra cui la generazione di testo, la traduzione, il riepilogo, la risposta alle domande, l'analisi del sentiment e altro ancora. Gli LLM si basano in genere su sofisticati modelli di rete neurale di deep learning che apprendono modelli, contesto e semantica dai dati di input, consentendo loro di generare testo coerente e contestualmente pertinente.

MapReduce

In generale, il modello di programmazione MapReduce consente l'elaborazione di dati di grandi volumi dividendo le attività in due fasi: Mappa e Riduci.
  • Mappa: elabora i dati di input e li trasforma in coppie chiave-valore.
  • Riduci: aggrega e riepiloga i dati mappati in base alle chiavi. MapReduce esegue l'elaborazione parallela di set di dati di grandi dimensioni.

Nel caso di Select AI Summarize, MapReduce suddivide il testo in più chunk e li elabora in parallelo e in modo indipendente, generando singoli riepiloghi per ogni chunk. Questi riassunti vengono poi combinati per formare un riassunto complessivo coerente.

Casi d'uso per la riduzione della mappa:

  • Ideale per attività parallele su larga scala in cui velocità e scalabilità sono priorità, come il riepilogo di set di dati o documenti molto grandi.
  • Ideale per le situazioni in cui l'indipendenza del pezzo è accettabile e i riepiloghi possono essere aggregati in seguito.

Vedere Tecniche di riepilogo.

Metadati

I metadati del database si riferiscono ai dati che descrivono la struttura, l'organizzazione e le proprietà delle tabelle e delle viste del database.

Copia di metadati

Una copia dei metadati o una copia di Autonomous Database crea una copia di metadati che definiscono il database o lo schema, contenenti solo la struttura, non i dati effettivi. Questa copia include tabelle, indici, viste, statistiche, procedure e trigger senza righe di dati. Gli sviluppatori, i tester o coloro che creano modelli di database lo trovano utile. Per ulteriori informazioni, vedere Duplica, sposta o aggiorna un'istanza di Autonomous Database.

Prompt linguaggio naturale

I prompt del linguaggio naturale sono istruzioni o richieste leggibili dall'utente fornite per guidare i modelli di intelligenza artificiale generativa, come i modelli di linguaggio di grandi dimensioni. Invece di utilizzare linguaggi o comandi di programmazione specifici, gli utenti possono interagire con questi modelli inserendo prompt in una forma più conversazionale o in linguaggio naturale. I modelli generano quindi l'output in base al prompt fornito.

Lista di controllo dell'accesso (ACL)

Una lista di controllo dell'accesso di rete è un set di regole o autorizzazioni che definiscono quale traffico di rete è consentito passare attraverso un dispositivo di rete, ad esempio un router, un firewall o un gateway. Le ACL vengono utilizzate per controllare e filtrare il traffico in entrata e in uscita in base a vari criteri, ad esempio indirizzi IP, numeri di porta e protocolli. Svolgono un ruolo cruciale nella sicurezza della rete consentendo agli amministratori di gestire e limitare il traffico di rete per prevenire accessi non autorizzati, potenziali attacchi e violazioni dei dati.

Retrieval-augmented generation (RAG)

Retrieval Augmented Generation (RAG) è una tecnica che prevede il recupero di informazioni rilevanti per la query di un utente e la fornitura di tali informazioni a un modello linguistico di grandi dimensioni (LLM, large language model) per migliorare le risposte e ridurre l'allucinazione.

Più comunemente, la RAG prevede la ricerca vettoriale, ma più in generale include l'aumento di un prompt del contenuto del database (manualmente o automaticamente), come i metadati dello schema per la generazione SQL o il contenuto del database sottoposto a query esplicite. Altre forme di aumento possono coinvolgere tecnologie come l'analisi dei grafici e il machine learning tradizionale.

Ricerca somiglianza semantica

La ricerca di somiglianza semantica identifica e recupera i datapoint che corrispondono strettamente a una determinata query confrontando i vettori di funzioni in una memoria di vettore.

Distanza vettoriale

La distanza vettoriale misura la somiglianza o la dissimilanza tra vettori di feature calcolando la distanza tra loro in uno spazio multidimensionale.

Indice vettore

Un indice vettoriale organizza e memorizza i vettori per consentire una ricerca e un recupero efficienti della somiglianza dei dati correlati.

Area di memorizzazione vettore

Una memoria di vettore include sistemi che memorizzano, gestiscono e abilitano la ricerca di somiglianza semantica che coinvolge incorporamenti di vettori. Ciò include database vettoriali standalone e Oracle Database 23ai AI Vector Search.