Implementa Oracle Cloud Infrastructure Generative AI basato su Cohere Large Language Model

Oracle Cloud Infrastructure Generative AI (OCI Generative AI) è un servizio completamente gestito che fornisce un set di modelli di linguaggio di grandi dimensioni (LLM) all'avanguardia e personalizzabili che coprono una vasta gamma di casi d'uso per la generazione del testo. Puoi utilizzare il parco giochi, un'interfaccia nella console per esplorare i modelli pre-addestrati e personalizzati ospitati senza scrivere una singola riga di codice o creare e ospitare i tuoi modelli personalizzati ottimizzati in base ai tuoi dati su cluster AI dedicati.

Il servizio AI generativa OCI include i seguenti modelli di base:
  • Generazione: fornire istruzioni per generare testo o estrarre informazioni dal testo.
  • Riepilogo: riepilogare il testo con il formato, la lunghezza e il tono indicati.
  • Integrazione: consente di convertire il testo in incorporazioni vettoriali da utilizzare nelle applicazioni per le ricerche semantiche, la classificazione del testo o la configurazione cluster del testo.

Architettura

È possibile utilizzare il parco giochi AI generativa OCI per provare modelli pre-addestrati, eseguire i prompt, regolare i parametri, aggiornare i prompt ed eseguire di nuovo i modelli finché non si è soddisfatti dei risultati. Successivamente è possibile copiare il codice dalla console nelle applicazioni.

Puoi anche creare una copia di un modello pre-addestrato, aggiungere il tuo data set di addestramento e consentire al servizio OCI Generative AI di perfezionare il modello. OCI Generative AI utilizza potenti cluster AI dedicati con dimensioni speciali per il tuning. Questi cluster appartengono solo alla tenancy. Dopo che il modello è stato ottimizzato, creiamo un endpoint per il modello personalizzato e lo ospitiamo su un cluster AI dedicato progettato per l'hosting.

Vantaggi della creazione di un LLM su OCI

Servizio di AI generativa: Oracle offre servizi nativi di AI generativa in collaborazione con Cohere, una piattaforma AI aziendale leader di settore dotata di comprensione avanzata del linguaggio per la creazione di applicazioni aziendali di nuova generazione. OCI Generative AI è un servizio completamente gestito disponibile tramite un'API per integrare perfettamente questi versatili modelli linguistici in una vasta gamma di casi d'uso, tra cui assistenza alla scrittura, riepilogo e chat.

Cluster AI dedicati: i cluster AI dedicati sono risorse di computazione che è possibile utilizzare per ottimizzare i modelli personalizzati o per ospitare gli endpoint per i modelli personalizzati. I cluster sono dedicati ai modelli e non vengono condivisi con gli utenti di altre tenancy. L'AI generativa OCI del modello personalizzato consente di perfezionare i modelli utilizzando i propri dati.

Modello personalizzato: l'AI generativa OCI consente di perfezionare i modelli utilizzando i propri dati.

Nota

La nuova funzione di ricerca della somiglianza dei vettori AI è disponibile in Oracle Database 23ai.
In questa impostazione dell'architettura di riferimento, viene eseguito il provisioning dei seguenti servizi OCI:
  • Storage degli oggetti OCI per lo storage dei dati.
  • Area di lavoro Oracle Cloud Infrastructure Data Science per la creazione di modelli.
  • AI generativa OCI con GPU per la computazione.
  • Strumento Oracle APEX Application Development per l'interfaccia utente.

Il seguente diagramma illustra questa architettura di riferimento.



oci-generative-ai-llm-arch-oracle.zip

L'architettura presenta i seguenti componenti:

  • Area

    Un'area geografica Oracle Cloud Infrastructure è un'area geografica localizzata che contiene uno o più data center, denominati domini di disponibilità. Le regioni sono indipendenti da altre regioni e grandi distanze possono separarle (tra paesi o addirittura continenti).

  • Rete cloud virtuale (VCN) e subnet

    Una VCN è una rete personalizzabile e definita dal software configurata in un'area Oracle Cloud Infrastructure. Come le tradizionali reti di data center, le reti VCN consentono di controllare l'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che è possibile modificare dopo aver creato la VCN. Puoi segmentare una VCN in subnet, che possono essere definite in un'area o in un dominio di disponibilità. Ogni subnet è costituita da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. È possibile modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.

  • Storage degli oggetti

    Lo storage degli oggetti offre un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati analitici e contenuti avanzati come immagini e video. Puoi memorizzare e quindi recuperare i dati direttamente da Internet o dall'interno della piattaforma cloud. Puoi ridimensionare lo storage senza alcun deterioramento delle prestazioni o dell'affidabilità del servizio. Utilizza lo storage standard per lo storage "caldo" a cui è necessario accedere rapidamente, immediatamente e frequentemente. Utilizza lo storage di archivio per lo storage "freddo" che conservi per lunghi periodi di tempo e a cui accedi raramente o raramente.

  • Data Science

    Oracle Cloud Infrastructure Data Science è una piattaforma completamente gestita e serverless che i team di data science possono utilizzare per creare, addestrare e gestire modelli di Machine Learning (ML) su Oracle Cloud Infrastructure (OCI). Può facilmente integrarsi con altri servizi OCI come Oracle Autonomous Data Warehouse, Oracle Cloud Infrastructure Object Storage e altro ancora. Puoi creare e valutare modelli di machine learning di alta qualità che aumentano la flessibilità aziendale mettendo rapidamente a disposizione dati affidabili e supportare obiettivi aziendali basati sui dati con una distribuzione più semplice dei modelli ML.

  • Oracle Database 23ai (ricerca AI Vector)

    Oracle Database 23ai offre il database convergente più completo e semplice per gli sviluppatori che desiderano creare nuovi microservizi, grafici, documenti e applicazioni relazionali.

    Oracle ha aggiunto funzionalità di ricerca semantica utilizzando i vettori AI a Oracle Database 23ai. La raccolta di funzioni, chiamata AI Vector Search, include un nuovo tipo di dati vettoriali, indici vettoriali e operatori SQL di ricerca vettoriale che consentono a Oracle Database di memorizzare il contenuto semantico di documenti, immagini e altri dati non strutturati come vettori e di utilizzarli per eseguire query di somiglianza veloce. Per ulteriori informazioni, vedere il collegamento Blog nella sezione Scopri di più.

Visualizza altro

Esaminare queste risorse aggiuntive per ulteriori informazioni sulle funzioni di questa architettura di riferimento.

AI generativa OCI

Conferma

Author: Pavan Kumar Manuguri