Usa Data Lake con Autonomous Database
Scopri i vantaggi derivanti dall'uso del data lake con Autonomous Database.
- Informazioni sul data lake con Autonomous Database
Oracle Autonomous Database è una soluzione versatile per adattarsi a qualsiasi tipo di dati e carico di lavoro. - Che cos'è un data lake?
I data lake sono repository centralizzati progettati per memorizzare grandi quantità di dati grezzi nel loro formato nativo fino a quando i dati non sono necessari per l'analisi. - Funzioni chiave del data lake di Autonomous Database
Oracle Autonomous Database è progettato per supportare senza problemi i carichi di lavoro del data lake, eliminando la necessità di gestione o installazione. Offre funzionalità affidabili per gestire vari formati di dati in diversi ambienti cloud, garantendo un'analisi dei dati flessibile e completa.
Argomento padre: Funzioni
Informazioni sul data lake con Autonomous Database
Oracle Autonomous Database è una soluzione versatile per adattarsi a qualsiasi tipo di dati e carico di lavoro.
Autonomous Database offre uno storage a costi contenuti, con un costo per TB paragonabile alle aree di memorizzazione degli oggetti, supportando al contempo diversi tipi di dati come JSON, Graph e Vector. Con Autonomous Database, le aziende possono consolidare i propri dati su un'unica piattaforma. Possono sfruttare funzionalità convergenti come Oracle Machine Learning (OML), Graph, Spatial, Vector e Blockchain per gestire i propri dati in modo completo.
Per le organizzazioni che hanno già data lake esistenti su altre piattaforme, Oracle Autonomous Database si integra perfettamente, consentendo alle aziende di beneficiare delle funzioni avanzate di Autonomous Database senza interrompere le impostazioni correnti.
Per ulteriori informazioni, prova LiveLabs Crea un data lake con Autonomous Data Warehouse.
Argomento padre: Usa data lake con Autonomous Database
Che cos'è un data lake?
I data lake sono repository centralizzati progettati per memorizzare grandi quantità di dati grezzi nel loro formato nativo fino a quando i dati non sono necessari per l'analisi.
Sono altamente flessibili e scalabili, il che li rende un potente complemento ai data warehouse tradizionali consentendo alle organizzazioni di archiviare ed elaborare vari tipi di dati, tra cui strutturati, semistrutturati e non strutturati.
-
Formati file e tabella aperti
I data lake memorizzano i dati in formati di file aperti, come CSV, Parquet e formati di tabella come Iceberg. Ciò garantisce interoperabilità e flessibilità nell'elaborazione dei dati consentendo a più motori di scrivere e leggere questi set di dati.
-
Supporto per più motori di elaborazione dati
I data lake sono compatibili con vari motori di elaborazione dati, come Apache Spark, Presto e Hive, consentendo diversi carichi di lavoro analitici.
-
Schema-on-Read
I data lake spesso utilizzano un approccio schema in lettura, il che significa che non è necessario definire uno schema in anticipo. Ciò consente una rapida inclusione dei dati, in cui i dati possono essere caricati senza strutturazione precedente, proprio come gli archivi di oggetti che "acquisiscono i dati ora e fanno domande in seguito".
-
Supporto per i dati non strutturati
Oltre ai dati strutturati, i data lake possono memorizzare dati non strutturati come immagini (JPG), documenti (PDF, Word) e altri dati binari, offrendo una soluzione di storage completa.
Argomento padre: Usa data lake con Autonomous Database
Funzioni principali del data lake di Autonomous Database
Oracle Autonomous Database è progettato per supportare senza problemi i carichi di lavoro dei data lake, eliminando la necessità di gestione o installazione. Offre funzionalità affidabili per gestire vari formati di dati in diversi ambienti cloud, garantendo un'analisi dei dati flessibile e completa.
- Pronto per i carichi di lavoro del data lake
Oracle Autonomous Database è completamente pronto per i carichi di lavoro del data lake pronti all'uso, senza richiedere componenti aggiuntivi. Questa disponibilità si estende ai task chiave dei data lake, come la trasformazione dei dati, la gestione dei metadati e l'integrazione con gli strumenti dei data lake più diffusi, tutti disponibili fin dal primo giorno senza ulteriori impostazioni. - Multi-Cloud Support
Per le organizzazioni che hanno già data lake esistenti su altre piattaforme, Autonomous Database si integra perfettamente, consentendo alle aziende di trarre vantaggio dalle funzioni avanzate di Autonomous Database senza interrompere le impostazioni correnti. - Supporto per il formato di dati end-to-end
Oracle Autonomous Database è progettato con la flessibilità di gestire un'ampia gamma di formati di dati, rendendolo una soluzione universale per diverse fonti di dati e carichi di lavoro. - Funzionalità avanzate: Autonomous Database per la gestione dei dati non strutturati
Mentre Oracle Database è riconosciuto per la sua potente elaborazione di dati strutturati e semistrutturati, Autonomous Database estende le sue funzionalità per gestire anche set di dati non strutturati. - Gestione flessibile dei metadati
Oracle Autonomous Database offre agli utenti vari modi per definire i metadati per i propri set di dati, rendendo la gestione dei dati più adattabile ed efficiente. - Supporto dei metadati federati
Autonomous Database supporta un catalogo di metadati federato che consente agli utenti di unificare i metadati da origini diverse in un'unica vista, fornendo un'interfaccia unificata per la gestione dei metadati. - Collaborazione
Dopo aver terminato l'analisi, gli utenti spesso devono condividere i risultati con altri. Oracle Autonomous Database semplifica la condivisione offrendo diversi modi per collaborare, offrendo vantaggi unici rispetto ad altri database, come funzioni di sicurezza integrate, protocolli aperti e connettività cloud trasparente. - Ampia compatibilità con gli strumenti Oracle Database
L'ambiente Autonomous Database è completamente compatibile con una vasta gamma di strumenti di database Oracle.
Argomento padre: Usa data lake con Autonomous Database
Pronto per carichi di lavoro Data Lake
Oracle Autonomous Database è completamente pronto per i carichi di lavoro dei data lake pronti all'uso e non richiede componenti aggiuntivi. Questa disponibilità si estende ai task chiave dei data lake, come la trasformazione dei dati, la gestione dei metadati e l'integrazione con gli strumenti dei data lake più diffusi, tutti disponibili fin dal primo giorno senza ulteriori impostazioni.
Questa disponibilità completa è ciò che distingue Autonomous Database, offrendo un'esperienza integrata e senza problemi che accelera il time-to-insight per i carichi di lavoro dei data lake. Ciò significa che gli utenti possono iniziare immediatamente a gestire i task del data lake senza alcuna impostazione o configurazione, rendendolo una vera soluzione plug-and-play per gli ambienti del data lake. Questa funzionalità integrata semplifica le operazioni, riduce i costi di manutenzione e garantisce una maggiore affidabilità con meno errori.
Autonomous Database offre un set di strumenti per tutti i tipi di utenti, dagli sviluppatori agli analisti aziendali, rendendo la piattaforma universale e accessibile.
Gli sviluppatori possono utilizzare strumenti come l'API PL/SQL per operazioni avanzate, scripting e automazione, consentendo una perfetta integrazione con gli strumenti esistenti e creando soluzioni di database personalizzate in modo efficiente. Per ulteriori informazioni, vedere Autonomous Database Supplied Package Reference.
Per gli utenti business, è possibile utilizzare Data Studio, un'interfaccia basata sul Web per semplificare l'interazione, l'esplorazione e la visualizzazione dei dati. Data Studio consente agli utenti non tecnici di ricavare insight, creare report e collaborare in modo efficace, riducendo la complessità e supportando un processo decisionale informato. Per ulteriori informazioni, vedere Pagina Panoramica di Data Studio.
Argomento padre: funzioni chiave del data lake di Autonomous Database
Multi-Cloud Support
Per le organizzazioni che hanno già data lake esistenti su altre piattaforme, Autonomous Database si integra perfettamente, consentendo alle aziende di beneficiare delle funzioni avanzate di Autonomous Database senza interrompere le impostazioni correnti.
Fornire l'accesso Autonomous Database al data lake concedendo i privilegi e l'accesso necessari affinché il data lake sia connesso ad Autonomous Database. Una volta fornite le credenziali necessarie, Autonomous Database può connettersi senza problemi ai data lake in vari ambienti cloud, tra cui AWS, Azure, Google Cloud e l'area di memorizzazione degli oggetti OCI Oracle.
Questa funzionalità ti consente di accedere e gestire i tuoi dati in modo sicuro, sfruttando le funzioni di sicurezza native di ogni provider cloud. Con questo supporto multi-cloud, ottieni la flessibilità di distribuire e ridimensionare il tuo data lake su diverse piattaforme cloud mantenendo un ambiente unificato e sicuro.
Oracle Autonomous Database supporta la sicurezza nativa per altri cloud. Per ulteriori informazioni, vedere Usa i nomi delle risorse Amazon (ARN) per accedere alle risorse AWS, Usa principal del servizio Azure per accedere alle risorse Azure e Usa account del servizio Google per accedere alle risorse Google Cloud Platform per la piattaforma cloud corrispondente.
Argomento padre: funzioni chiave del data lake di Autonomous Database
Supporto formato dati end-to-end
Oracle Autonomous Database è progettato con la flessibilità di gestire un'ampia gamma di formati di dati, rendendolo una soluzione universale per diverse fonti di dati e carichi di lavoro.
Indipendentemente dal fatto che i tuoi dati risiedano in formati strutturati, semistrutturati o non strutturati, Autonomous Database li supporta perfettamente in vari ambienti cloud. Ciò consente alle aziende di includere, archiviare e analizzare i dati senza preoccuparsi della compatibilità del formato.
Autonomous Database offre supporto nativo per formati tradizionali come CSV e JSON, nonché formati avanzati come AVRO, Parquet e ORC. Per ulteriori informazioni, consulta la sezione Query sui dati esterni con Autonomous Database. Autonomous Database supporta i seguenti formati di file: CSV, JSON, XML, AVRO, ORC, Parquet, Delta Sharing, Iceberg, Word, PDF.
Grazie al supporto aggiunto per il formato Iceberg Table, Autonomous Database offre funzionalità avanzate per ambienti data lake su larga scala. Iceberg consente l'esecuzione di query ottimizzate e ad alte prestazioni, un migliore controllo della versione e una gestione dei dati più semplice, il che lo rende adatto a set di dati di grandi dimensioni in evoluzione. Per ulteriori informazioni, vedere Query sulle tabelle di Apache Iceberg.
Argomento padre: funzioni chiave del data lake di Autonomous Database
Funzionalità avanzate: Autonomous Database per la gestione dei dati non strutturati
Sebbene Oracle Database sia riconosciuto per la sua potente elaborazione di dati strutturati e semi-strutturati, Autonomous Database estende le sue funzionalità per gestire anche set di dati non strutturati.
- Insight basati sull'AI con Retrieval Augmented Generation (RAG): Autonomous Database integra modelli AI avanzati, consentendo la ricerca di vettori per dati non strutturati. Ciò consente un recupero efficiente delle informazioni pertinenti su set di dati di grandi dimensioni utilizzando l'intelligenza artificiale, migliorando l'accuratezza e la velocità della ricerca. Per ulteriori informazioni, consulta la sezione relativa alla selezione dell'AI con Retrieval Augmented Generation (RAG).
- Indicizzazione full-text: Autonomous Database supporta la creazione di indici full-text su file non strutturati, consentendo di eseguire ricerche di testo avanzate su documenti come PDF, file Word e altro ancora. Questa funzionalità migliora notevolmente il modo in cui è possibile eseguire query, indicizzare e analizzare i contenuti non strutturati. Vedere Usa ricerca full-text nei file nello storage degli oggetti
- Analizza e carica dati non strutturati: le funzioni avanzate di analisi e inclusione dei dati di Autonomous Database consentono agli utenti di caricare senza problemi i dati non strutturati, trasformandoli automaticamente in un formato tabulare, pronti per essere caricati nel database. Per ulteriori informazioni, vedere Esegui estrazione tabella da immagine.
- AI as a Source of Data (Prompt-to-Table): sfruttando l'AI, Autonomous Database abilita funzionalità da prompt a tabella, consentendo agli utenti di generare dati direttamente dai modelli AI e caricarli nelle tabelle. Ciò apre la possibilità di estrarre insight preziosi da output generati dall'intelligenza artificiale e di utilizzarli come nuova fonte di dati strutturati. Vedere Caricamento dei dati dall'origine AI
Queste funzionalità espanse posizionano Autonomous Database come un potente strumento per gestire le crescenti richieste di dati non strutturati, sfruttando anche soluzioni basate sull'intelligenza artificiale, rendendolo una piattaforma versatile e a prova di futuro per le sfide dei dati moderni.
Argomento padre: funzioni chiave del data lake di Autonomous Database
Gestione flessibile dei metadati
Oracle Autonomous Database offre agli utenti vari modi per definire i metadati per i propri set di dati, rendendo la gestione dei dati più adattabile ed efficiente.
- Integrazione metadati basata su catalogo
Gli utenti possono trasferire i metadati di vari cataloghi in una vista centralizzata, semplificando il controllo e la gestione della coerenza dei dati in tutta l'organizzazione. I cataloghi supportati includono:
-
OCI Data Catalog: uno strumento all'interno di Oracle Cloud Infrastructure (OCI) che consente agli utenti di scoprire, organizzare e gestire gli asset di dati. Offre una visione chiara di tutti gli asset di dati, aiutando gli utenti a mantenere la compliance, garantire la qualità dei dati e facilitare la collaborazione tra i team. Per ulteriori informazioni, vedere Esempio: scenario MovieStream.
-
AWS Glue: servizio ETL (extract, transform, load) gestito da Amazon Web Services che include un Data Catalog per l'organizzazione e la gestione dei metadati. Per ulteriori informazioni, consulta la sezione Interrogazione dei dati esterni con AWS Glue Data Catalog.
-
- Definizione metadati manuali
Gli utenti possono anche definire i metadati direttamente a livello di tabella per i set di dati nelle aree di memorizzazione degli oggetti, ad esempio Oracle Cloud Infrastructure (OCI) Object Storage o Amazon S3. Ciò consente l'organizzazione personalizzata dei dati per singoli file o gruppi di file, su misura per le esigenze degli utenti. Autonomous Database può anche derivare automaticamente metadati, come nomi di colonne e tipi di dati, per risparmiare tempo e ridurre gli errori. Ad esempio, quando si carica un file CSV, il sistema può rilevare automaticamente le intestazioni come nomi di colonna e assegnare i tipi di dati appropriati, ad esempio numero o varchar2, in base al contenuto. Ciò consente agli utenti di preparare rapidamente i propri dati per l'analisi senza interventi manuali, riducendo i tempi di configurazione e riducendo al minimo la possibilità di errori.
Argomento padre: funzioni chiave del data lake di Autonomous Database
Supporto metadati federati
Autonomous Database supporta un catalogo di metadati federato, consentendo agli utenti di unificare i metadati da origini diverse in un'unica vista, fornendo un'interfaccia unificata per la gestione dei metadati.
Questo approccio semplifica la gestione dei metadati in vari ambienti collegando le origini dati su più cloud e piattaforme. Sia che si tratti di utilizzare metadati basati su catalogo o di definirli manualmente, tutte le informazioni sono disponibili in un catalogo unificato per una facile navigazione. Ad esempio, un'organizzazione può utilizzare questa vista federata per gestire gli asset di dati sia da AWS che da Oracle Cloud, garantendo governance e rilevabilità coerenti tra le piattaforme.
Argomento padre: funzioni chiave del data lake di Autonomous Database
Collaboration
Dopo aver terminato l'analisi, gli utenti devono spesso condividere i risultati con altri. Oracle Autonomous Database semplifica la condivisione offrendo diversi modi per collaborare, offrendo vantaggi unici rispetto ad altri database, come funzioni di sicurezza integrate, protocolli aperti e connettività cloud trasparente.
Queste opzioni sono realizzate per essere flessibili e sicure, in modo da soddisfare le diverse esigenze di collaborazione:
-
Protocollo di condivisione delta: consente di condividere i dati al di fuori di Oracle utilizzando un protocollo aperto denominato Delta Sharing. Supporta la condivisione sicura dei dati con partner esterni, senza la necessità di un'integrazione complessa, rendendola ideale per gli analytics multi-cloud e multi-piattaforma. In questo modo, i dati possono essere utilizzati senza problemi in diversi strumenti di analisi che non fanno parte di Oracle. Per ulteriori informazioni, vedere Condividi versioni dati mediante lo storage degli oggetti.
-
Collegamenti cloud: è possibile condividere i dati tra istanze di Autonomous Database diverse utilizzando collegamenti cloud sicuri. Ad esempio, i collegamenti cloud sono particolarmente efficaci per la connessione di database diversi. Ciò garantisce una disponibilità coerente dei dati e riduce la latenza per le applicazioni che richiedono un accesso rapido e affidabile ai dati su più database, senza doverli copiare o duplicare. Mantiene agevole la collaborazione per i team distribuiti e che devono lavorare insieme. Vedere Condivisione dati in tempo reale tramite connessione diretta
-
Collegamenti ipertestuali di tabella: è possibile condividere i dati direttamente creando URL speciali che consentono l'accesso ai dati senza richiedere un login separato. Gli utenti possono controllare le autorizzazioni e impostare i tempi di scadenza per questi URL, garantendo opzioni di condivisione sicure e flessibili. Questa funzione è stata creata in modo specifico per i client REST. Per ulteriori informazioni, vedere Generate a Table Hyperlink for a Table or a View.
Argomento padre: funzioni chiave del data lake di Autonomous Database
Ampia compatibilità con gli strumenti Oracle Database
L'ambiente Autonomous Database è completamente compatibile con una vasta gamma di strumenti di database Oracle.
Qualsiasi strumento che utilizzi già per interagire con i database Oracle, sia per la visualizzazione dei dati, l'analitica, l'ETL o l'amministrazione, può anche essere utilizzato senza problemi per analizzare i set di dati all'interno di Autonomous Database. Questa compatibilità garantisce un'esperienza senza attriti, consentendo agli utenti di integrare Autonomous Database nei flussi di lavoro esistenti senza dover adottare nuovi strumenti o processi, massimizzando così l'efficienza e riducendo la curva di apprendimento.
Per informazioni su alcuni degli strumenti disponibili per l'utilizzo con i database Oracle, vedere Pagina Panoramica di Data Studio.
Argomento padre: funzioni chiave del data lake di Autonomous Database