1 Panoramica di Oracle AI Data Platform e Workbench
In questo capitolo vengono fornite informazioni e procedure per i nuovi utenti che hanno iniziato a utilizzare Oracle AI Data Platform Workbench.
A cosa serve Oracle AI Data Platform Workbench?
Oracle AI Data Platform Workbench offre un ambiente integrato per creare, orchestrare e rendere operativi i flussi di lavoro di dati e AI.
- Semplifica la ricerca e la governance dei dati: AI Data Platform Workbench fornisce un repository di metadati centralizzato (Master Catalog) che migliora la ricercabilità e la governance dei dati strutturati e non strutturati.
- Abilita una collaborazione sicura sui dati: tramite il controllo dell'accesso basato su RBAC, AI Data Platform Workbench consente a team diversi di lavorare su set di dati condivisi mantenendo rigorosi criteri di sicurezza.
- Accelera la preparazione e l'elaborazione dei dati: grazie ai notebook integrati e all'orchestrazione del flusso di lavoro, gli utenti possono pulire, trasformare e arricchire i dati in modo efficiente.
- Supporta Advanced Analytics e AI/ML: AI Data Platform Workbench si integra con Apache Spark, consentendo a data scientist e analisti di eseguire calcoli complessi e modellare l'addestramento direttamente all'interno del proprio data lake.
- Garantire una perfetta integrazione tra le origini dati: AI Data Platform Workbench supporta cataloghi esterni di Autonomous Database (ADB), storage degli oggetti (OS) e origini dati di terze parti, consentendo agli utenti di eseguire query e analizzare i dati senza duplicazioni.
Integrazione gestita con Open Source
Oracle AI Data Platform Workbench sfrutta ed estende le tecnologie open source per offrire un'esperienza potente ma gestita.
- Apache Spark: il livello di computazione di AI Data Platform Workbench è basato su Spark, consentendo un'elaborazione dei dati distribuita e scalabile.
- Supporto di Delta Lake: AI Data Platform Workbench sfrutta Delta Lake per migliorare l'affidabilità dei dati, le transazioni ACID e l'evoluzione dello schema.
- Compatibilità Iceberg e Hudi tramite Delta Uniform: tramite Delta Uniform, AI Data Platform Workbench estende il supporto per Apache Iceberg e Apache Hudi, consentendo l'interoperabilità tra diversi formati di storage. Ciò garantisce che gli utenti possano adottare una strategia di formato tabella unificata mantenendo al contempo un'esecuzione efficiente delle query e una governance dei dati.
- JDBC Integration for BI Tools: AI Data Platform Workbench fornisce driver JDBC, consentendo una connettività perfetta con strumenti di BI esterni come Oracle Analytics Cloud (OAC) e piattaforme di visualizzazione di terze parti.
Persone per gli utenti di Oracle AI Data Platform
Oracle AI Data Platform serve una varietà di utenti attraverso ruoli diversi all'interno di un'organizzazione, ciascuno con esigenze e requisiti unici.
- Tecnici di dati: i tecnici di dati lavorano con pipeline di dati su larga scala, trasformando i dati grezzi in formati utilizzabili per l'analisi. Si affidano alle solide funzionalità di AI Data Platform per progettare e gestire i flussi di lavoro dei dati, includere dati da varie origini e garantire la qualità dei dati. Sono altamente concentrati sull'automazione dei processi, sull'ottimizzazione delle risorse di calcolo e sull'integrazione perfetta di diversi sistemi di dati.
- Analisti di dati: gli analisti di dati utilizzano AI Data Platform per scoprire, analizzare e generare insight dai dati. Richiedono un'interfaccia e strumenti intuitivi per eseguire query e analizzare set di dati di grandi dimensioni. AI Data Platform offre loro notebook interattivi e una perfetta integrazione con gli strumenti di business intelligence (BI), aiutandoli a trasformare i dati grezzi in insight utili per i responsabili delle decisioni.
- Data scientist: i data scientist sfruttano le funzionalità di computazione scalabili di AI Data Platform per le attività di machine learning e di analytics avanzati. Hanno bisogno di accedere a set di dati diversi, potenti strumenti di elaborazione e la possibilità di eseguire modelli complessi. I notebook basati su Spark di AI Data Platform, l'integrazione AI/ML e il supporto per le librerie open source consentono AI data scientist di creare, testare e distribuire modelli all'interno della piattaforma.
- Data Steward: questi utenti garantiscono che tutti i dati vengano gestiti in conformità con le normative di settore e le policy organizzative. Si concentrano sulla gestione della privacy dei dati, sull'audit dell'accesso e sul monitoraggio dell'utilizzo dei dati in tutta l'organizzazione. AI Data Platform consente loro di gestire i metadati, applicare i controlli di accesso basati sui ruoli (RBAC) e garantire una governance adeguata attraverso la catalogazione, il tracciamento della derivazione e i criteri di sicurezza.
Casi d'uso comuni per Oracle AI Data Platform
Oracle AI Data Platform gestisce una vasta gamma di casi d'uso in tutti i settori e le funzioni aziendali.
Architettura Medallion
- Implementa un'architettura Medallion con strati di bronzo, argento e oro.
- Utilizza Delta Uniform e Iceberg per un'efficiente archiviazione dei dati e ottimizzazione delle query.
- Abilita l'accesso a copia zero alle origini dati esterne per un'analisi trasparente.
ETL e ingegneria dei dati
- Utilizza flussi di lavoro e notebook basati su Spark per elaborare, trasformare e arricchire i dati di tipo RAW.
- Automatizza le pipeline di dati con l'orchestrazione del flusso di lavoro low-code/no-code.
- Gestisci l'elaborazione batch su larga scala e l'inclusione dei dati in tempo reale.
Machine Learning, AI e Data Science
- Addestra e distribuisci modelli di machine learning utilizzando notebook basati su Spark.
- Abilita la progettazione di funzionalità su larga scala e la trasformazione dei dati.
- Fornire ambienti di esecuzione gestiti per i carichi di lavoro Python e PySpark.
- Crea agenti AI conversazionali per agevolare il recupero e lo sviluppo dei dati.
Enterprise Data Catalog & Governance, condivisione Delta
- Gestione centralizzata dei metadati per dati strutturati e non strutturati.
- Controllo dell'accesso basato sui ruoli (RBAC, Role-Based Access Control) per garantire accesso e collaborazione sicuri ai dati.
- Integrazione con cataloghi esterni, tra cui Autonomous Database (ADB) e Object Storage.
- Oracle AI Data Platform supporta Delta Sharing, consentendo una condivisione sicura, in tempo reale e governata dei dati oltre i confini dell'organizzazione.
Analytics, Business Intelligence e reporting
- Connetti OCI Oracle Analytics Cloud (OAC) e gli strumenti BI di terze parti tramite JDBC come Tableau e Power BI.
Integrazione di dati multi-cloud e ibridi
- Abilita l'esecuzione delle query federate su più servizi OCI.
- Esegui l'integrazione con storage e database cloud di terze parti per l'analisi ibrida.
- Mantieni sovranità e compliance dei dati in più ambienti.