5 Utilizzo dei file

È possibile memorizzare i file in volumi in AI Data Platform Workbench e gli utenti possono organizzarli in cartelle all'interno di un volume. AI Data Platform Workbench offre diversi modi per accedere AI dati memorizzati in volumi e aree di lavoro.

AI Data Platform Workbench supporta diversi metodi per accedere AI dati memorizzati nei volumi:
  • Percorsi di tipo POSIX: consentono agli utenti di fornire l'accesso ai dati relativi alla root (/) del driver. Gli utenti possono leggere/scrivere i dati in volumi o cartelle dell'area di lavoro.
  • Percorsi di tipo URI: consente agli utenti di fornire l'accesso ai dati utilizzando uno schema URI. Ad esempio, se desideri leggere i dati nello storage degli oggetti OCI, devi fornire uno schema URI valido per leggere/scrivere tali dati.

Di seguito ne vengono riportati alcuni esempi.

Origine Pattern di accesso Esempio
Volume POSIZIONE Esempio 1
df_csv = spark.read.csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv",
    header=True,
    inferSchema=True,
    sep=",")
Esempio 2
import pandas as pd
df_panda_csv=pd.read_csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv", 
    header=0,
    sep=",")
Esempio 3
import os
os.listdir("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/")
URI
df = spark.read.format("csv").option("header",True).load("file:///Volumes//<<catalog_name>>/<<schema_name>/<<volume_name>>/<<folder_path>>/<<file_name>>.csv")df.show()
Area di lavoro POSIZIONE Esempio 1
df_csv = spark.read.csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=True, inferSchema=True, sep=",")
df_csv.show()
Esempio 2
import pandas as pd
df_panda_csv=pd.read_csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=0, sep=",")
df_panda_csv.head()
Esempio 3
import osos.listdir("/Workspace/<<folder_path>>/")
URI
spark.read.format("json").load("file:///Workspace/<<folder_path>>/<<file_name>>.json").show()
Memorizzazione degli oggetti OCI URI
df_csv = spark.read.csv("oci://<<bucket_name>>@<<namespace>>/<<folder/file>>",
    header=True,
    inferSchema=True,   
    sep=",")