Utilizzo dei file

5 Utilizzo dei file

È possibile memorizzare i file in volumi in AI Data Platform Workbench e gli utenti possono organizzarli in cartelle all'interno di un volume. AI Data Platform Workbench offre diversi modi per accedere AI dati memorizzati in volumi e aree di lavoro.

AI Data Platform Workbench supporta diversi metodi per accedere AI dati memorizzati nei volumi:

Percorsi di tipo POSIX: consentono agli utenti di fornire l'accesso ai dati relativi alla root (/) del driver. Gli utenti possono leggere/scrivere i dati in volumi o cartelle dell'area di lavoro.
Percorsi di tipo URI: consente agli utenti di fornire l'accesso ai dati utilizzando uno schema URI. Ad esempio, se desideri leggere i dati nello storage degli oggetti OCI, devi fornire uno schema URI valido per leggere/scrivere tali dati.

Di seguito ne vengono riportati alcuni esempi.

Origine	Pattern di accesso	Esempio
Volume	POSIZIONE	Esempio 1 `df_csv = spark.read.csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv", header=True, inferSchema=True, sep=",")` Esempio 2 `import pandas as pd df_panda_csv=pd.read_csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv", header=0, sep=",")` Esempio 3 `import os os.listdir("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/")`
Volume	URI	`df = spark.read.format("csv").option("header",True).load("file:///Volumes//<<catalog_name>>/<<schema_name>/<<volume_name>>/<<folder_path>>/<<file_name>>.csv")df.show()`
Area di lavoro	POSIZIONE	Esempio 1 `df_csv = spark.read.csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=True, inferSchema=True, sep=",") df_csv.show()` Esempio 2 `import pandas as pd df_panda_csv=pd.read_csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=0, sep=",") df_panda_csv.head()` Esempio 3 `import osos.listdir("/Workspace/<<folder_path>>/")`
Area di lavoro	URI	`spark.read.format("json").load("file:///Workspace/<<folder_path>>/<<file_name>>.json").show()`
Memorizzazione degli oggetti OCI	URI	`df_csv = spark.read.csv("oci://<<bucket_name>>@<<namespace>>/<<folder/file>>", header=True, inferSchema=True, sep=",")`