5 使用檔案

您可以將檔案儲存在 AI Data Platform Workbench 的磁碟區中,使用者可以在磁碟區內的資料夾中組織這些檔案。AI Data Platform Workbench 提供多種存取儲存在磁碟區和工作區中資料的方式。

AI Data Platform Workbench 支援多種存取儲存在磁碟區中的資料的方法:
  • POSIX 樣式路徑:允許使用者存取驅動程式根目錄 (/) 相關的資料。使用者可以讀取 / 寫入磁碟區或工作區資料夾的資料。
  • URI 樣式路徑:允許使用者使用 URI 配置來提供資料存取權。例如,若要讀取 OCI Object Storage 中的資料,應提供有效的 URI 配置以讀取 / 寫入該資料。

以下是一些範例:

來源 存取樣式 範例
磁碟區 POSIX 範例 1
df_csv = spark.read.csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv",
    header=True,
    inferSchema=True,
    sep=",")
範例 2
import pandas as pd
df_panda_csv=pd.read_csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv", 
    header=0,
    sep=",")
範例 3
import os
os.listdir("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/")
URI
df = spark.read.format("csv").option("header",True).load("file:///Volumes//<<catalog_name>>/<<schema_name>/<<volume_name>>/<<folder_path>>/<<file_name>>.csv")df.show()
工作區 POSIX 範例 1
df_csv = spark.read.csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=True, inferSchema=True, sep=",")
df_csv.show()
範例 2
import pandas as pd
df_panda_csv=pd.read_csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=0, sep=",")
df_panda_csv.head()
範例 3
import osos.listdir("/Workspace/<<folder_path>>/")
URI
spark.read.format("json").load("file:///Workspace/<<folder_path>>/<<file_name>>.json").show()
OCI Object Storage URI
df_csv = spark.read.csv("oci://<<bucket_name>>@<<namespace>>/<<folder/file>>",
    header=True,
    inferSchema=True,   
    sep=",")