5 파일 사용

AI Data Platform Workbench에서 볼륨에 파일을 저장할 수 있으며 사용자는 볼륨 내의 폴더에 해당 파일을 구성할 수 있습니다. AI Data Platform Workbench는 볼륨 및 작업영역에 저장된 데이터에 액세스할 수 있는 다양한 방법을 제공합니다.

AI 데이터 플랫폼 워크벤치는 볼륨에 저장된 데이터에 액세스하는 여러 가지 방법을 지원합니다.
  • POSIX 스타일 경로: 사용자가 드라이버 루트(/)에 상대적인 데이터에 대한 액세스를 제공할 수 있습니다. 사용자는 볼륨 또는 작업 영역 폴더에 대한 데이터를 읽고 쓸 수 있습니다.
  • URI 스타일 경로: 사용자가 URI 체계를 사용하여 데이터에 액세스할 수 있도록 허용합니다. 예를 들어, OCI Object Storage에서 데이터를 읽으려면 해당 데이터를 읽거나 쓸 수 있는 적합한 URI 체계를 제공해야 합니다.

예는 다음과 같습니다.

소스 액세스 패턴
볼륨 POSIX 예제 1
df_csv = spark.read.csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv",
    header=True,
    inferSchema=True,
    sep=",")
예제 2
import pandas as pd
df_panda_csv=pd.read_csv("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/<<file_name>>.csv", 
    header=0,
    sep=",")
예제 3
import os
os.listdir("/Volumes/<<catalog_name>>/<<schema_name>>/<<volume_name>>/")
URI
df = spark.read.format("csv").option("header",True).load("file:///Volumes//<<catalog_name>>/<<schema_name>/<<volume_name>>/<<folder_path>>/<<file_name>>.csv")df.show()
작업영역 POSIX 예제 1
df_csv = spark.read.csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=True, inferSchema=True, sep=",")
df_csv.show()
예제 2
import pandas as pd
df_panda_csv=pd.read_csv("/Workspace/<<folder_path>>/<<file_name>>.csv", header=0, sep=",")
df_panda_csv.head()
예제 3
import osos.listdir("/Workspace/<<folder_path>>/")
URI
spark.read.format("json").load("file:///Workspace/<<folder_path>>/<<file_name>>.json").show()
OCI 오브젝트 스토리지 URI
df_csv = spark.read.csv("oci://<<bucket_name>>@<<namespace>>/<<folder/file>>",
    header=True,
    inferSchema=True,   
    sep=",")