표
테이블은 데이터의 구조를 정의합니다.
새 데이터를 테이블로 로드하거나 기존 위치의 데이터를 참조할 수 있습니다. 테이블 권한을 생성하여 테이블에 대해 상세한 액세스 제어 권한을 정의할 수 있습니다.
테이블은 External이거나 관리할 수 있습니다.
외부 테이블
외부 테이블은 Oracle AI Data Platform Workbench에서 관리하지 않는 위치에 저장된 데이터의 구조를 정의합니다. AI 데이터 플랫폼 워크벤치에서 외부 테이블을 생성하는 경우 메타데이터 수명 주기는 AI 데이터 플랫폼 워크벤치에서 관리됩니다. External Table을 삭제하면 테이블 정의만 삭제됩니다. 외부 테이블에서 참조하는 데이터가 삭제되지 않습니다.
External Table을 생성하는 데 필요한 다음 IAM 정책이 유저에게 있는지 확인합니다.
allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>외부 테이블에 대한 추가 IAM 정책이 필요합니다. 자세한 내용은 Oracle AI Data Platform Workbench에 대한 IAM 정책을 참조하십시오.
관리 테이블
관리형 테이블은 AI 데이터 플랫폼에 저장되며 AI 데이터 플랫폼 워크벤치 사용자만 액세스할 수 있는 데이터의 구조를 정의합니다.
관리 테이블을 삭제하면 테이블 정의 및 테이블 데이터가 삭제됩니다.
지원되는 테이블 형식
| 형식 | 설명 | 사용 |
|---|---|---|
| 콤마로 구분된 값(CSV) | 데이터는 데이터를 구조화하기 위해 지정된 행 기반 파일 형식의 텍스트 파일로 저장됩니다. 일반적으로 파일의 첫번째 행은 데이터의 열 이름을 포함하는 머리글 행입니다. | 시스템 간에 표 형식 데이터를 교환하는 데 사용됩니다. 파일의 각 행은 테이블의 행입니다. |
| JSON(JavaScript 객체 표기법) | 데이터는 JavaScript 객체 구문을 기반으로 구조화된 데이터를 나타내는 표준 텍스트 기반 형식으로 저장됩니다. JSON은 객체 또는 계층 구조 목록을 지원합니다. | 스트림 애플리케이션에서 사용됩니다. JSON은 단일 문서에서 복잡한 관계로 관련 데이터의 저장을 단순화하고 관계형 데이터 모델로의 혼란스러운 목록 변환을 방지합니다. JSON은 분할할 수 없습니다. |
| Avro | 데이터는 행 기반 바이너리 형식으로 저장되고 스키마는 파일 크기를 최소화하고 효율성을 극대화하기 위해 JSON 형식으로 저장됩니다. Avro는 추가, 누락 및 변경된 필드를 관리하여 스키마 진화에 대한 안정적인 지원을 제공합니다. 이것은 오래된 소프트웨어가 새로운 데이터를 읽을 수있게하고, 새로운 소프트웨어는 오래된 데이터를 읽을 수있게합니다. 데이터 직렬화 시스템이라고도 합니다. | avro 파일이 분할 가능하고 압축 가능하므로 데이터 저장에 사용됩니다. 직렬화된 행 기반 스토리지는 AI 데이터 플랫폼에 데이터를 삽입하는 등 많은 쓰기 트랜잭션에 이상적입니다. 또한 Avro는 고속 쓰기 작업 중에 스키마 변경이 중요한 경우에도 적합합니다. |
| Parquet | 데이터는 열 형식 데이터 형식으로 저장되며 압축 및 분할이 매우 가능합니다. Parquet는 WORM(Write Once Read Many) 패러다임에 최적화되어 있습니다. 쓰기 속도는 느리지만 읽기 속도가 매우 빠릅니다. 특히 열의 부분 집합에만 액세스할 경우 더욱 그렇습니다. | 압축 알고리즘이 열 형식 데이터 형식에서 더 잘 작동하므로 Big Data 문제를 해결하는 데 사용됩니다. 이미지, 비디오, 문서 및 구조화된 데이터 테이블과 같은 다양한 형식으로 빅 데이터를 저장할 수 있습니다. Parquet는 데이터 부분을 읽을 때 많은 워크로드에 적합합니다. 예를 들어, 데이터 집합에 열이 많지만 열의 하위 집합에만 액세스하려는 경우 Spark에 의존하거나 여러 서비스가 오브젝트 스토리지에 저장된 동일한 데이터에 액세스하기를 원할 때 이상적입니다. |
| 최적화된 행 열 형식(ORC) | 데이터는 열 형식으로 단일 파일의 행 모음에 저장됩니다. | 클러스터 전체에서 행 모음의 병렬 처리에 사용됩니다. 읽기 트랜잭션이 쓰기 트랜잭션보다 많거나 압축 우선 순위가 높은 경우에 이상적입니다. |
| 델타 | 데이터는 ACID 트랜잭션 및 확장 가능한 메타데이터 처리를 위한 JSON 파일 기반 트랜잭션 로그를 통해 Parquet 데이터 파일을 확장하는 열 형식으로 저장됩니다. | 트랜잭션 지원에 사용됩니다. |
제한사항
Oracle AI Data Platform의 표에는 다음과 같은 제한 사항이 적용됩니다.
- 볼륨 내/온 데이터 파일이나 디렉토리에는 외부 테이블을 정의할 수 없습니다.
- 다른 외부 테이블 또는 외부 볼륨에 이미 사용된 버킷 및/또는 해당 디렉토리에 외부 테이블을 정의할 수 없습니다.
- 마스터 카탈로그에서 뷰를 보거나 나열할 수 없습니다.
테이블 편집
관리하는 테이블의 세부 정보를 수정할 수 있습니다.
- 스키마로 이동합니다.
- 테이블 탭을 선택합니다.
- 편집할 테이블 옆에 있는
작업을 누릅니다.- 이름 바꾸기를 눌러 테이블 이름을 변경합니다. 신규 이름을 입력한 후 입력을 누르십시오.
- 테이블의 설명을 변경하려면 설명 편집을 누릅니다. 새 설명을 입력하고 저장을 누릅니다.

