14 데이터 수집
이 장에서는 AI 데이터 플랫폼 워크벤치가 다양한 내부 및 외부 소스에서 데이터를 수집하는 방법에 대해 설명합니다.
Oracle AI Data Platform Workbench는 Spark 기반 노트북을 사용하여 외부 및 내부 소스 모두에서 데이터를 원활하게 수집할 수 있도록 지원합니다. 클라우드 서비스, 온프레미스 데이터베이스 또는 Oracle 네이티브 플랫폼에서 데이터를 가져오든 관계없이 AI Data Platform Workbench는 데이터 엔지니어링 워크플로를 대규모로 지원하는 유연한 코드 기반 수집 방법을 제공합니다.
AI Data Platform Workbench의 수집 커넥터를 통해 다음을 수행할 수 있습니다.
- 끌어 놓기 기능을 사용하여 빠른 연결 설정을 위한 노트북 코드를 생성합니다.
- 다양한 시스템에서 일괄 처리 또는 거의 실시간 데이터를 수집합니다.
- Spark 및 JDBC 기반 패턴을 활용하여 데이터를 효율적으로 읽고 쓰고 처리할 수 있습니다.
- 중복 없이 직접 질의에 대한 카탈로그로 외부 소스를 등록합니다.
자세한 내용은 다음 섹션을 참조하십시오.
- 외부 소스 - MySQL, PostgreSQL, Kafka 등에서 데이터를 수집합니다.
- 내부 소스 - Oracle Autonomous AI Lakehouse, BICC를 통한 Fusion, Oracle Database/Oracle AI Database와 같은 Oracle 네이티브 시스템과 연결합니다.