태스크 구성
이 절에서는 작업의 생성 및 구성을 다룹니다.
태스크 정보
작업은 작업의 일부로 흐름에 통합하거나 작업 자체로 승격할 수 있는 짧은 기능 코드 블록입니다.
작업은 Oracle AI Data Platform Workbench에 포함된 모든 워크플로의 기본 구성 요소입니다. 작업 유형에 따라 사용하는 코드 유형이 결정됩니다. 작업의 일부로 작업을 연결하여 작업이 실행될 때 해당 시퀀스 및 우선 순위를 결정합니다.
| 작업 유형 | 설명 |
|---|---|
| 노트북 태스크 | 접근할 수 있는 노트북에 저장된 태스크 |
| Python 작업 | Python 프로그래밍 언어 코드 조각을 사용하는 작업 |
| If/else 조건 | if/else 조건을 사용하는 작업 |
| 중첩된 작업 태스크 | 기존 작업 및 해당 작업을 중첩 작업으로 사용하는 작업 |
| Jar 작업 | Scala 또는 Java 코드를 JAR(Java Archive) 파일로 컴파일하여 실행할 수 있는 작업입니다. |
태스크가 두 개 이상인 경우 한 태스크의 성공 또는 실패가 후속 태스크를 순서대로 트리거할 수 있는 태스크 종속관계 세트를 생성할 수 있습니다. 태스크가 두 개 이상인 작업에서만 종속관계를 생성할 수 있습니다. 메모장 태스크 생성을 참조하십시오.
작업은 서로 병렬로 실행할 수 있습니다. 동일한 워크플로우에서 다른 작업의 성공 또는 실패에 종속된 두 개 이상의 작업을 수행하여 동시에 실행되도록 할 수 있습니다.
네트워크 중단, 리소스 사용 불가 또는 임시 서비스 실패와 같은 일시적인 문제로 인해 작업이 실패할 수 있습니다. 이 경우 AI 데이터 플랫폼 워크벤치는 태스크 생성 시 구성한 재시도 정책에 따라 태스크를 자동으로 재시도합니다. 이러한 정책의 일부로 다음을 정의합니다.
- 재시도 횟수: 최대 재시도 횟수입니다.
- 재시도 간격: 재시도 사이의 대기 시간입니다.
AI Data Platform Workbench는 표준 작업 재시도 외에도 시간 초과 시 재시도를 지원합니다. 자원 제약 또는 느린 처리로 인해 태스크가 실행 시간 제한을 초과하고 해당 시나리오에 대해서만 재시도하려는 경우 재시도를 자동으로 트리거하도록 선택할 수 있습니다. 이러한 재시도 정책은 워크플로우 복원성을 향상시켜 작업이 수동 개입 없이 성공적으로 실행될 가능성이 높아지도록 합니다.
계산 로그 사용 시기 및 방법
리소스 또는 시스템 관련 오류(예: 메모리 부족 오류 또는 CPU 사용 초과 제한)로 인해 작업이 실패하면 컴퓨트 로그를 확인해야 합니다.
긴 대기 시간, 예상치 않은 재시도 또는 작업 성능 병목 현상이 표시되는 경우 Spark 로그를 검토하십시오. 이러한 로그는 작업을 지원하는 컴퓨트 클러스터의 드라이버 및 작업자 노드에 대한 인사이트를 제공하며 가능한 문제의 원인을 식별하는 데 도움이 될 수 있습니다.
로그 확인 방법에 대한 지침은 Monitor a Specific Job Run을 참조하십시오.
작업과 연관된 컴퓨트 인스턴스에 대한 메타데이터 및 로그를 보려면 적합한 컴퓨트 레벨 RBAC 권한이 있어야 합니다. 컴퓨트 로그를 볼 수 없는 경우 관리자에게 문의하여 해당 권한을 얻으십시오. 자세한 내용은 권한 정보를 참조하십시오.
Jar 작업 생성
Scala 또는 JAR(Java Archive) 파일로 컴파일된 Java 코드를 실행하는 작업을 생성할 수 있습니다.
주:
예상치 않은 동작을 방지하려면 종속 라이브러리 파일은 생성 시 Oracle AI Data Platform Workbench 클러스터 런타임과 호환되는 JDK, Scala 또는 Spark 버전을 사용해야 합니다.태스크 수정
이름, 유형 및 파라미터와 같은 작업의 기존 속성을 변경하여 작업에서 작업의 작동 방식을 변경할 수 있습니다.
- 홈 페이지에서 워크플로우를 누릅니다.
- 작업을 구성할 작업을 누릅니다.
- 태스크 탭에서 편집할 태스크를 누릅니다.
- 오른쪽의 태스크 세부정보 창에서 필요에 따라 태스크 속성을 수정합니다. 변경 사항은 자동으로 저장됩니다.
