태스크 구성

이 절에서는 작업의 생성 및 구성을 다룹니다.

태스크 정보

작업은 작업의 일부로 흐름에 통합하거나 작업 자체로 승격할 수 있는 짧은 기능 코드 블록입니다.

작업은 Oracle AI Data Platform Workbench에 포함된 모든 워크플로의 기본 구성 요소입니다. 작업 유형에 따라 사용하는 코드 유형이 결정됩니다. 작업의 일부로 작업을 연결하여 작업이 실행될 때 해당 시퀀스 및 우선 순위를 결정합니다.

작업 유형 설명
노트북 태스크 접근할 수 있는 노트북에 저장된 태스크
Python 작업 Python 프로그래밍 언어 코드 조각을 사용하는 작업
If/else 조건 if/else 조건을 사용하는 작업
중첩된 작업 태스크 기존 작업 및 해당 작업을 중첩 작업으로 사용하는 작업
Jar 작업 Scala 또는 Java 코드를 JAR(Java Archive) 파일로 컴파일하여 실행할 수 있는 작업입니다.

태스크가 두 개 이상인 경우 한 태스크의 성공 또는 실패가 후속 태스크를 순서대로 트리거할 수 있는 태스크 종속관계 세트를 생성할 수 있습니다. 태스크가 두 개 이상인 작업에서만 종속관계를 생성할 수 있습니다. 메모장 태스크 생성을 참조하십시오.

작업은 서로 병렬로 실행할 수 있습니다. 동일한 워크플로우에서 다른 작업의 성공 또는 실패에 종속된 두 개 이상의 작업을 수행하여 동시에 실행되도록 할 수 있습니다.

네트워크 중단, 리소스 사용 불가 또는 임시 서비스 실패와 같은 일시적인 문제로 인해 작업이 실패할 수 있습니다. 이 경우 AI 데이터 플랫폼 워크벤치는 태스크 생성 시 구성한 재시도 정책에 따라 태스크를 자동으로 재시도합니다. 이러한 정책의 일부로 다음을 정의합니다.

  • 재시도 횟수: 최대 재시도 횟수입니다.
  • 재시도 간격: 재시도 사이의 대기 시간입니다.

AI Data Platform Workbench는 표준 작업 재시도 외에도 시간 초과 시 재시도를 지원합니다. 자원 제약 또는 느린 처리로 인해 태스크가 실행 시간 제한을 초과하고 해당 시나리오에 대해서만 재시도하려는 경우 재시도를 자동으로 트리거하도록 선택할 수 있습니다. 이러한 재시도 정책은 워크플로우 복원성을 향상시켜 작업이 수동 개입 없이 성공적으로 실행될 가능성이 높아지도록 합니다.

계산 로그 사용 시기 및 방법

리소스 또는 시스템 관련 오류(예: 메모리 부족 오류 또는 CPU 사용 초과 제한)로 인해 작업이 실패하면 컴퓨트 로그를 확인해야 합니다.

긴 대기 시간, 예상치 않은 재시도 또는 작업 성능 병목 현상이 표시되는 경우 Spark 로그를 검토하십시오. 이러한 로그는 작업을 지원하는 컴퓨트 클러스터의 드라이버 및 작업자 노드에 대한 인사이트를 제공하며 가능한 문제의 원인을 식별하는 데 도움이 될 수 있습니다.

로그 확인 방법에 대한 지침은 Monitor a Specific Job Run을 참조하십시오.

작업과 연관된 컴퓨트 인스턴스에 대한 메타데이터 및 로그를 보려면 적합한 컴퓨트 레벨 RBAC 권한이 있어야 합니다. 컴퓨트 로그를 볼 수 없는 경우 관리자에게 문의하여 해당 권한을 얻으십시오. 자세한 내용은 권한 정보를 참조하십시오.

Python 작업 생성

Python 스크립팅을 사용하는 워크플로우 작업의 일부로 작업을 생성할 수 있습니다.

  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 작업을 만들 작업을 누릅니다.
  3. 작업 추가를 누릅니다.
  4. 태스크 이름을 입력하십시오.
  5. 태스크 유형에 대해 Python을 선택합니다.
  6. 찾아보기를 누르고 태스크로 추가할 Python 스크립트로 이동합니다. 선택을 누릅니다.
  7. 아직 연결되지 않은 경우 Python 작업에 대한 컴퓨트 클러스터를 선택합니다.
  8. 태스크가 실패 시 시도해야 하는 재시도 횟수를 선택합니다. 0을 초과하는 경우 재시도 사이에 작업 실행이 대기해야 하는 시간 및 시간 초과 시 재시도를 시도해야 하는지 여부도 지정해야 합니다.

    재시도 횟수가 1 이상인 경우 태스크 재시도 옵션

  9. 종속에서 이 태스크에 종속되도록 할 모든 태스크를 선택합니다. 실행 조건 드롭다운에서 해당 종속성에 대한 조건부 응답을 선택합니다.
  10. 을 제공하여 다른 매개변수를 추가합니다. 매개변수 추가를 눌러 여러 매개변수를 제공합니다.

노트북 태스크 생성

AI 데이터 플랫폼 워크벤치에 구축한 노트북을 사용하여 태스크를 생성합니다.

  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 작업을 만들 작업을 누릅니다.
  3. 작업 추가를 누릅니다.
  4. 태스크 이름을 입력하십시오.
  5. 태스크 유형에 대해 노트북을 선택합니다.
  6. 찾아보기를 누르고 태스크로 추가할 노트북으로 이동합니다. 선택을 누릅니다.
  7. 노트북 작업에 대한 컴퓨트 클러스터가 아직 연결되지 않은 경우 선택합니다.
  8. 태스크가 실패 시 시도해야 하는 재시도 횟수를 선택합니다. 0을 초과하는 경우 재시도 사이에 작업 실행이 대기해야 하는 시간 및 시간 초과 시 재시도를 시도해야 하는지 여부도 지정해야 합니다.

    재시도 횟수가 1 이상인 경우 태스크 재시도 옵션

  9. 종속 항목에서 이 태스크에 종속되도록 할 모든 태스크를 선택합니다. 다음 경우 실행 드롭다운에서 해당 종속성에 대한 조건부 응답을 선택합니다.
  10. 을 제공하여 다른 매개변수를 추가합니다. 매개변수 추가를 눌러 여러 매개변수를 제공합니다.

중첩 작업 생성

다른 워크플로우 작업 및 포함된 작업을 다른 워크플로우 내에서 중첩된 작업으로 사용할 수 있습니다.

  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 작업을 만들 작업을 누릅니다.
  3. 작업 추가를 누릅니다.
  4. 태스크 이름을 입력하십시오.
  5. 태스크 유형에 대해 중첩된 작업 태스크를 선택합니다.
  6. 작업 드롭다운 목록에서 작업을 만들려는 기존 작업을 선택합니다.
  7. 태스크가 실패 시 시도해야 하는 재시도 횟수를 선택합니다. 0을 초과하는 경우 재시도 사이에 작업 실행이 대기해야 하는 시간 및 시간 초과 시 재시도를 시도해야 하는지 여부도 지정해야 합니다.

    재시도 횟수가 1 이상인 경우 태스크 재시도 옵션

  8. 종속 항목에서 이 태스크에 종속되도록 할 모든 태스크를 선택합니다. 실행 조건 드롭다운에서 해당 종속성에 대한 조건부 응답을 선택합니다.
  9. 을 제공하여 다른 매개변수를 추가합니다. 매개변수 추가를 눌러 여러 매개변수를 제공합니다.

If/Else 작업 생성

카탈로그 데이터를 기반으로 if/else 조건을 사용하여 작업이 트리거되는지 여부를 확인하는 작업을 생성할 수 있습니다.

  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 작업을 만들 작업을 누릅니다.
  3. 작업 추가를 누릅니다.
  4. 태스크 이름을 입력하십시오.
  5. 태스크 유형에 대해 If/Else를 선택합니다.
  6. 태스크가 트리거되는지 여부를 결정하는 조건을 입력합니다. 추가 아이콘 추가를 눌러 여러 조건을 설정합니다.
  7. 조건 표현식을 입력합니다.
  8. 태스크가 실패 시 시도해야 하는 재시도 횟수를 선택합니다. 0을 초과하는 경우 재시도 사이에 작업 실행이 대기해야 하는 시간 및 시간 초과 시 재시도를 시도해야 하는지 여부도 지정해야 합니다.

    재시도 횟수가 1 이상인 경우 태스크 재시도 옵션

  9. 종속에서 이 태스크에 종속되도록 할 모든 태스크를 선택합니다. 다음 경우 실행 드롭다운에서 해당 종속성에 대한 조건부 응답을 선택합니다.
  10. 을 제공하여 다른 매개변수를 추가합니다. 매개변수 추가를 눌러 여러 매개변수를 제공합니다.

Jar 작업 생성

Scala 또는 JAR(Java Archive) 파일로 컴파일된 Java 코드를 실행하는 작업을 생성할 수 있습니다.

주:

예상치 않은 동작을 방지하려면 종속 라이브러리 파일은 생성 시 Oracle AI Data Platform Workbench 클러스터 런타임과 호환되는 JDK, Scala 또는 Spark 버전을 사용해야 합니다.
  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 작업을 만들 작업을 누릅니다.
  3. 작업 추가를 누릅니다.
  4. 태스크 이름을 입력하십시오.
  5. 태스크 유형에 대해 JAR 태스크를 선택합니다.
  6. 기본 클래스 이름에 대해 실행할 기본 메소드를 포함하는 클래스의 전체 이름을 지정합니다. 예를 들어, ProcessTransaction입니다. 이 클래스는 종속 라이브러리로 추가된 파일 중 하나에 포함되어야 합니다.
  7. 종속 라이브러리의 경우 추가를 누릅니다.
  8. 종속 라이브러리 파일의 소스를 선택하십시오. 위에 지정된 기본 클래스 메소드를 포함하는 라이브러리를 하나 이상 포함해야 합니다.
    • 작업영역 또는 볼륨의 경우 AI Data Platform Workbench 작업영역 또는 볼륨을 찾아 라이브러리로 추가할 파일을 선택하고 추가를 누릅니다.
    • 작업영역에 파일 업로드의 경우 로컬 시스템에서 라이브러리로 업로드할 파일을 찾아서 추가를 누릅니다.
  9. 명령행 인수에서 기본 클래스에 전달할 공백으로 구분된 인수를 제공합니다.
  10. 태스크가 실패 시 시도해야 하는 재시도 횟수를 선택합니다. 0을 초과하는 경우 재시도 사이에 작업 실행이 대기해야 하는 시간 및 시간 초과 시 재시도를 시도해야 하는지 여부도 지정해야 합니다.

    재시도 횟수가 1 이상인 경우 태스크 재시도 옵션

  11. 종속 항목에서 이 태스크에 종속되도록 할 모든 태스크를 선택합니다. 실행 조건 드롭다운에서 해당 종속성에 대한 조건부 응답을 선택합니다.
  12. 을 제공하여 다른 매개변수를 추가합니다. 매개변수 추가를 눌러 여러 매개변수를 제공합니다.

태스크 수정

이름, 유형 및 파라미터와 같은 작업의 기존 속성을 변경하여 작업에서 작업의 작동 방식을 변경할 수 있습니다.

  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 작업을 구성할 작업을 누릅니다.
  3. 태스크 탭에서 편집할 태스크를 누릅니다.
  4. 오른쪽의 태스크 세부정보 창에서 필요에 따라 태스크 속성을 수정합니다. 변경 사항은 자동으로 저장됩니다.

태스크 로그 보기

작업에서 개별 작업의 실행 로그를 볼 수 있습니다.

  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 작업 실행을 누릅니다.
  3. 작업 로그를 확인할 작업을 누릅니다.
  4. 해당 작업에 대한 로그를 보려면 작업 노드를 누릅니다.

태스크 삭제

작업에서 작업 노드를 제거하여 작업을 삭제할 수 있습니다.

  1. 홈 페이지에서 워크플로우를 누릅니다.
  2. 태스크를 삭제할 작업을 누릅니다.
  3. 태스크 노드에서 작업을 누른 다음 노드 제거를 누릅니다.
  4. 삭제를 누릅니다.