워크플로우를 사용하여 Spark 구조화된 스트리밍 구성

스트림 데이터의 지속적인 처리를 위해 워크플로우 내에서 스트리밍 작업을 구성할 수 있습니다.

먼저 작업을 생성한 다음 해당 작업에 하나의 노트북 또는 Python 작업을 추가하여 Oracle AI Data Platform Workbench에서 스트리밍으로 워크플로우를 사용하기 시작해야 합니다.
  1. 작업영역으로 이동하고 워크플로우를 누릅니다.
  2. 클러스터 생성 아이콘작업 생성을 누릅니다.
  3. 작업에 대한 이름 및 설명을 제공하십시오.
  4. 찾아보기를 누르고 AI 데이터 플랫폼 워크벤치에 작업을 저장할 위치를 선택합니다. 선택을 누릅니다.
  5. 최대 동시 실행에 대해 1을 입력합니다.
  6. 생성을 누릅니다.
  7. 방금 생성한 작업을 누릅니다.
  8. 작업 추가를 누릅니다.
  9. 태스크에 대한 이름을 제공합니다.
  10. 태스크 유형에 대해 노트북 또는 Python을 선택합니다.
  11. 찾아보기를 누르고 스트리밍 태스크로 추가할 노트북 또는 Python 스크립트로 이동합니다. 선택을 누릅니다.
  12. 노트북 또는 Python 작업에 대한 컴퓨트 클러스터가 아직 연결되지 않은 경우 선택합니다.
  13. 스트리밍 확인란을 선택합니다. Streaming을 선택하면 실행 시간 초과 및 작업 종속성이 옵션으로 사용 안함으로 설정됩니다.

    스트리밍 체크박스가 선택된 상태로 태스크 세부정보 생성 페이지가 열립니다.

  14. 태스크가 실패 시 시도해야 하는 재시도 횟수를 선택합니다. 0을 초과하는 경우 재시도 사이에 작업 실행이 대기해야 하는 시간 및 시간 초과 시 재시도를 시도해야 하는지 여부도 지정해야 합니다.

    재시도 횟수가 1 이상인 경우 태스크 재시도 옵션

  15. 지금 실행을 누릅니다.
스트리밍 작업이 시작된 후에는 수동으로 중지할 때까지 계속 실행됩니다. 정기적인 월별 유지 관리 중에는 서비스에서 스트리밍 작업이 중지되고 다시 시작되므로 작업을 수행할 필요가 없습니다.