配置的任务
本节介绍任务的创建和配置。
关于任务
任务是简短的、功能性的代码块,您可以在作业中将它们拼接到流中,也可以自己提升到作业中。
任务是 Oracle AI Data Platform Workbench 中所有工作流的主要构建块。任务类型决定了它使用的代码类型。作为作业的一部分,您可以连接任务来确定作业运行时任务的顺序和优先级。
| 任务类型 | 说明 |
|---|---|
| 记事本任务 | 已保存到您可以访问的记事本的任务 |
| Python 任务 | 使用 Python 编程语言片段的任务 |
| If/else 条件 | 使用 if/else 条件的任务 |
| 嵌套作业任务 | 将现有作业及其任务用作嵌套任务的任务 |
| Jar 任务 | 可运行编译为 Java 归档 (JAR) 文件的 Scala 或 Java 代码的任务。 |
当具有多个任务时,可以创建一组任务相关性,其中一个任务的成功或失败可以按顺序触发后续任务。您只能在具有多个任务的作业中创建相关项。请参阅创建记事本任务。
任务可以彼此并行运行。您可以通过使两个或多个任务依赖于同一工作流中另一个任务的成功或失败来执行此操作,从而导致它们同时运行。
任务可能会因短暂问题(如网络中断、资源不可用或临时服务故障)而失败。在这些情况下,AI 数据平台工作台会根据您在创建任务时配置的重试策略自动重试任务。作为这些策略的一部分,您可以定义:
- 重试次数:重试的最大尝试次数。
- 重试间隔:重试之间的等待时间。
除了标准任务重试之外,AI Data Platform Workbench 还支持超时时重试。如果任务由于资源约束或处理缓慢而超出其执行时间限制,并且您希望仅针对这些情况重试,则可以选择自动触发重试。这些重试策略可增强工作流弹性,确保任务在无需人工干预的情况下有更高的成功执行概率。
何时以及如何使用计算日志
如果任务失败并出现与资源或系统相关的错误(例如内存不足错误或 CPU 使用超过限制),则应检查计算日志。
如果您看到较长的等待时间、意外的重试次数或作业性能瓶颈,请查看 Spark 日志。这些日志可深入了解支持任务的计算集群的驱动程序和 worker 节点,并有助于确定可能问题的根源。
有关如何查看日志的指导,请参见 Monitor a Specific Job Run 。
您必须具有适当的计算级别 RBAC 权限才能查看与该作业关联的计算实例的元数据和日志。如果您无法查看计算日志,请与管理员联系以获取这些权限。有关更多信息,请参阅关于权限。
创建 Jar 任务
您可以创建运行编译为 Java 归档 (JAR) 文件的 Scala 或 Java 代码的任务。
注意:
相关库文件必须在创建时使用与 Oracle AI Data Platform Workbench 集群运行时兼容的 JDK、Scala 或 Spark 版本,以避免意外行为。