监视计算

本节介绍可用于在 Oracle AI Data Platform Workbench 中监视计算的不同方法和度量。

查看 Spark UI

您可以查看 Spark Web UI 以监视全用途计算集群的状态和资源使用情况。

  1. 导航到工作区,然后单击计算
  2. 单击集群,然后单击 Spark UI 选项卡。
  3. 可选:单击右上角的弹出按钮可在单独的窗口中查看 Spark UI。

查看驾驶员和工作人员日志

您可以查看所有用途计算集群的驱动程序和 Worker 日志以进行故障排除或调试。

  1. 导航到工作区,然后单击计算
  2. 单击集群,然后单击日志选项卡。
  3. 过滤日志以查看更具体的信息。

    驱动程序和 Worker 日志、群集注释、Worker 编号、日志级别、时间范围的日志筛选器

  4. 单击 “下载”图标 下载可保存筛选数据的本地副本。

查看度量

您可以监视计算集群的基础设施指标,以进行故障排除或进行任何大小调整。

您可以查看以下度量的状态和历史记录:
  • CPU 占用率
  • 内存使用率
  • 磁盘读取
  • 磁盘写入
  • 文件系统使用率
  • 垃圾收集器 CPU 占用率为
  • 已接收网络
  • 网络传输
  • 活动的任务
  • 失败任务总数
  • 任务任务总数
  • 已完成任务总数
  • 任务总数
  • 洗牌读取字节总数
  • 洗牌写入字节总数
  • 总任务持续时间(秒)
  • SQL:峰值并发查询
  • SQL:峰值并发连接
  1. 导航到工作区,然后单击计算
  2. 单击集群,然后单击度量选项卡。

    “计算度量”选项卡已打开。内存使用率的 "Interval"(间隔)下拉列表处于打开状态,其中选择了 "Auto"(自动)。

  3. 使用日期筛选器选择时间范围以查看特定期间的度量。
  4. 间隔下拉列表中选择一个选项以筛选特定度量的信息。

查看事件记录

您可以查看事件日志来监视与集群相关的不同操作,例如创建集群、重新启动集群、初始化脚本执行或每月维护更新。

Oracle AI Data Platform Workbench 保留过去 14 天的事件日志。
  1. 导航到工作区,然后单击计算
  2. 单击集群,然后单击事件日志选项卡。
  3. 过滤日志以查看更具体的信息。

    显示打开的事件类型下拉列表,其中显示所有选项

查看记事簿

您可以查看当前集群附加的所有记事本。此视图包括记事本计数、记事本状态,并提供了导航到相应记事本的快速方法。

  1. 导航到工作区,然后单击计算
  2. 单击集群,然后单击记事本选项卡。

    已打开计算页面,其中突出显示了“Notebooks(记事本)”选项卡

    如果代码从该记事本运行,则记事本状态为活动。如果没有从该记事本运行的代码,则记事本状态为闲置

  3. 单击记事本的名称可转至该记事本。