监视工作量

了解并采用所有 Oracle Cloud Infrastructure 服务的监视过程。监视服务使用度量监视资源和预警,以便在度量满足预警指定的触发器时通知您。

分析操作度量

网络架构师、基础设施架构师

定义、捕获和分析操作度量以获取事件的可见性。

Oracle Cloud Infrastructure Monitoring 服务可为您提供所需的洞察力,帮助您实时了解资源健康状况,优化应用性能,并应对异常情况。您可以设置警报来实时提醒您注意云基础设施和服务中的重要更改,从而使您能够迅速采取适当的操作。

定义健康检查

云架构师、基础设施架构师

Oracle Cloud Infrastructure Health Checks 服务为用户提供高频外部监视,以确定任何面向公共的服务的可用性和性能,包括托管网站、API 端点或面向外部的负载平衡器。
使用 Oracle Cloud Infrastructure Health Checks 确保您立即了解影响客户的任何可用性问题。

监视计算服务

基础结构架构师

确保运营团队使用并应用计算服务度量。

使用度量、预警和通知监视以下内容:

  • 计算实例:监视计算实例的运行状况、容量和性能。
  • 基础结构健康状况:监视计算裸金属实例的健康状况、容量和性能
  • Oracle Cloud Infrastructure Functions :监视已部署到 Oracle Cloud Infrastructure Functions 的功能的运行状况、容量和性能。
  • 数据库健康状况:监视数据库服务的健康状况、容量和性能。

监视您的网络

网络架构师、基础设施架构师

采用在不同网络端点应用度量的机制。您可以使用内部虚拟云网络 (VCN) 以及连接(Oracle Cloud Infrastructure FastConnect 和 IPsec VPN)或负载平衡器的度量。

使用度量、预警和通知监视以下内容:

  • VNIC 度量:监视网络服务 VNIC(虚拟网络接口卡)的运行状况、容量和性能。
  • FastConnect 度量:监视内部部署网络与 VCN(Oracle Cloud Infrastructure FastConnect 连接)之间连接的运行状况、容量和性能。
  • VPN 连接度量:监视内部部署网络与 VCN(也称为 IPSec VPN)之间的连接的运行状况、容量和性能。
  • 服务网关度量:监视服务网关的运行状况、容量和性能,这使内部部署主机或 VCN 主机能够在不向公共 Internet 公开资源的情况下私下访问 Oracle 服务(例如对象存储和 Autonomous Database)。
  • 负载平衡度量:监视负载平衡器的运行状况、容量和性能,负载平衡器充当客户机和应用程序服务器之间数据通信的中介。
  • 客户房屋设备:监视网络上连接到 Oracle Cloud Infrastructure (OCI) 的边境设备的运行状况、容量和性能。
  • 启用 VCN 流日志,并根据需要使用 Oracle Cloud Logging Analytics 对其进行分析,并确定有趣的模式并获取洞察。

监视数据

云架构师、基础设施架构师、安全架构师

使用度量、预警和通知监视用于存储数据的存储服务。
  • 块存储卷度量:监视块存储卷和引导卷的吞吐量和操作。
  • 对象存储度量:监视对象存储桶的大小和对象数。
  • 文件系统度量:监视文件系统和挂载目标的健康状况、吞吐量、请求和延迟。

为每个度量创建一组预警

DevOps Architect,Infrastructure Architect

为相关服务度量创建一组预警。对于资源发出的每个度量,创建用于定义资源行为的预警。
  • 有风险。如度量值所示,资源有可能无法正常工作。
  • 非最佳。资源在非最佳级别执行,如度量值所示。
  • 资源已启动或关闭。资源无法访问或无法运行。

调整报警

DevOps Architect,Infrastructure Architect

定期查看报警,例如每周,以确保最佳配置。校准每个预警的阈值、严重性和通知详细信息,包括方法、频率和目标受众。
过宽的度量阈值将不必要地预警,而过紧的阈值将减少在中断之前采取更正操作的时间。

最佳警报配置可解决以下因素:

  • 资源的严重性。
  • 适当的资源行为。单独或在服务生态系统的上下文中评估行为。复查给定时段的度量值波动,然后根据需要调整阈值。
  • 可接受的通知噪音。评估通知方法(例如,电子邮件或 PagerDuty)、适当的收件人以及重复通知的频率。

启用服务日志记录

DevOps Architect、Infrastructure Architect、Security Architect

服务日志是由 Oracle Cloud Infrastructure (OCI) 服务发出的日志,如 API 网关、事件、函数、负载平衡、对象存储和 VCN 流日志。每个这些受支持的服务都有一个日志资源,可用于启用或禁用该服务的日志记录。
仅当需要描述如何执行和访问资源的关键诊断信息时,才启用它。

考虑使用 Oracle Cloud Logging Analytics 获取服务日志,以根据需要更好地洞察和详细分析模式和趋势。

启用 OCI 运行洞察

基础结构架构师

Oracle Cloud Infrastructure (OCI) Operations Insights 是一种 OCI 本机服务,可对自治数据库的资源利用率和容量提供 360 度洞察。

Operations Insights 包括以下集成应用程序:

  • Capacity Planning
  • Oracle SQL 仓库

启用 Oracle Cloud Guard

DevOps Architect、Infrastructure Architect、Security Architect

Oracle Cloud Guard 是一项服务,可帮助客户监视、标识、实现和维护 Oracle Cloud 的强安全状况。使用此服务可以检查 Oracle Cloud Infrastructure 资源中是否存在与配置相关的安全弱点,以及操作员和用户是否有风险活动。

确保在租户的根级别启用了 Oracle Cloud Guard 以监视所有区间。

配置审核

DevOps Architect、Infrastructure Architect、Security Architect

Oracle Cloud Infrastructure Audit 服务自动记录对所有支持的 Oracle Cloud Infrastructure (OCI) 公共应用编程接口 (API) 端点的调用作为日志事件。当前,所有服务都支持通过审计记录。

配置审计时,请查看以下内容:

  • 确保审计保留期设置为 365 天。
  • 如果您具有必须访问 OCI 审计数据的第三方工具,请配置服务连接器以将 OCI 审计数据复制到 Oracle Cloud Infrastructure Object Storage
  • 确保已正确配置存储桶上的保留期。
  • 考虑使用 OCI Log Analytics 获取审计日志的子集,以根据需要更好地洞察和详细分析模式和趋势。