监视您的工作量
了解并采用所有 Oracle Cloud Infrastructure 服务的监视流程。监视服务使用度量监视资源和预警,以便在度量满足警报指定的触发器时通知您。
分析操作度量
安全架构师云运营经理 Network Architect
Oracle Cloud Infrastructure Monitoring 服务可提供所需的洞察,帮助您了解资源的健康状况、优化应用性能并实时响应异常。您可以设置预警,以实时提醒您注意云基础设施和服务中的重要更改,从而快速采取适当的措施。
定义健康检查
Cloud Architect,Cloud Operations Manager,安全架构师
使用 Oracle Cloud Infrastructure Health Checks 确保您立即了解影响客户的任何可用性问题。
监视计算服务
安全架构师云运营经理
使用度量、预警和通知监视以下内容:
- 计算实例:监视计算实例的健康状况、容量和性能。
- 基础设施健康状况:监视计算裸金属实例的健康状况、容量和性能
- Oracle Cloud Infrastructure Functions :监视已部署到 Oracle Cloud Infrastructure Functions 的函数的运行状况、容量和性能。
- 数据库健康状况:监视数据库服务的健康状况、容量和性能。Oracle Cloud Observability and Management Platform 为云数据库提供统一的数据库监视和管理功能。
- 操作系统运行状况:实施 OS 级日志记录工具,例如 auditd。
监视网络
安全架构师云运营经理 Network Architect
使用度量、预警和通知监视以下内容:
- VNIC 度量:监视网络服务 VNIC(虚拟网络接口卡)的健康状况、容量和性能。
- FastConnect 度量:监视内部部署网络与 VCN(Oracle Cloud Infrastructure FastConnect 连接)之间的连接的健康状况、容量和性能。
- VPN 连接指标:监视内部部署网络与 VCN(也称为 IPSec VPN)之间的连接的健康状况、容量和性能。
- 服务网关度量:监视服务网关的健康状况、容量和性能,从而允许内部部署主机或 VCN 主机对 Oracle 服务(例如对象存储和 Autonomous Database)进行私密访问,同时不会向公共互联网公开资源。
- 负载平衡度量:监视负载平衡器的运行状况、容量和性能,负载平衡器充当客户端与应用服务器之间数据流量的中介。
- 客户终端设备:监视连接到 Oracle Cloud Infrastructure (OCI) 的网络上边界设备的运行状况、容量和性能。
- 启用 VCN 流日志并使用 Oracle Cloud Logging Analytics 摄取它们,以分析它们,识别有趣的模式并根据需要获得洞察。
使用 OCI Network Command Center 和可用工具来监视和观察您的网络。OCI 网络命令中心提供以下观测工具来支持各种操作用例:
-
网络可视化工具
提供直观的拓扑可视化,可了解虚拟网络资源之间的连接和关系,从一个位置检查配置,并直观地排除任何配置问题。
-
网络路径分析程序
可用于在出现可访问性问题时对复杂的虚拟网络配置进行故障排除。提供自动配置分析,以确定流量所采用的网络路径,确定路由和安全配置问题,并提供沿路径的配置信息。
-
区域间延迟
在 OCI 区域之间提供实时和历史延迟信息。
-
VCN 流日志
提供网络流量遥测,这对支持您的安全和网络运营用例至关重要。您可以获得有关网络流量的广泛洞察,使用 Kafka 等标准协议将流日志流式传输到您选择的工具,并将流日志归档到 OCI 对象存储中以实现合规性。VCN 流日志可以发送到 Oracle Cloud Infrastructure Logging Analytics 、 OCI Object Storage 或第三方系统。
-
虚拟测试接入点 (VTAP)
提供流量镜像功能,支持对安全分析、应用程序故障排除或网络性能问题进行完整数据包捕获。VTAP 还可用于通过分析包内容和标头来排除复杂的网络问题。
监视数据
Cloud Architect,Cloud Operations Manager,安全架构师
- 块存储卷度量:监视块存储卷和引导卷的吞吐量和操作。
- 对象存储度量:监视对象存储存储桶的大小和数量。
- 文件系统度量:监视文件系统和挂载目标的运行状况、吞吐量、请求和延迟。
为每个度量创建一组预警
DevOps Security Architect 云运营经理
- 有风险。如度量值所示,资源有无法运行的危险。
- 非最佳。资源在非最佳级别执行,由度量值指示。
- 资源已启动或已关闭。资源不可访问或无法运行。
优化预警
DevOps Security Architect 云运营经理
最佳报警配置可解决以下因素:
- 资源的严重性。
- 适当的资源行为。在服务生态系统的背景下单独评估行为。复核给定时间段的度量值波动,然后根据需要调整阈值。
- 可接受的通知噪音。评估通知方法(例如,电子邮件或 PagerDuty)、适当的收件人以及重复通知的频率。
启用服务日志记录
DevOps Security Architect 云运营经理
仅当需要描述资源执行和访问方式的关键诊断信息时才启用服务日志记录。
您可以考虑使用 Oracle Cloud Infrastructure Logging Analytics 摄取服务日志,以便根据需要更好地洞察和详细分析模式和趋势。
创建和维护日志保留策略。
启用 Oracle Cloud Infrastructure Ops Insights
安全架构师云运营经理
Oracle Cloud Infrastructure Ops Insights 包含以下集成应用:
- 容量计划
- Oracle SQL 仓库
启用 Oracle Cloud Guard
DevOps Security Architect 云运营经理
确保在租户的根级别启用 Oracle Cloud Guard 以监视所有区间。
配置审计
DevOps Security Architect 云运营经理
配置审计时,请查看以下内容:
- 检查审计保留持续时间。默认值设置为 365 天。
- 如果您有必须访问 OCI Audit 数据的第三方工具,请配置服务连接器以将 OCI Audit 数据复制到 Oracle Cloud Infrastructure Object Storage 。
- 确保已正确配置存储桶上的保留期。
- 您可以考虑使用 OCI Log Analytics 摄取部分审计日志,以便根据需要更好地洞察和详细分析模式和趋势。