解决 Oracle Cloud Infrastructure 中的基本网络问题

简介

在 Oracle Cloud Infrastructure (OCI) 中,诊断网络连接问题需要了解多个组件之间的流量配置和流量。OCI Network Command Center 工具(例如 Network Visualizer、Network Path Analyzer 和 VCN Flow Log)可深入洞察网络资源的布局、路由和流行为。这些工具可以快速识别 OCI 网络环境中虚拟云网络 (Virtual Cloud Network,VCN)、子网和网关中的错误配置、缺少的路由和通信故障。

在本教程中,我们将重点介绍常见连接问题的基本故障排除技术。虽然它展示了如何有效地使用这些工具来简化故障排除并有效地解决问题,但其目标是更广泛地了解如何处理和分析连接挑战,而不仅仅是如何使用这些工具本身。

图像

目标

Prerequisites

任务 1:使用 Network Visualizer 查看网络设置

在您开始深入了解损坏的内容之前,它有助于退后一步并清楚地了解您的网络环境。OCI 中的网络可视化工具提供 VCN 拓扑的图形表示。虽然它不会直接解决问题,但可以在您选择的特定区间中清晰地整合整个网络架构视图。

此可视化上下文显示了如何将所有内容集中在一个位置进行连接(VCN、子网、网关、路由表和安全列表)。这样,您可以更轻松地发现任何脱节的内容,例如缺少的路由或未与动态路由网关 (Dynamic Routing Gateway,DRG) 关联的 VCN。在复杂的设置中,它可以为您节省大量猜测。它并不总是一种修复,但它是一个坚实的第一步,可以在你进入细节之前将你指向正确的方向。

对于本教程,我们在下图中总结了网络可视化工具的工作原理。有关更多信息,请参见 Network Visualizer

图像

范例

我们将使用以下体系结构作为示例。

图像

在本例中,环境出现了两个问题。我们将看到网络可视化工具如何帮助识别和解决它们。

让我们使用 OCI 控制台中的 Network Visualizer 快速浏览网络环境,这应该反映架构。

第一层:区域网络拓扑

此拓扑包括 DRG、VCN、CPE 和各种类型的网关。

图像

图像

  1. 单击 VCN-2

  2. 现在,让我们从路由映射开始,更深入地了解 VCN 拓扑

图像

第二层:VCN 拓扑

此拓扑包括子网、VLAN 和到其他资源的网关。除了子网使用的安全规则(安全列表或 NSG)外。

  1. 我们位于 VCN 路由映射视图中。
  2. VCN-2 由一个专用子网组成。
  3. 我们可以在子网的路由表中看到一条规则,该规则将发送到 VCN-1 的流量作为下一个跃点发送到 DRG。

图像

  1. 切换到 VCN 安全映射视图。
  2. 我们还可以在此视图中看到 VCN-2 包含一个专用子网。
  3. 此外,在此模式下,连接到专用子网的安全列表和网络安全组 (NSG) 也可见。

图像

  1. 单击专用子网。
  2. 现在,让我们从清单映射开始,更深入地了解子网拓扑

图像

第三层:子网拓扑

此拓扑显示有关子网中 OCI 计算实例、OCI 负载平衡器、OCI 文件存储服务和 OCI Kubernetes 引擎 (OKE) 集群的资源信息,以及资源使用的安全规则。

  1. 我们位于子网库存映射视图中。
  2. 此子网中只有一个计算实例 (VM-2),请单击它。
  3. 您可以查看有关 VM 的某些信息,例如区间、IP 等。

图像

  1. 切换到子网 Security 映射视图。
  2. 此子网中只有一个计算实例 (VM-2)。
  3. 我们看到 VM-2 使用的是哪些安全列表和 NSG。

图像

概要:

我们已经探讨了我们的网络环境如何以及涉及的组件,您认为前面提到的问题的根本原因是什么?

任务 2:验证网络配置

在清楚地了解您的网络环境以及您拥有的组件后,下一个重要步骤是验证实际配置。许多连接问题归结为一些简单的问题;缺少的路由,过于严格的安全规则,或者只是链接到错误的路由表或安全列表的子网。

在进行更深入的故障排除(如检查日志或运行数据包捕获)之前,务必确保按预期配置所有内容。此步骤通常可以提前揭示根本原因,并帮助您避免以后进行不必要的调查。

范例

我们将使用以下体系结构作为示例。

图像

首先,让我们概述在验证配置中发挥核心作用的核心路由和安全组件:

  1. 工艺路线规则:

    • 内部部署:

      • RT-0:在 FastConnect 或 IPSec 连接的情况下,本地客户终端设备 (CPE) 设备(或多云)的路由(请参阅供应商:Cisco、Fortinet 等)。
    • OCI VCN 路由表:存在于 VCN 中,用于将流量从 VCN 发送(例如,向互联网、向内部部署网络或对等 VCN 发送)。这些路由表具有类似于您可能已经熟悉的传统网络路由规则的外观和行为规则。

      • RT-1-2-3:分配给子网级别的 VCN 路由表,以便对传出通信进行路由。
      • RT-2a:分配给 DRG VCN-2 附加的 VCN 路由表(传输路由方案需要此表),在此示例中,它用作入站路由表,用于将来自 DRG 的流量路由到防火墙进行检查。
      • RT-2b:附加到 NAT 网关的 VCN 路由表,在本例中,它用作入站路由表,用于将响应流量从 Internet 路由回防火墙进行检查。
    • OCI DRG 路由表:存在于 DRG 中,用于通过附加路由进入 DRG 的包。

      • RT-10-20-30:VCN 附加的 DRG 路由表,用于路由来自 VCN 的流量。
      • RT-40-50:用于 RPC 附加的 DRG 路由表,用于路由来自其他区域的通信。
      • RT-60:用于 IPSec 附加的 DRG RT,用于路由来自内部部署或多云网络的流量。
  2. 安全规则:

    • 内部部署:

      • FW-0:在 FastConnect 或 IPSec 连接(请参阅供应商:Cisco、Fortinet 等)的情况下,控制和限制内部部署 CPE 设备(或多云)上与 OCI 的流量流。
    • OCI VCN 安全列表:充当基于 VCN 的资源的虚拟防火墙,以及指定允许进出通信类型的入站和出站规则。安全列表是在子网级别配置的,这意味着子网中的所有 VNIC 都受到同一组安全列表的约束。

      • SL-1-2-3:为控制每个子网上的入站和出站流量而分配到子网级别的安全列表。

    注: NSG 是 OCI 中提供的另一种虚拟防火墙。它们的功能与安全列表类似,但提供更细粒度的控制,因为它们在资源级别应用。当同一子网中的两个资源需要不同的安全状态时,这非常有用。但是,本教程不使用 NSG。有关详细信息,请参阅安全列表和网络安全组的比较

    • OCI Network Firewall 或第三方防火墙:充当子网、VCN 和外部网络之间流量的集中有状态检查点,可执行高级安全策略,但超出基本安全列表规则。

      • FW-2:在 OCI 网络环境中控制和检查所有南北和西北流量。

我们了解如何将路由和安全性应用于整个环境,让我们仔细查看以下示例案例,其中出现了四个问题。通过应用一些常识,我们将找出要检查的配置,以及每个故障排除场景的位置。

注:

了解如何在整个网络中管理和控制流量至关重要。通过跟踪应采取的路径流量,您可以快速确定可能出现问题的位置以及在故障排除时需要查看哪些设置。

任务 3:使用网络路径分析器

您查看了整体网络设置,手动检查了路由和安全规则的配置。但是,问题仍然存在,也许您忽略了一些配置详细信息,那么下一步是什么?

这就是网络路径分析器所在的位置。可以将其视为您的虚拟网络检测器,该检测器旨在实时检查 OCI 网络路由和安全配置。它收集并分析它们,以确定源和目标之间的路径将如何运行或失败。不发送实际流量,而是检查配置并使用该配置来确认可访问性。

通过网络路径分析器,您可以直接在 OCI 控制台中验证通信路径的配置,从而提供更高效的集中式故障排除方法,而无需从单个 VM 或数据库执行 ping 或 telnet 等手动连接测试。

网络路径分析器支持以下方案:

示例 1

我们将使用以下体系结构作为示例。

图像

我们遇到了网络问题,我们将使用网络路径分析器来跟踪和解决根本原因。

问题:VM-1 无法访问托管在 VM-2(OCI 到 OCI)上的网站

示例 2

我们将使用以下体系结构作为示例。

图像

我们遇到了网络问题,我们将使用网络路径分析器来跟踪和解决根本原因。

问题:VM-2 无法安装 telnet 软件包(OCI 到 Internet)

注: Telnet 是一种网络协议和命令行工具,用于通过网络远程访问和管理设备。它也用于基本网络测试(例如,检查端口是否处于打开状态)。

任务 4:分析 VCN 流日志

VCN 流日志提供了对流量行为的额外可见性层。通过此服务,您可以向下钻取到击中每个 VNIC 的实际流量,并根据安全列表和 NSG 规则指示该流量是被接受还是被拒绝,从而帮助您排除与安全相关的问题。

除了故障排除之外,VCN 流日志对于监视网络活动、捕获源/目标 IP、端口、协议和时间戳至关重要,并提供了审计和安全调查所需的详细遥测。

范例

我们将使用以下体系结构作为示例。

图像

注:在此示例中,我们仅关注在目标所在的 Y 点进行日志记录。但是,您可以应用相同的步骤来启用和分析 X 点(通信源)的日志,以进一步了解整个通信流。

我们遇到网络问题,将使用 VCN 流日志跟踪和解决根本原因。

问题:VM-1 无法访问 VM-2 上托管的网站

后续步骤

我们探讨了如何通过检查架构、路由和安全配置来排除 OCI 中的基本网络问题。这些核心检查有助于解决最常见的连接问题。下一教程将重点介绍高级场景和更多实际用例。

确认

更多学习资源

通过 docs.oracle.com/learn 浏览其他实验室,或者通过 Oracle Learning YouTube 频道访问更多免费学习内容。此外,请访问 education.oracle.com/learning-explorer 以成为 Oracle Learning Explorer。

有关产品文档,请访问 Oracle 帮助中心