使用带有 Oracle Cloud Guard 的 Altair HyperWorks 设置 CAE 环境

将工程师从内部部署硬件限制免费,以便他们可以在几乎任何设备的任何地方随地运行大规模工程模拟。

Altair HyperWorks 是一个在 Oracle Cloud Infrastructure 上运行的工程软件套件,使工程师可以构建模型并对不同的性能要求执行工程分析和设计优化。Oracle Cloud Infrastructure 提供了启用远程直接内存访问(remote direct Memory Access, RDMA)的集群网络和 bare-metal Performance Management Performance Calc (HPC)实例。Oracle Cloud Infrastructure 现在将其经过验证的 HPC 实例与低延迟网络组合起来,该网络可能跨越多于 20,000 个核心。

此外,Altair 还提供名为 Altair HyperWorks 无限制的托管服务,该服务与提供的此部署类似:

  • 缩短设计时间:公司可以根据需要访问软件和硬件,从而减少设计时间并将产品带到市场中。

  • 不等待:使用来自 Oracle 和 Altair 的此按需解决方案,工程师不必等待作业队列,也不必等待长的 HPC 硬件采购周期。

  • 灵活的许可:备选空气的创新许可模式允许客户在托管服务环境中使用无限制的软件许可证。

体系结构

此体系结构部署一个主节点,该节点运行调度程序、设置和取消设置高性能计算 (HPC) 计算节点群集,并预处理一些客户数据。在 HPC 计算节点群集中完成工作,结果存储在文件存储中。

此体系结构是使用专用虚拟云网络(VCN)部署的。客户网络只能通过 IPSec VPN 或 FastConnect 访问机头节点。此限制提供对机头节点的控制访问。但是,对于特定用例,客户可以选择在公共子网中部署此体系结构,此处机头节点也可从公共互联网访问。

体系结构还使用 Oracle Cloud Guard,该 Oracle Cloud Guard 持续监视配置和活动,以识别威胁,并自动在区间级别修复问题。

该体系结构使用具有一个可用性域和区域子网的区域。可以在一个区域中将同一体系结构用于多个可用性域。我们建议您使用区域子网进行部署,而不管可用性域数如何。

注:

如果使用 FastConnect,请将文件存储挂载到内部部署节点,以便加快数据集的传输速度。如果使用 IPSec VPN,请首先将数据传输到对象存储(由于速度和连接变化),然后将其传输到文件存储。

体系结构具有以下组件:



  • 区域

    Oracle Cloud Infrastructure 区域是包含一个或多个数据中心(称为可用性域)的本地化地理区域。区域独立于其他区域,其距离很广(跨越国家或甚至大陆)。

  • 可用性域

    可用性域是区域中独立的数据中心。每个可用性域中的物理资源都与其他可用性域中的资源隔离,可提供容错能力。可用性域不共享基础设施(如电源或冷却)或内部可用性域网络。因此,一个可用性域出现故障不太可能影响该区域中的其他可用性域。

  • 容错域

    故障域是可用性域中的一组硬件和基础结构。每个可用性域都有三个具有独立电源和硬件的故障域。在多个故障域之间分配资源时,应用程序可以容忍故障域中的物理服务器故障、系统维护和电源故障。

  • 虚拟云网络(VCN)和子网

    VCN 是在 Oracle Cloud Infrastructure 区域中设置的可定制的软件定义网络。与传统的数据中心网络一样,VCN 为您提供了对网络环境的完全控制。VCN 可以有多个非重叠 CIDR 块,您可以在创建 VCN 后更改这些块。可以将 VCN 细分为子网,子网可限定为区域或可用性域。每个子网包含一系列与 VCN 中的其他子网不重叠的地址。您可以在创建后更改子网的大小。子网可以是公共的或专用的。

  • 标头节点

    使用基于 Web 的门户连接到主机节点并调度 HPC 作业。作业请求通过 FastConnect 或 IPSec VPN 访问机头节点。机头节点还将客户数据集发送到文件存储,并且可在数据上执行一些预处理。

    主机节点在作业完成时预配 HPC 节点集群和取消设置 HPC 集群。

  • HPC 集群节点

    标头节点预配和取消设置这些计算节点(即启用 Rdma 的群集)。他们处理文件存储中存储的数据并将结果返回到文件存储。

  • Cloud Guard

    可以使用 Oracle Cloud Guard 监视和维护云中资源的安全性。Cloud Guard 将检查您的资源中是否存在与配置相关的安全弱点,并监视操作员和用户是否有风险活动。在确定任何安全问题或风险时,Cloud Guard 建议更正操作,并根据您可以定义的安全配方帮助您执行这些操作。

  • 文件存储

    文件存储服务文件系统在机头节点和 HPC 群集节点上均挂载。它在 HPC 集群节点处理数据之后存储客户数据集和结果。

  • 安全列表

    对于每个子网,您都可以创建安全规则来指定子网中必须允许的源、目标以及流量类型。

建议

您的要求可能不同于此处所述的体系结构。使用以下建议作为起点。

  • VCN

    创建 VCN 时,根据计划附加到 VCN 中子网的资源数确定所需的 CIDR 块数和每个块的大小。使用标准专用 IP 地址空间内的 CIDR 块。

    选择不与您打算设置专用连接的任何其他网络(在 Oracle Cloud Infrastructure、内部部署数据中心或其他云提供商中)重叠的 CIDR 块。

    创建 VCN 后,可以更改、添加和删除其 CIDR 块。

    设计子网时,请考虑流量和安全要求。将特定层或角色中的所有资源附加到可用作安全边界的同一子网。

    使用区域性子网。

  • 安全列表

    使用安全列表可定义应用到整个子网的入站和出站规则。

  • Cloud Guard

    克隆并定制 Oracle 提供的默认配方以创建定制检测器和响应器配方。使用这些配方可以指定哪些类型的安全违规生成警告以及允许对其执行的操作。例如,您可能希望检测可见性设置为 public 的对象存储桶。

    在租户级别应用 Cloud Guard 以涵盖最广泛的范围,并减少维护多个配置的管理负担。

    您还可以使用“托管列表”功能将某些配置应用于检测器。

  • 标头节点

    使用 VM.DenseIO2.24 计算配置。它提供本地附加的 Nnvme 存储,以加快数据预处理速度。

    头节点仅存在于启用 Cloud Guard 的区间中。您可以根据任何特定要求克隆和修改检测器和响应者的默认配方。建议您按原样使用默认配方。

  • HPC 集群节点

    使用 BM.HPC2.36 计算配置。此配置包含来自两个 3.7GHz Intel Xeon Gold 6154 处理器、384-GB RAM 和 6.4-TB NVME 本地存储的 36 个核心。通过使用 Oracle Cloud Infrastructure 上提供的强大的 NVIDIA GPU,您可以通过远程可视化在云上过后处理结果。

    HPC 集群节点仅存在于启用 Cloud Guard 的区间中。您可以根据任何特定要求克隆和修改检测器和响应者的默认配方。建议您按原样使用默认配方。

考虑事项

部署此引用体系结构时,请考虑以下事项。

  • 性能

    要获得最佳性能,请选择具有相应带宽的正确计算配置。

  • 可用性

    请考虑根据部署要求和区域使用高可用性选项。选项包括在区域和容错域中使用多个可用性域。

  • 成本

    裸金属 GPU 实例为更高的成本提供必要的 CPU 功率。评估需求以选择适当的计算配置。

  • 监视和预警

    设置节点的 CPU 和内存使用量的监视和预警,以便可以根据需要扩展配置。

更改日志

此日志列出了重大更改: