部署分子动态和 GROMACS 应用
使用 Oracle Cloud Infrastructure (OCI) 中提供的一系列计算框架选项(从裸金属到虚拟机 GPU 形状)部署分子动态和 GROMACS 应用程序。
GROMACS 是一种分子动力学软件,在预定义的条件下模拟生物分子原子的移动。它确定了这些生物分子在受到温度变化、压力变化和模拟活生物体实际条件的其他投入时的行为。GROMACS 可以在蛋白质折叠、蛋白质粘结和细胞膜传输方面建立模式,使它成为药物研究和发现的有用应用。
GROMACS 具有以下主要功能:
- 它主要用于蛋白质、脂肪和核酸等生物化学分子。
- 它通过许多算法优化提供了高性能。
- 它最常用 C(编译器转换为 SIMD 计算机指令)编写,并使用一个简单的接口,其中包含输入和输出文件的命令行选项。
- 它对拓扑、以明文格式编写的参数文件、一致性检查和清除错误消息非常方便。
- 它可以使用标准 MPI 通信协议或通过我们自己的单节点工作站线程 MPI 库并行运行。
- 它包括一个完全自动化的拓扑构建器。
- 免费软件,根据 GNU 更低一般公共许可证 (LGPL)2.1 版提供。
体系结构
您可以将此参考体系结构用于与深度学习和科学计算相关的多个应用程序。
深层次的学习和科学计算工作量需要专门的计算框架。Oracle Cloud Infrastructure (OCI) 提供各种选项,从裸金属到虚拟机 (VM) GPU 形状,以处理最苛刻的工作负载。NVIDIA GPU 云 (NGC) 是 Oracle Cloud Infrastructure 上可用的选项之一。
在此简单的参考体系结构中,具有块存储的 GPU 节点部署在具有公共子网和 Internet 网关的 VCN 中。块存储存储应用程序。
下图说明了此引用体系结构。
体系结构包含以下组件:
- 区域
Oracle Cloud Infrastructure 区域是一个本地化地理区域,包含一个或多个数据中心,称为可用性域。区域独立于其他区域,它们之间的巨大距离可以分开(跨越国家或甚至大陆)。
- 可用性域
可用性域是区域内的独立独立数据中心。每个可用性域中的物理资源都与其他可用性域中的资源隔离,这些资源提供故障容差。可用性域不共享基础设施,例如电源、冷却或内部可用性域网络。因此,一个可用性域的故障不可能影响该区域中的其他可用性域。
- 租户
租户是 Oracle 在注册 Oracle Cloud Infrastructure 时在 Oracle Cloud 中设置的安全和隔离分区。您可以在租户内的 Oracle Cloud 中创建、组织和管理资源。
- 区间
区间是 Oracle Cloud Infrastructure 租户内的跨区域逻辑分区。使用区间在 Oracle Cloud 中组织资源、控制对资源的访问权限以及设置使用定额。要控制对给定区间中资源的访问权限,请定义策略,以指定谁可以访问资源以及他们可以执行的操作。
- Cloud Guard
可以使用 Oracle Cloud Guard 在 Oracle Cloud Infrastructure 中监视和维护资源的安全性。Cloud Guard 使用检测器配方,您可以定义该配方来检查资源中的安全弱点,并监视操作员和用户是否有风险活动。检测到任何不正确的配置或不安全的活动时,Cloud Guard 会根据可以定义的响应方配方建议更正操作并协助执行这些操作。
- 虚拟云网络 (VCN) 和子网
VCN 是在 Oracle Cloud Infrastructure 区域中设置的可自定义、软件定义的网络。与传统的数据中心网络一样,VCN 可使您完全控制网络环境。一个 VCN 可以有多个不重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 细分为子网,子网可以被限定为区域或可用性域。每个子网包含一系列与 VCN 中的其他子网不重叠的地址。您可以在创建后更改子网的大小。子网可以是公共的或专用的。
- Internet 网关
Internet 网关允许 VCN 中的公共子网与公共 Internet 之间的通信。
- 路由表
虚拟路由表包含用于将流量从子网路由到 VCN 外部的目标的规则,通常是通过网关路由。
- 安全列表
对于每个子网,可以创建安全规则,以指定必须允许进出子网的源、目标和流量类型。
- 计算
使用 Oracle Cloud Infrastructure 计算服务可以预配和管理云中的计算主机。您可以使用符合资源要求(CPU、内存、网络带宽和存储)的形状启动计算实例。创建计算实例后,可以安全地访问该实例,重新启动该实例,附加和分离卷,并在不需要时终止该实例。
- 裸金属 GPU
使用裸金属 GPU 形状进行硬件加速分析和其他计算。
- 块存储卷
使用块存储卷,您可以创建、附加、连接和移动存储卷,以及更改卷性能以满足存储、性能和应用程序要求。将卷连接到实例后,可以像常规硬盘一样使用该卷。还可以断开卷的连接并将其附加到其他实例而不丢失数据。
建议
使用以下建议案作为起点,使用 Oracle Cloud Infrastructure 上的任意一系列计算框架选项部署分子动态应用程序。
您的要求可能与此处描述的体系结构不同。
- VCN
创建 VCN 时,根据计划附加到 VCN 中子网的资源数确定所需的 CIDR 块数和每个块的大小。使用标准专用 IP 地址空间内的 CIDR 块。
选择不与您要设置专用连接的任何其他网络(在 Oracle Cloud Infrastructure、内部部署数据中心或其他云提供商中)重叠的 CIDR 块。
创建 VCN 后,可以更改、添加和删除其 CIDR 块。
设计子网时,请考虑流量和安全要求。将特定层或角色中的所有资源附加到可用作安全边界的同一子网。
使用区域子网。
- 安全列表
使用安全列表定义适用于整个子网的入站和出站规则。
- Cloud Guard
克隆并定制 Oracle 提供的默认配方以创建定制检测器和响应器配方。使用这些配方可以指定哪些类型的安全违规生成警告,以及允许对其执行的操作。例如,您可能希望检测可见性设置为 public 的对象存储桶。
在租户级别应用 Cloud Guard 以覆盖最广泛的范围,并减少维护多个配置的管理负担。
您还可以使用“托管列表”功能将某些配置应用于检测器。
- 裸金属 GPU
使用裸金属形状 BM.GPU2.2 或 BM.GPU3.8 可获得最佳性能。
考虑事项
部署分子动态应用程序时,请考虑以下事项:
- 性能
要获得最佳性能,请选择具有相应带宽的正确计算形状。
- 可用性
考虑根据您的部署要求和区域使用高可用性选项。选项包括在区域中使用多个可用性域和使用故障域。
- 成本
裸金属 HPC 实例为更高的成本提供必要的 CPU 功率。评估需求以选择适当的计算形状。
- 监视和预警
为节点设置 CPU 和内存使用情况的监视和预警,以便您可以根据需要向上或向下扩展配置。
部署
GitHub 上提供了此引用体系结构的 Terraform 代码。单击一次即可将代码拉入 Oracle Cloud Infrastructure Resource Manager,创建堆栈并部署该堆栈。或者,您可以使用 Terraform CLI 将代码从 GitHub 下载到计算机,定制代码并部署体系结构。
- 使用 Oracle Cloud Infrastructure Resource Manager 中的示例堆栈进行部署:
- 在 GitHub 中使用 Terraform 代码进行部署:
- 转到 GitHub。
- 将资料档案库克隆或下载到本地计算机。
- 按照
README文档中的说明操作。
