部署 Lustre File System
- 使用 Lustre 文件系统创建 OCI 文件存储
- 挂载文件系统
- 配置 LNet
- 测试读写操作
创建 Lustre 文件系统
以下步骤将介绍如何使用 Lustre 文件系统创建 OCI 文件存储。
- 在 OCI 控制台导航菜单中,单击存储,然后单击 Lustre file systems 。
- 单击创建。
- 配置 Lustre 文件系统详细信息:
- 文件系统名称:接受默认名称或输入文件系统的友好名称。
- 挂载名称:接受默认值或输入友好名称以在挂载文件系统时使用。
- 文件系统说明:(可选)输入文件系统的说明。
- 区间:接受默认区间,或选择列表以更改区间。
- 可用性域:接受默认可用性域,或选择列表以更改可用性域。
- 标记:如果您有权创建资源,则还有权对该资源应用自由格式标记。要应用定义的标记,您必须有权使用标记名称空间。如果您不确定是否应用标记,请跳过此选项或向管理员咨询。稍后可以应用标记。
- 集群放置组:建议选择一个集群放置组,以将文件系统和其他资源物理放置在可用性域中,以确保低延迟。创建文件系统后,无法更改群集放置组。
- 性能层:为文件系统选择性能层。性能层控制文件系统的吞吐量。吞吐量按预配存储的每 TB 指定。创建文件系统后,无法更改性能层。
- Capacity(容量):选择文件系统的存储容量。如果选择大于服务限制的容量,可能会提示您请求增加容量。
文件系统的聚合吞吐量根据性能层和容量计算得出。
- 网络:选择要在其中挂载文件系统的 VCN 和子网。默认情况下,控制台显示您正在使用的区间中的 VCN 和子网列表。更改区间以从其他区间中选择 VCN 或子网。
选定的子网将是用于部署 Lustre 服务器的子网。确保此子网允许在端口 512-1023 之间使用客户端端口与 Lustre 服务器端端口 988 通信。
- 使用网络安全组控制流量:启用此选项并选择网络安全组 (NSG) 作为文件系统的虚拟防火墙。选择 + 另一个网络安全组可将文件系统添加到最多五个 NSG。
- 根压缩:这些设置控制访问文件系统的客户机的用户 ID (UID) 和组 ID (GID) 是否重新映射到 Squash UID 和 Squash GID 。
压缩:选择无或根。缺省值为 None ,因此缺省情况下不执行重新映射。
压缩 UID :如果将 Squash 设置为 Root ,则 root 用户 (UID 0) 将重新映射到此值。默认值为 65534。
压缩 GID :如果将 Squash 设置为 Root ,则根组用户 (GID 0) 将重新映射到此值。默认值为 65534。
- 根压缩异常:要从根压缩配置中排除特定客户机,请输入其客户机地址作为有效的 IP 地址或范围。例如 10.0.2.4 或 10.0。[2-10]。[1-255]。选择 + 其他客户机地址可添加最多 10 个例外。
- 加密密钥:默认情况下,Oracle 管理加密文件系统的密钥。如果您希望更好地控制密钥的生命周期及其使用方式,可以选择自己的 Vault 加密密钥
配置 LNet (Lustre Networking)
lnetctl net show
中时,才需要执行以下步骤。如果 lnetctl net show
显示了 Lustre 的正确接口,则不需要这些步骤。
测试读取和写入操作
我们将通过运行 dd
命令来测试读写,然后导航到度量页以查看度量仪表盘。
- ReadThroughput:以每分钟读取的字节数表示。
- WriteThroughput:以每分钟读取的字节数表示。
- DataReadOperations:每分钟的读取操作数。
- DataWriteOperation:每分钟的写入操作数。
- MetadataOperations:元数据操作数。14 个不同的元数据操作可用维,例如 getattr,setattr,mknod,link,unlink,mkdir 等。
- FileSystemCapacity:文件系统的总容量和可用容量。
- FileSystemInodeCapacity:文件系统的总 inode 和可用 inode。
可以使用 OCI 度量浏览器 oci_lustrefilesystem
名称空间浏览这些度量,如下面的屏幕截图所示。
插图 lustre-metrics-explorer.png 的说明
下面是如何在度量浏览器或其他仪表盘(如 Grafana)中使用监视查询语言 (Monitoring Query Language,MQL) 中的查询的示例。
要获取读取吞吐量,请执行以下操作:
ReadThroughput[1m]{resourceId = "your_filesystem_ocid", targetType = "OST", clientName ="all@all"}.grouping().sum()/60
注意:
使用 60 是因为此处的间隔为 1 分钟。同样,您也可以将 MQL 用于其他度量。