专用 Exadata 基础结构上的自治 AI 数据库中的计算管理

专用 Exadata 基础结构上的自治 AI 数据库在配置自治 AI 数据库资源时提供了两个计算模型。它们是:

自治 Exadata VM 集群的计算类型适用于其所有自治容器数据库和自治 AI 数据库实例。

计算管理

自治 AI 数据库实例部署到自治 Exadata VM 集群 (AVMC) 中,并部署到其子自治容器数据库 (ACD) 中。Exadata 基础结构能够运行多个 AVMC。预配 AVMC 资源时分配的 CPU 是其自治 AI 数据库可用的总 CPU 。创建多个 AVMC 时,每个 AVMC 可以具有自己的总 CPU 值。

在启动多个 VM 自治 AI 数据库功能之前创建的 Exadata 基础结构 (EI) 资源的任何 Oracle Public Cloud 部署上都无法使用多个 VM 自治 Exadata VM 集群。对于在启动多个 AVMC 功能后创建的 X8M 代及以上 Exadata 基础结构资源,每个 AVMC 都会为您选择的 Exadata 系统配置的每个服务器创建一个集群节点。有关在不同用户组中约束这些总 CPU 的信息,请参见“区间配额如何影响 CPU 管理”。

注:在给定的 Exadata 基础结构上可以创建的最大 AVMC 和 ACD 资源数因硬件生成而异。有关每一代约束的详细信息,请参阅资源限制基础设施配置的特性

在 AVMC 或 ACD 级别,可用于创建数据库的 CPU 总数称为可用 CPU 。在 AVMC 资源级别,可用 CPU 将等于 CPU 总数,直到您创建第一个 ACD。创建 ACD 后,每个节点 8 个 ECPU 或 2 个 OCPU 会从 AVMC 的可用 CPU 分配给新 ACD。因此,AVMC 资源级别的可用 CPU 会相应减少。在该 ACD 中创建第一个自治 AI 数据库时,新数据库会占用最初分配的 CPU(每个节点 8 个 ECPU 或 2 个 OCPU)。如果新数据库需要超过 8 个 ECPU 或 2 个 OCPU,则它们将从父 AVMC 的可用 CPU 进行分配,方法是减少父 AVMC 级别的可用 CPU。在每个 ACD 中创建更多 ACD 并预配自治 AI 数据库时,可用的 CPU 值会相应发生变化。

自治 Exadata VM 集群级别的可用 CPU 应用于其所有自治容器数据库。如果使用自动缩放功能,则容器数据库可用的 CPU 计数将变得重要,如“自动缩放时 CPU 分配”中所述。

同样,当您手动扩展自治 AI 数据库的 CPU 时,CPU 将从其父 AVMC 级别的可用 CPU 中消耗,并且其值会相应地更改。

创建自治 AI 数据库时,默认情况下,Oracle 会预留更多 CPU,以确保即使节点发生故障,数据库也能以至少 50% 的容量运行。在预配 ACD 时,您可以将节点间预留的 CPU 百分比更改为 0% 或 25%。有关说明,请参见 Create an Autonomous Container Database 中的节点故障转移保留。这些额外的 CPU 不包括在计费中。

当自治 AI 数据库运行时,将按当前分配给数据库的 CPU 数计费(无论是在初始创建时指定还是以后通过手动缩放操作指定)。此外,如果为数据库启用了自动缩放,则系统会针对数据库自动缩放后所使用的任何其他 CPU 每秒向您收取费用。有关如何测量和计算计费的详细信息,请参阅 CPU 计费详细信息

当自治 AI 数据库停止时,不会对您计费。但是,对于整个部署,分配给它的 CPU 数不会返回到其父 AVMC 级别的可用 CPU。

终止或缩减自治 AI 数据库后,分配给自治 AI 数据库的 CPU 数不会立即返回到其父 AVMC 级别的可用 CPU,以便进行整体部署。在重新启动父容器数据库之前,它们将继续包含在可供其父容器数据库使用的 CPU 计数中。这些 CPU 称为可回收 CPU 。父 AVMC 级别的可回收 CPU 是其所有 ACD 的可回收 CPU 的总和。当 ACD 重新启动时,它将其所有可回收 CPU 返回到其父 AVMC 级别的可用 CPU。

重新启动自治容器数据库 (Autonomous Container Database,ACD) 是一项联机操作,可在整个集群中以滚动方式完成,如果根据使用透明应用连续性的优秀实践进行配置,则不会导致应用停机。

提示:您可以从自治 Exadata VM 集群 (AVMC) 或自治容器数据库 (ACD) 的详细信息页面中跟踪本文中讨论的不同计算 (CPU) 属性。有关指导,请参阅资源使用情况跟踪

自动缩放时 CPU 分配

通过自动缩放功能,自治 AI 数据库的 CPU 和 IO 资源使用量是其分配的 CPU 计数的 3 倍。如果 CPU 预配过多,如果 CPU 计数的三倍导致值小于 1,则会将该值舍入到下一个整数。仅 OCPU 支持 CPU 超额预配。有关详细信息,请参阅 CPU 过量供应

为了确保没有单个自治 AI 数据库可以自动扩展以使用池中可用于整体部署的所有 CPU,Oracle Autonomous AI Database on Dedicated Exadata Infrastructure 使用自治容器数据库作为限制控制。

在 ACD 中预配启用了自动缩放的自治 AI 数据库时,如果该 ACD 中的可用 CPU 小于新数据库的 3 倍 CPU 值,则会在该 ACD 中预留其他 CPU。这些 CPU 称为保留的 CPU 。保留的 CPU 可确保 ACD 级别的可用 CPU 始终大于或等于该 ACD 中启用了自动缩放的最大数据库的 3 倍 CPU 值。这些预留的 CPU 仍可用于在此 ACD 中创建或手动缩放自治 AI 数据库。

自动扩展自治 AI 数据库时,Oracle Autonomous AI Database on Dedicated Exadata Infrastructure 在其父容器数据库中查找空闲 CPU。如果有空闲 CPU 可用,则会扩展自治 AI 数据库;否则,不会扩展。数据库本身具有大量空闲时间,因此自动缩放是最大限度提高资源使用率的一种方式,同时可以控制成本并保持与其他自治容器数据库中的数据库的良好隔离。

如果用于自动缩放自治 AI 数据库的 CPU 来自另一个正在运行的轻负载自治 AI 数据库,因此未使用其所有分配的 CPU,则 Oracle Autonomous AI Database on Dedicated Exadata Infrastructure 会自动缩放自动缩放的数据库,前提是负载在另一个数据库上增加,并且它需要重新分配 CPU。

以托管四个运行 4-CPU 自治 AI 数据库的自治容器数据库为例,所有这些数据库都启用了自动缩放。容器数据库可用于自动缩放的 CPU 数量为 12。如果由于负载增加而需要将其中一个数据库自动缩放到 4 个 CPU 以上,则 Oracle Autonomous AI Database on Dedicated Exadata Infrastructure 仅当一个或多个其他数据库轻量加载而未使用所有分配的 CPU 时才会执行自动缩放操作。此示例的计费成本至少为 16 个 CPU,因为所有四个 4-CPU 数据库都在运行。

相比之下,假设自治容器数据库托管四个运行的 2-CPU 自治 AI 数据库,所有数据库都启用了自动缩放,一个数据库停止了 8-CPU 自治 AI 数据库。容器数据库可用于自动缩放的 CPU 数量再次为 16。如果某个正在运行的数据库由于负载超过 2 个 CPU 而需要自动缩放,则 Oracle Autonomous AI Database on Dedicated Exadata Infrastructure 可以使用分配给已停止的 8-CPU 数据库的 CPU 执行操作。在此示例中,四个正在运行的数据库最多可以同时使用 8 个额外的 CPU,而不会占用彼此分配的 CPU。此示例的计费成本仅为 8 个 CPU,因为只有四个 2-CPU 数据库始终在运行。

对于任何自治数据卫士服务实例(本地或跨区域),额外定价为您在创建或显式缩放主服务实例时预留的 ECPU 或 OCPU 数,无论是否启用自动缩放。Autonomous Data Guard 备用服务实例上不会在主服务实例上发生与自动缩放相关的 ECPU 或 OCPU 使用情况。

区间配额如何影响 CPU 管理

通常,当您创建或扩展自治 AI 数据库时,基于专用 Exadata 基础结构的 Oracle Autonomous AI Database 满足您的请求的能力仅取决于整个部署中单个 CPU 池中未分配的 CPU 的可用性。

但是,您可以使用 Oracle Cloud Infrastructure 的区间配额功能按区间进一步限制可用于创建、手动缩放和自动缩放每个工作负载类型(自治 AI 数据湖仓或自治 AI 事务处理)的自治 AI 数据库的 CPU 数量。

简而言之,您可以通过创建 setunsetzero 策略语句来使用区间配额功能,以限制给定区间中给定资源的可用性。有关详细信息和说明,请参阅区间限额

VM 集群节点如何影响 CPU 管理

上面关于 CPU 管理和分配状态的讨论指出,您可以通过在预配 AVMC 资源时选择每个节点的 CPU 计数来创建多个自治 Exadata VM 集群 (AVMC) 资源。

本节将详细介绍 Oracle Cloud Infrastructure 如何将自治 AI 数据库放置在 VM 集群节点中,以及此类放置对自动缩放和并行处理的后果。

以下属性确定自治 AI 数据库在多个节点上的放置时间和方式:

自治 AI 数据库的 CPU 分配如何分布在 VM 集群节点中会影响以下操作:

根据每个节点上的资源利用率;并非所有可用 CPU 值都可用于预配或扩展自治 AI 数据库。例如,假定您在 AVMC 级别有 20 个 CPU 可用,但并非 1 到 20 个 CPU 的所有值都可用于预配或扩展自治 AI 数据库,具体取决于节点级别的资源可用性。可用于预配或缩放自治 AI 数据库的 CPU 值列表称为可预配 CPU

当您尝试从 OCI 控制台预配或扩展自治 AI 数据库时,“CPU(CPU)”字段将为您提供包含可预配 CPU 列表的下拉列表。或者,可以使用以下 API 获取临时 CPU 值列表:

相关内容