步骤 3:处理映射规则

在映射过程中,调整可以改进结果,并且用户可以控制过程的处理速度。日志文件显示处理的映射规则,以及用于处理映射规则的 SQL。

这些示例中显示了用于各个维的一些通配符 * 到 * 映射规则,这些是用户可以实施的最耗时的规则。对于每个 * 到 * 规则,系统会完整遍历一次数据集,因此如果有一个百万行的数据集,并且有 5 个 * 到 * 映射规则,则会变成 5 百万行的数据库读取操作。随着行数的增加,这会大大增加映射的时间。另一个考虑因素与单次运行中处理的期间数有关,系统会针对数据集中的每个期间执行映射过程。这也会导致处理完整数据集所需时间的增加。

在此示例中,下面显示了第一条映射规则,即用于“帐户”维的 * 到 * 规则:

图中显示了第一条映射规则,即用于“帐户”维的 * 到 * 规则。

此映射规则大约在 33 秒内完成,随着该过程的继续,每条 like 规则的处理时间介于 35 到 53 秒之间。正如您所看到的,添加额外的 like 映射规则会在映射过程中持续耗费处理时间。