向数据集应用预测模型或已注册的 Oracle Machine Learning 模型

使用数据流编辑器可以对任何数据集的预测模型进行评分,或者对相应数据库中数据集的已注册 Oracle Machine Learning 模型进行评分。

可将预测模型应用于数据,这样,无需掌握机器学习 (Machine Learning, ML) 或人工智能 (Artificial Intelligence, AI) 专业知识,就可以在应用程序中构建 ML 和 AI。
运行模型将输出一个新数据集,其中的列包含可用于分析和可视化的预测值。
在运行预测模型时,数据将移至 Oracle Analytics 进行处理。在运行已注册 Oracle Machine Learning 模型时,数据不会从数据库移至 Oracle Analytics 中。模型位于数据库中并在数据库中进行处理,输出数据集也将存储在数据库中。

在数据流中使用应用模型步骤时:

  • 已注册模型将显示,并可供复查和分析。已注销模型将不显示。

  • 可用输出列特定于模型类型。例如,对于数字预测,输出列包括 PredictedValue 和 PredictedConfidence,对于聚类,输出列包括 clusterId。

  • 可用参数特定于模型类型。例如,如果使用聚类模型进行评分,则最大空值 (maximum null values) 就是可以为评分过程提供的一个参数。此参数用于缺失值插补 (imputation)。

  • 使用 Oracle Machine Learning 模型时,模型和映射的输入数据类型必须匹配。请参见“查看已注册模型的详细信息”。

  1. 主页上,依次单击创建数据流
  2. 选择数据集并单击添加
  3. 数据流编辑器中,单击添加步骤 (+)
  4. 数据流步骤窗格,双击应用模型,然后选择要使用的模型。
  5. 应用模型中,转到输入部分,然后选择列作为输入。
  6. 应用模型中,转到输出部分,然后选择要使用数据集创建的列,并根据需要更新列名字段。
  7. 在数据流编辑器中,单击添加步骤 (+),然后选择保存数据
  8. 输入名称。在将数据保存到字段中,指定用于保存输出数据的位置。
    如果使用了 Oracle Machine Learning 模型,则数据集的连接信息将默认为输入数据集的连接。
  9. 可根据需要在处理为默认聚合字段中设置数据首选项。
    保存数据时,应用模型会将您选择的模型输出列附加到输入数据集。
  10. 单击保存,输入数据流的名称和说明,然后单击确定以保存数据流。
  11. 单击运行数据流以创建数据集。