使用数据流编辑器可以对任何数据集的预测模型进行评分,或者对相应数据库中数据集的已注册 Oracle Machine Learning 模型进行评分。
可将预测模型应用于数据,这样,无需掌握机器学习 (Machine Learning, ML) 或人工智能 (Artificial Intelligence, AI) 专业知识,就可以在应用程序中构建 ML 和 AI。
运行模型将输出一个新数据集,其中的列包含可用于分析和可视化的预测值。
在运行预测模型时,数据将移至 Oracle Analytics 进行处理。在运行已注册 Oracle Machine Learning 模型时,数据不会从数据库移至 Oracle Analytics 中。模型位于数据库中并在数据库中进行处理,输出数据集也将存储在数据库中。
在数据流中使用应用模型步骤时:
-
已注册模型将显示,并可供复查和分析。已注销模型将不显示。
-
可用输出列特定于模型类型。例如,对于数字预测,输出列包括 PredictedValue 和 PredictedConfidence,对于聚类,输出列包括 clusterId。
-
可用参数特定于模型类型。例如,如果使用聚类模型进行评分,则最大空值 (maximum null values) 就是可以为评分过程提供的一个参数。此参数用于缺失值插补 (imputation)。
-
使用 Oracle Machine Learning 模型时,模型和映射的输入数据类型必须匹配。请参见“查看已注册模型的详细信息”。
- 在主页上,依次单击创建和数据流。
- 选择数据集并单击添加。
- 在数据流编辑器中,单击添加步骤 (+)。
- 从数据流步骤窗格,双击应用模型,然后选择要使用的模型。
- 在应用模型中,转到输入部分,然后选择列作为输入。
- 在应用模型中,转到输出部分,然后选择要使用数据集创建的列,并根据需要更新列名字段。
- 在数据流编辑器中,单击添加步骤 (+),然后选择保存数据。
- 输入名称。在将数据保存到字段中,指定用于保存输出数据的位置。
如果使用了 Oracle Machine Learning 模型,则数据集的连接信息将默认为输入数据集的连接。
- 可根据需要在处理为和默认聚合字段中设置数据首选项。
保存数据时,应用模型会将您选择的模型输出列附加到输入数据集。
- 单击保存,输入数据流的名称和说明,然后单击确定以保存数据流。
- 单击运行数据流以创建数据集。