实验(预览)

本章提供有关在工作区中创建、管理和开发实验的信息。

Oracle AI Data Platform Workbench 中的实验为数据科学家、机器学习工程师和管理人员提供了协作开发模型的方法。利用 AI Data Platform Workbench,您可以:

  • 跟踪通过性能分析、协作、实验条件分析(超参数、输入数据集、功能工程等)构建最佳模型的实验
  • 确保旧实验不会在相同的实验条件下重复
  • 重新运行具有不同实验条件的旧实验,以获得可能的性能收益
  • 早期实验的可重复性
  • 当性能下降或需要重新训练时,使用较新的数据集进行再训练
  • 将模型从模型注册表加载到记事本中,并将模型性能与正在开发的新模型进行比较

注意:

如果您以前未在 AI 数据平台工作台中使用过实验或模型,则需要重新启动关联的计算集群,或创建一个新集群以用于实验和模型。

限制

基于 ARM 的计算集群当前不支持实验。确保连接的计算集群基于 Intel 或 AMD。

创建实验(预览)

您可以直接在 Oracle AI Data Platform 的 "Experiments"(实验)页面中创建实验。

  1. 在主页中,单击实验
  2. 单击创建
  3. 为实验提供名称和说明。
  4. 可选:以自由形式或定义的标记形式提供其他元数据。单击添加可创建其他标记。
  5. 单击创建

编辑实验(预览)

您可以在 Oracle AI Data Platform Workbench 工作区中修改实验的详细信息。

  1. 在主页中,单击实验
  2. 在要编辑的实验旁边,单击编辑
  3. 修改实验的详细信息。
  4. 单击 Save changes(保存更改)

查看实验运行详细信息(预览)

您可以在 Oracle AI Data Platform Workbench 工作区中查看过去实验运行的历史记录,比较它们,并查看实验的特定运行的详细信息。

  1. 在主页中,单击实验
  2. 单击要查看其运行详细信息的实验的名称。
  3. 使用下拉列表和搜索栏筛选显示的实验运行。
  4. 单击 ListCompare 可更改实验运行。
    • List(列表)根据您在有序行中的过滤器显示实验运行,并在每列中显示有关实验运行的度量。您可以通过单击该列标题按度量进行排序。
    • 比较显示过滤器当前显示的每个实验的关键度量的条形图比较。
  5. 单击实验运行的名称可查看该实验运行的详细信息。

使用示例代码在记事本中创建实验运行(预览)

通过使用现有实验详细信息修改示例代码,可以为记事本中的实验创建运行。

  1. 导航到要为实验创建运行的记事本。
  2. 单击实验选项卡。
  3. 单击示例代码
  4. 在代码块样例中,将 experiment name="Customer Churn Prediction" 替换为 experiment name="<your_experiment_name>"。您还可以复制此代码并使用您的实验名称进行修改:
    import mlflow 
    experiment_name = "experiment name" #Replace this with your own experiment name 
    mlflow.set_experiment(experiment_name) 
    
    mlflow.autolog() 
    
    with mlflow.start_run(): 
        # training code goes here 
        # OPTIONAL - Log additional items after training 
        mlflow.log_metric("custom_metric", 99.9) 
  5. 自动日志自动记录一组默认度量,具体取决于所选模型。要手动指定您自己的度量,可以修改此代码以调用 mlflow.log_metric(“<metric_name>”,<metric_variable>)
    import mlflow 
    import numpy as np 
    from sklearn.tree import DecisionTreeRegressor 
    from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score 
    
    experiment_name = "Customer Churn Prediction" 
    mlflow.set_experiment(experiment_name) 
    
    mlflow.autolog() 
    
    with mlflow.start_run(): 
        # training code goes here 
        model = DecisionTreeRegressor(random_state=42, max_depth=5) 
        model.fit(X_train, y_train) 
    
        preds = model.predict(X_test) 
    
        mse = mean_squared_error(y_test, preds) 
        rmse = float(np.sqrt(mse)) 
    
        mlflow.log_metric("test_rmse", rmse) 
        mlflow.log_metric("test_mae", float(mean_absolute_error(y_test, preds))) 
        mlflow.log_metric("test_r2", float(r2_score(y_test, preds))) 
        # OPTIONAL - Log additional items after training 
        mlflow.log_metric("custom_metric", 99.9) 
  6. 从记事本中运行代码块。运行现在已注册到指定的实验。

    注意:

    实验的多个运行会自动记录不同的名称。对于参数扫描方案,AI Data Platform Workbench 会自动捕获与指定实验名称不同的所有运行和指定度量。

从实验运行详细信息注册模型(预览)

您可以通过单击该实验运行的详细信息,在 Oracle AI Data Platform Workbench 工作区中注册特定实验运行的模型。

  1. 在主页中,单击实验
  2. 单击要查看其运行详细信息的实验的名称。
  3. 单击要从中注册模型的实验运行的名称。
  4. 单击注册
  5. 为您的模型提供名称和说明。
  6. 选择主目录中的位置以创建模型。
  7. 模型下拉列表中,选择相应的模型。
  8. 可选:以自由形式或定义的标记形式提供其他元数据。单击添加可创建其他标记。
  9. 可选:以定制字段的形式提供附加信息,例如模型类型或使用案例。单击添加以创建其他定制字段。
  10. 单击注册

删除实验(预览)

您可以在 Oracle AI Data Platform Workbench 工作区中修改实验的详细信息。

注意:

如果存在基于该实验运行的已注册模型,则无法删除实验。
  1. 在主页中,单击实验
  2. 在要删除的实验旁边,单击删除
  3. 单击删除