将 Oracle Analytics 与 Oracle Cloud Infrastructure Data Science 集成

将 Oracle Analytics 与 Oracle Cloud Infrastructure (OCI) 数据科学集成,在不需要数据科学家专业知识的情况下执行机器学习和人工智能。例如,对于医疗保健数据,可以使用预测模型确定风险因素并预测病人在出院后再入院的风险。

将 OCI 数据科学模型与 Oracle Analytics 集成的先决条件

您需要满足以下先决条件才能将 OCI 数据科学与 Oracle Analytics 集成。

  • 在 Oracle Analytics 实例与 OCI 服务之间创建连接 — 请参见创建与 Oracle Cloud Infrastructure 租户的连接
  • 在 OCI 中,将机器学习模型保存在 OCI 数据科学模型目录中。应使用 Oracle Accelerated Data Science 软件开发工具包 2.6.1 或更高版本创建并保存这些模型,以与 Oracle Analytics 兼容。

将 OCI 数据科学服务与 Oracle Analytics 集成所需的策略

要将 Oracle Analytics 与 OCI 数据科学服务集成,请确保您具有所需的安全策略。

您在 Oracle Analytics Cloud 与 OCI 租户的连接中指定的 OCI 用户必须对您要使用的 OCI 资源所在的区间具有读取、写入和删除权限。确保该 OCI 用户所属的用户组至少具有以下 OCI 安全策略。从 Oracle Analytics 连接到 OCI 租户时,可以使用 OCI API 密钥或资源主体。

注:

Oracle Cloud ID (OCID) 是 OCI 中使用的资源标识符。

注:

对于资源主体,要将所有分析实例包含在一个区间下,请指定 {request.principal.type='analyticsinstance', request.principal.compartment.id='<compartmentA_ocid>'} 而非 {request.principal.id='<analytics_instance_ocid>'}
API 密钥策略 资源主体策略
Allow group <group_name> to read data-science-projects in compartment <compartment_name> Allow any-user to read data-science-projects in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow group <group_name> to read data-science-models in compartment <compartment_name> Allow any-user to read data-science-models in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow group <group_name> to manage data-science-jobs in compartment <compartment_name> Allow any-user to manage data-science-jobs in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow group <group_name> to inspect instance-family in compartment <compartment_name> Allow any-user to inspect instance-family in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow group <group_name> to manage data-science-job-runs in compartment <compartment_name> Allow any-user to manage data-science-job-runs in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow group <group_name> to inspect virtual-network-family in compartment <compartment_name> Allow any-user to inspect virtual-network-family in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow service datascience to use virtual-network-family in compartment <compartment_name> Allow service datascience to use virtual-network-family in compartment <compartment_name>
Allow group <group_name> to manage log-groups in compartment <compartment_name> Allow any-user to manage log-groups in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow group <group_name> to read buckets in compartment <compartment_name> Allow any-user to read buckets in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
Allow group <group_name> to manage objects in compartment <compartment_name> where target.bucket.name='<staging_bucket_name>' Allow any-user to manage objects in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>', target.bucket.name='<staging_bucket_name>'}
Allow group <group_name> to read objectstorage-namespaces in compartment <compartment_name> Allow any-user to read objectstorage-namespaces in compartment <compartment_name> where all {request.principal.id='<analytics_instance_ocid>'}
动态组策略 说明
Allow dynamic-group <dynamic_group> to read data-science-models in compartment <compartment_name> 提供对数据科学作业运行的数据科学模型访问。
Allow dynamic-group <dynamic_group> to manage objects in compartment <compartment_name> where target.bucket.name='<staging_bucket_name>' 提供对数据科学作业运行的对象存储访问。
Allow dynamic-group <dynamic_group> to use log-content in compartment <compartment_name> 提供对数据科学作业运行的日志访问。

注:

指定 <dynamic_group> 时,使用以下格式的匹配规则:all { resource.type='datasciencejobrun', resource.compartment.id='<compartment_ocid>' },其中 <compartment_ocid> 是包含数据科学模型的区间的 Oracle Cloud ID。

使 OCI 数据科学模型可用于 Oracle Analytics

要使用 Oracle Cloud Infrastructure (OCI) 数据科学模型分析数据,应在 Oracle Analytics 中注册它们。

在 Oracle Analytics 中注册 OCI 数据科学模型后,无需掌握 ML 专业知识,就可以在应用程序中构建机器学习 (Machine Learning, ML)。
开始之前,先在 Oracle Analytics 实例与 OCI 服务之间创建连接。请参见创建与 Oracle Cloud Infrastructure 租户的连接
此外,确保以具有 BI 服务管理员或 DV 内容作者角色的用户身份登录 Oracle Analytics。
  1. 主页上,依次单击页菜单注册模型/函数机器学习模型
    此选项对于具有 BI 服务管理员或 DV 内容作者角色的用户可用。
  2. 注册 ML 模型对话框中,选择与 OCI 租户的连接。
  3. 选择项目页中,单击选择
  4. 搜索区间中,导航到您存储的模型,然后单击模型名称。
    选择模型时,可以在右侧面板中查看详细信息,例如名称、说明、算法以及输入列和输出列。

  5. 单击下一步以显示输入资源参数对话框,然后配置模型:
    • 暂存存储桶区间 — 暂存存储桶的区间名称。单击选择以导航到并选择暂存存储桶的区间。

      暂存存储桶 — 进行数据传输需要提供暂存存储桶名称。

      计算配置 — 计算配置是虚拟机配置,创建数据科学作业需要提供此配置。

      OCPU — 仅当计算配置为弹性配置时需要指定。

      内存 (GB) — 仅当计算配置为弹性配置时需要指定。

      存储 (GB) — 需要为数据科学作业提供块存储大小。

      使用默认网络 — 此选项用于配置网络。如果您不确定是否使用默认网络,请咨询 Oracle Analytics 管理员。

      • 选择此选项以使用默认网络。这默认支持对公共 Internet 进行出站访问。使用默认网络选项时,您可以跳过创建网络以及设置子网和网关的操作。如果使用默认网络配置,则无法通过提供的默认网络满足其他用途,或对其进行修改以满足其他用途。
      • 取消选择此选项以配置子网和网络地址转换 (Network Address Translation, NAT) 网关。要对公共 Internet 进行出站访问,OCI 建议使用专用子网并为此子网建立到 NAT 网关的路由。专用子网中的实例可通过 NAT 网关访问 Internet。在此步骤中创建的虚拟云网络 (Virtual Cloud Network, VCN) 中会创建一个专用子网,在此子网中可通过 VCN 的 NAT 网关对 Internet 进行出站访问。

      VCN 区间 — 包含要使用的 VCN 的区间的名称。仅当取消选择了使用默认网络时需要指定。

      VCN — 现有 VCN 的名称。仅当取消选择了使用默认网络时需要指定。

      子网区间 — 包含要使用的子网的区间的名称。仅当取消选择了使用默认网络时需要指定。

      子网 — 现有子网的名称。仅当取消选择了使用默认网络时需要指定。

      启用日志记录 — 此选项用于在 OCI 数据科学中启用日志记录。

      日志组区间 — 包含存储数据科学日志的日志组的区间的名称。仅当启用了日志记录时需要指定。

      日志组 — 要存储日志的现有日志组的名称。仅当启用了日志记录时需要指定。

  6. 单击注册
  7. 可选: 要确认已成功注册模型,请从主页中,依次单击导航器 用于显示导航器的“导航器”图标模型机器学习以显示注册的模型,并确认已成功注册模型。单击检查以检查模型已正确配置。