10 使用模板与用户协作

通过使用 Oracle Machine Learning 记事本模板,您可以通过共享工作、以报表形式发布工作以及从模板创建记事本来与其他用户协作。您可以将记事本存储为模板,共享记事本,并向其他用户提供示例模板。

注意:

您还可以通过提供对工作区的访问权限与其他 Oracle Machine Learning 记事本用户协作。然后,经过验证的用户可以访问工作区中的项目并访问记事本。访问级别取决于授予的权限类型 - Manager、Developer 或 Viewer。有关用户之间协作的详细信息,请参阅如何在 Oracle Machine Learning Notebooks 中协作

10.1 使用个人模板

个人模板列出了您创建的记事本模板。

您可以执行以下任务:
  • 以只读模式查看所选模板。

  • 从所选模板创建新记事本。

  • 编辑所选模板。

  • 共享模板中共享选定的记事本模板。

  • 删除所选记事本模板。

10.1.1 从模板创建记事本

您可以从现有模板创建新记事本,并将其存储在个人模板中供以后使用。

必须选择笔记本模板。
要从模板创建新记事本,请执行以下操作:
  1. 个人模板页上,选择要创建记事本的模板,然后单击新建记事本
    将打开创建记事本对话框。
  2. 名称字段中,提供记事本的名称。
  3. 备注字段中,输入备注(如果有)。
  4. 项目字段中,选择要在其中保存记事本的项目。
  5. 连接字段中,选择默认连接。
  6. 单击确定。
记事本已创建,可在记事本页面上使用。

10.1.2 共享记事本模板

您可以从个人模板共享模板。您还可以共享模板进行编辑。

要共享模板,请执行以下操作:
  1. 个人模板中选择记事本模板,然后单击共享
    将打开保存到共享模板对话框。
  2. 名称字段中,输入模板的新名称。
  3. Comments 字段中,提供注释(如果有)。
  4. 标记字段中,输入以逗号分隔的标记。要实现轻松搜索,请使用描述性标记。
  5. 单击确定。
成功创建和共享模板后,将显示一条消息,指出模板是在共享中创建。

10.1.3 编辑记事本模板设置

您可以在个人模板中修改现有记事本模板的设置。

要编辑记事本模板设置:
  1. 在“个人模板”中选择记事本模板,然后单击编辑设置
    将打开编辑模板对话框。
  2. 名称字段中,编辑名称(如果适用)。
  3. 注释字段中,编辑注释(如果有)。
  4. 标记字段中,编辑标记(如果适用)。
  5. 单击确定。

10.2 使用共享模板

共享模板中,您可以与所有已验证的用户共享从模板中可用的现有记事本创建的记事本模板。

共享模板页在执行以下操作时跟踪记事本模板:
  • 类似模板

  • 从模板创建记事本

  • 查看模板

共享模板页显示有关模板的以下信息:
  • 模板名称

  • 说明

  • 喜欢内容数

  • 创建次数

  • 静态视图数

您可以执行以下任务:
  • 通过单击新建记事本创建模板

  • 通过单击编辑设置来编辑模板设置

  • 通过单击删除来删除任何选定模板

  • 按名称、标签、作者搜索模板

  • 按名称、日期、作者、喜欢、查看、使用对模板进行排序

  • 通过单击仅显示喜欢的项仅显示我的项来查看模板

10.2.1 从模板创建记事本

您可以从现有模板创建新记事本,并将其存储在个人模板中供以后使用。

必须选择笔记本模板。
要从模板创建新记事本,请执行以下操作:
  1. 个人模板页上,选择要创建记事本的模板,然后单击新建记事本
    将打开创建记事本对话框。
  2. 名称字段中,提供记事本的名称。
  3. 备注字段中,输入备注(如果有)。
  4. 项目字段中,选择要在其中保存记事本的项目。
  5. 连接字段中,选择默认连接。
  6. 单击确定。
记事本已创建,可在记事本页面上使用。

10.2.2 编辑记事本模板设置

您可以在个人模板中修改现有记事本模板的设置。

要编辑记事本模板设置:
  1. 在“个人模板”中选择记事本模板,然后单击编辑设置
    将打开编辑模板对话框。
  2. 名称字段中,编辑名称(如果适用)。
  3. 注释字段中,编辑注释(如果有)。
  4. 标记字段中,编辑标记(如果适用)。
  5. 单击确定。

10.3 使用示例模板

示例模板页列出了预填充的 Oracle Machine Learning 记事本模板。您可以查看和使用这些模板来创建记事本。

示例模板页显示有关模板的以下信息:
  • 模板名称

  • 说明

  • 喜欢内容数。单击喜欢以将其标记为喜欢。

  • 静态视图数

  • 使用次数

不能在示例模板页中更改任何模板。搜索选项包括:
  • 按名称、标签、作者搜索模板

  • 按名称、日期、作者、喜欢、查看、使用对模板进行排序

  • 通过单击仅显示喜欢的模板来查看喜欢的模板

10.3.1 从示例模板创建记事本

使用 Oracle Machine Learning 示例模板,您可以从可用模板创建记事本。

要创建笔记本:
  1. 模板示例页上,选择要创建记事本的模板。
  2. 单击新建记事本。
    将打开创建记事本对话框。
  3. 创建记事本对话框中,将显示所选模板的名称。在名称字段中,您可以更改记事本名称。
    “创建记事本”对话框
  4. 注释字段中,如果模板有任何注释可用,则会显示该注释。您可以编辑注释。
  5. 项目字段中,单击编辑图标 编辑
  6. 选择要保存记事本的项目。
  7. 连接字段中,选择默认连接。
  8. 单击确定。
记事本已创建,可在记事本页面上使用。

10.3.2 示例模板

Oracle Machine Learning Notebooks 提供了基于不同机器学习算法和语言(例如 Python、R 和 SQL)的笔记本示例模板。示例模板在 Oracle Autonomous Database 中处理。

您可以根据以下任何 Oracle Machine Learning for R 示例模板笔记本创建自己的可编辑和可运行的 Oracle Machine Learning 笔记本:
  • OML 导出和导入序列化模型:使用此记事本可使用 DBMS_DATA_MINING.EXPORT_SERMODELDBMS_DATA_MINING.IMPORT_SERMODEL 过程导出和导入本机序列化模型。Oracle Machine Learning 提供 API 来简化跨数据库和平台迁移模型的过程。
  • OML Wiki ESA 模型:通过计算文档与人类明确定义和描述的一组主题之间的语义相关性(含义是两个单词或文本之间的相似性),使用此笔记本进行文本文档分类。Oracle Machine Learning for SQL 函数 ESA、Oracle Machine Learning for Python 函数 oml.esa 和 Oracle Machine Learning for R 函数 ore.odmESA 从一组文档中提取基于文本的功能,并执行文档相似性比较。在此笔记本中,wiki ESA 模型导入到 Autonomous Database 中,以便与以下 OML 模板笔记本示例结合使用:
    • OML4SQL 功能提取 ESA Wiki 模型
    • OML4Py 功能提取 ESA Wiki 模型
    • OML4R 功能提取 ESA Wiki 模型
  • OML 服务批处理评分:使用此记事本通过 OML 服务通过 REST 接口运行批处理评分作业。OML 服务支持对回归、分类、聚类和功能提取进行批量评分。
    • 验证数据库用户并获取令牌
    • 创建批评分任务
    • 查看批评分任务的详细信息和输出
    • 更新、禁用和删除批评分任务
  • OML 服务数据监视:使用此记事本执行数据监视。通过此笔记本运行的 REST 接口,您可以执行以下数据监视工作流步骤:
    • 验证数据库用户并获取令牌
    • 创建数据监视作业
    • 查看数据监视作业的详细信息和输出
    • 更新、禁用和删除数据监视作业
  • OML 服务模型监视:使用此记事本了解和执行模型监视。通过此笔记本运行的 REST 接口,您可以执行以下模型监视工作流步骤:
    • 验证数据库用户并获取令牌
    • 创建模型监视作业
    • 查看模型监视作业的详细信息和输出
    • 更新、禁用和删除模型监视作业
  • OML 第三方软件包 - 环境创建:使用此记事本下载并激活 Conda 环境,以及在记事本会话中使用库。Oracle Machine Learning Notebooks 提供了 Conda 解释器,用于在 Conda 环境中安装第三方 Python 和 R 库,以便在 Oracle Machine Learning Notebooks 会话以及 Oracle Machine Learning for PythonOracle Machine Learning for R 嵌入式执行调用中使用。

    安装在 Oracle Machine Learning Notebooks 中的第三方库可用于:

    • 标准 Python
    • 标准 R
    • 从 Python、SQL 和 REST API 执行 Oracle Machine Learning for Python 嵌入式 Python
    • 通过 R、SQL 和 REST API Oracle Machine Learning for R 嵌入式 R 执行

    注意:

    Conda 环境由具有 OML_SYS_ADMIN 角色的 ADMIN 用户安装和管理。管理员可以创建共享环境,并在其中添加或删除软件包。Conda 环境存储在与 Autonomous Database 关联的对象存储桶中。

    Conda 是一个开源软件包和环境管理系统,允许使用包含第三方 R 和 Python 软件包的虚拟环境。使用 conda 环境,您可以安装和更新程序包及其相关性,并在环境之间切换以使用特定于项目的程序包。

    此模板记事本 OML 第三方程序包 - 环境创建包含第三方环境创建和程序包安装在 Oracle Machine Learning Notebooks 中的典型工作流。

    • 第 1 部分包含用于创建和测试 Conda 环境的命令。
    • 第 2 部分包含用于创建 Conda 环境的命令、安装程序包以及用于将 conda 环境上载到与 Oracle Autonomous Database 关联的对象存储存储桶的命令。

    图 10-1 Conda 示例模板

    Conda 示例模板
  • OML 第三方程序包 - Python 环境使用情况:使用此模板笔记本了解 Oracle Machine Learning Notebooks 中使用 Python 和 Oracle Machine Learning for Python 的第三方环境使用的典型工作流。您可以在 Conda 环境中下载并使用以前创建并保存到与 Autonomous Database 关联的对象存储存储桶文件夹中的库。
    此记事本包含以下命令:
    • 列出存储在对象存储中的所有环境
    • 列出存储在对象存储中的命名环境
    • 下载并激活 mypyenv 环境
    • 列出 Conda 环境中可用的软件包
    • 导入 Python 库
    • 加载数据集
    • 构建模型
    • 为模型评分
    • 创建 Python 用户定义函数 (UDF)
    • 在 Python 中运行用户定义的函数 (UDF)
    • 在 SQL 和 REST API 中创建和运行用户定义的函数,以便嵌入式 Python 执行
    • 使用 SQL API 创建和运行 Python 用户定义的函数以嵌入式 Python 执行 - 异步模式
  • OML 第三方程序包 - R 环境使用:使用此模板记事本了解 Oracle Machine Learning for R 中第三方环境使用的典型工作流。
    此记事本包含以下命令:
    • 列出存储在对象存储中的所有环境
    • 列出存储在对象存储中的命名环境
    • 下载并激活 myrenv 环境
    • 显示可用 OML4R Conda 环境的列表
    • 导入 R 库
    • 加载和准备数据
    • 构建模型
    • 为模型评分
    • 创建 R 用户定义的函数 (UDF)
    • 在 R 中运行用户定义的函数 (UDF)
    • 将用户定义的函数 (UDF) 保存到脚本资料档案库
    • 在 SQL 和 REST API 中运行 R 用户定义的函数,以便嵌入式 R 执行
    • 将 OML 用户添加到访问控制列表
    • 使用 REST API 在同步模式下为嵌入式 R 执行运行 R 用户定义的函数
  • OML4R-1:简介:使用此笔记本了解如何:
    • 加载 ORE 库
    • 创建数据库表
    • 使用透明层
    • 使用数据库内属性重要性算法对预测值的属性进行排名
    • 构建预测模型,并
    • 使用这些模型对数据进行评分

    图 10-2 Oracle Machine Learning for R 模板示例

    OML4R 示例模板
  • OML4R-2:数据选择和处理:使用此记事本了解涉及数据选择和处理的透明度层的功能。
  • OML4R-3:数据存储和脚本资料档案库:使用此记事本了解 OML4R 的数据存储和脚本资料档案库功能。
  • OML4R-4:嵌入式 R 执行:使用此记事本了解 OML4R 嵌入式 R 执行。首先,直接在 R 中构建线性模型,然后创建用户定义的 R 函数来构建线性模型,然后将该函数保存到脚本资料档案库,并使用 Oracle Autonomous Database 环境生成的 R 引擎并行对数据进行评分。该笔记本还演示了如何使用 SQL 接口调用这些脚本,以及使用嵌入式 R 执行的 REST API for R。

    注意:

    要将 SQL API 用于嵌入式 R 执行,用户定义的 R 函数必须驻留在 OML4R 脚本资料档案库中,并且必须提供 Oracle Machine Learning (OML) 云账户 USERNAME、PASSWORD 和 URL 以获取验证令牌。
  • OML4R 异常检测支持向量机 (Anomaly Detection Support Vector Machine,SVM):使用此记事本构建一类 SVM 模型,然后使用它来标记异常或可疑记录。
  • OML4R 关联规则 Apriori:使用此记事本可以将 A Priori 算法与 SH 方案 (SH.SALES) 中的数据建立关联规则模型。所有计算都发生在 Oracle Autonomous Database 内。
  • OML4R 属性重要性最小说明长度 (MDL):使用此记事本计算 SH 方案数据上使用最小说明长度算法的属性重要性。所有功能都在 Oracle Autonomous Database 内运行。Oracle Machine Learning 支持属性重要性,可识别对目标属性影响最大的属性、预测因子和变量等关键因素。
  • OML4R 分类通用线性模型 (GLM):使用此记事本可预测最有可能对关联卡忠诚度计划做出积极响应的客户。此记事本使用销售历史记录 (SH) 方案数据构建并应用分类通用线性模型。所有处理都在 Oracle Autonomous Database 内进行。
  • OML4R 分类朴素贝叶斯 (NB):使用此笔记本可预测最有可能对关联卡忠诚度计划做出积极响应的客户。此记事本使用销售历史记录 (SH) 方案数据构建并应用分类决策树模型。所有处理都在 Oracle Autonomous Database 内进行。
  • OML4R 分类随机森林 (RF):使用此记事本在 OML4R 中使用随机森林算法进行分类,并预测最有可能成为关联卡忠诚度计划的积极响应者的客户。
  • OML4R 使用支持向量机 (Support Vector Machine,SVM) 预测目标客户的分类建模:使用此记事本使用分类建模来使用支持向量机模型预测目标客户。
  • OML4R 集群 - 使用预期最大化集群标识客户群:使用此笔记本了解如何使用 SH 方案中的 CUSTOMERS 数据集使用无监督学习预期最大化 (EM) 算法来标识客户的自然集群。数据探索、准备和机器学习在 Oracle Autonomous Database 中运行。
  • OML4R 集群 - 使用 K 均值集群标识客户群:使用此记事本了解如何使用 SH 方案中的 CUSTOMERS 数据集(使用无监督学习 K 均值 (KM) 算法)标识客户的自然集群。数据探索、准备和机器学习在 Oracle Autonomous Database 中运行。
  • OML4R 集群 - 正交分区集群 (Orthogonal Partitioning Clustering,OC):使用此记事本了解如何使用 SH 方案中的 CUSTOMERS 数据集通过无监督学习 k-Means 算法识别客户的自然集群。数据探索、准备和机器学习在 Oracle Autonomous Database 中运行。
  • OML4R 数据清理异常:使用此记事本了解并使用 OML4R 排除异常的记录。
  • OML4R 数据清理 - 重新编码同义值:使用此记事本可使用 OML4R 重新编码同义值。
  • OML4R 数据集创建:使用此记事本加载示例数据集 MTCARSIRIS,并使用 ore.create() 函数将其导入 Oracle Autonomous Database 实例。

注意:

以下示例模板笔记本以星号 (*) 为前缀,使用 CUSTOMER_INSURANCE_LTV 数据集。此数据集由 OML Run-me-first 记事本生成。因此,您必须运行“示例模板”下提供的 OML Run-me-first 记事本。
  • * OML4R 数据清理缺少的数据:使用此记事本可使用 OML4R 执行缺少的值替换。
  • * OML4R 数据清理重复删除:使用此记事本可使用 OML4R 删除重复记录。
  • * OML4R 数据转换存储:使用此记事本可使用 OML4R 对数字列进行存储。
  • * OML4R 数据转换分类记录:使用此记事本可将分类字符串变量重新编码为数字变量,并使用 OML4R 进行字符串到字符串的重新编码。
  • * OML4R 数据转换:规范化和缩放:使用此记事本可使用 OML4R 对数据进行规范化和缩放。
  • * OML4R 数据转换:单热编码:使用此记事本使用 OML4R 执行单热编码。
  • * OML4R 功能选择 - 监督算法:使用此记事本可使用 OML4R 使用数据库内监督算法执行功能选择。此笔记本演示了如何构建随机森林模型来预测客户是否购买保险,然后使用特征重要性来执行特征选择。
  • * OML4R 使用概要统计信息选择功能:使用此记事本可使用 OML4R 使用概要统计信息执行功能选择。此笔记本演示了如何使用 OML4R 根据相异值数量、空值和常量值的比例选择功能。
  • OML4R 功能工程聚合:使用此记事本使用 OML4R 对最小值、最大值、平均值和计数执行聚合。此模板使用 SH 方案中存在的 SALES 表,并显示如何通过汇总每个客户和产品对的销售金额来创建功能。
  • OML4R 功能提取显式语义分析 (ESA) Wiki 模型:本笔记本使用维基百科模型作为示例。使用此记事本可使用 Oracle Machine Learning for R 函数 ore.odmESA 从一组文档中提取基于文本的功能并执行文档相似性比较。所有处理都在 Oracle Autonomous Database 内进行。

    注意:

    预构建的维基百科模型必须安装在 Autonomous Database 实例中才能运行此笔记本。
  • OML4R 数据转换日期数据类型:使用此记事本可使用 Oracle Machine Learning for R 使用数据库表代理对象对日期和时间数据执行各种操作。
  • OML4R 功能提取奇异值分解 (SVD):使用此笔记本可使用数据库内 SVD 进行功能提取。此笔记本使用 Oracle Machine Learning for R 函数 ore.odmSVD 创建使用奇异值分解 (Singular Value Decomposition,SVD) 算法进行特征提取的模型。
  • OML4R 分区模型支持向量机 (SVM):使用此记事本构建 SVM 模型,以预测客户在其住所居住但按客户性别划分的年数。然后,模型用于预测目标,然后使用预测详细信息预测目标。
  • OML4R 回归广义线性模型 (GLM):使用此记事本了解如何使用多次回归预测数值。此笔记本使用广义线性模型算法。
  • OML4R 回归神经网络 (NN):使用此记事本了解如何使用多重回归预测数值。此笔记本使用神经网络算法。
  • OML4R 回归支持向量机 (SVM):使用此记事本了解如何使用多次回归预测数值。此笔记本使用支持矢量计算机算法。
  • OML4R REST API:使用此记事本了解如何使用 OML4R REST API 调用用户定义的 R 函数,以及列出 R 脚本资料档案库中可用的函数。

    注意:

    要运行脚本,它必须驻留在 R 脚本资料档案库中。必须为验证提供 Oracle Machine Learning 云服务账户用户名和密码。
  • OML4R 统计功能:使用此记事本可了解和使用各种统计功能。该笔记本使用通过 OML4R 透明层从 SH 方案获取的数据。
  • OML4R 文本挖掘支持向量机 (SVM):使用此笔记本了解如何使用非结构化文本数据构建机器学习模型、利用 Oracle Text、使用 Oracle Machine Learning 数据库内算法预测功能以及从文本列提取功能。

    此笔记本电脑构建了支持向量机 (Support Vector Machine,SVM) 模型,可预测最有可能积极响应 Affinity Card 忠诚度计划的客户。数据来自包含用户生成的备注的文本列。

Oracle Machine Learning for Python 示例模板

您可以根据以下任何 Oracle Machine Learning for Python 示例模板创建 Oracle Machine Learning 笔记本:

图 10-3 Oracle Machine Learning for Python 模板示例

OML4Py 示例模板
  • 我的第一本笔记本:使用“我的第一本笔记本”笔记本进行基本的机器学习功能、数据选择和数据查看。此模板使用 SH 方案数据。
  • OML4Py -0- 浏览:本笔记本是 0 到 5 系列中的第一个,旨在通过简短示例介绍 OML4Py 功能的范围。
  • OML4Py -1- 简介:本笔记本概述了如何加载 OML 库、创建数据库表、使用透明度层、使用数据库内属性重要性算法对预测值的等级属性、构建预测模型以及使用这些模型对数据评分。
  • OML4Py -2- 数据选择和处理:使用此记事本了解如何处理涉及数据选择和处理的透明度层。
  • OML4Py -3- 数据存储:使用此记事本可了解如何处理数据存储、在数据存储和 Python 会话之间移动对象、管理数据存储权限、在数据存储中保存模型对象和 Python 对象、删除数据存储等。
  • OML4Py -4- 嵌入式 Python 执行:使用此笔记本了解嵌入式 Python 执行。在此笔记本中,直接在 Python 中构建线性模型,然后创建一个使用 Autonomous Database 环境生成的 Python 引擎的函数。
  • OML4Py -5- AutoML:使用此记事本了解 OML4Py 中的 AutoML 工作流。在此笔记本中,使用 scikit-learn 中的 WINE 数据集。此处,AutoML 用于对 target 列进行分类,用于对 alcohol 列进行回归。

注意:

以下示例模板笔记本以星号 (*) 为前缀,使用 CUSTOMER_INSURANCE_LTV_PY 数据集。此数据集具有由 OML4SQL Noise 记事本人为生成的值重复。因此,在运行记事本之前,必须先运行 OML4SQL Noise
  • * OML4Py 数据清理重复项删除:使用此记事本了解如何使用 OML4Py 删除重复记录。此笔记本使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。
  • * OML4Py 数据清理缺少的数据:使用此记事本了解如何使用 OML4Py 填写缺少的值。此笔记本使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。
  • * OML4Py 数据清理重新编码同义值:使用此记事本了解如何使用 OML4Py 重新编码同义值。此笔记本使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。
  • OML4Py 数据清理异常值删除:使用此记事本了解如何清除数据以删除异常值。此笔记本使用 CUSTOMER_INSURANCE_LTV 数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。在数据集 CUSTOMER_INSURANCE_LTV 中,重点是数值和删除顶部和底部值为 5% 的记录。
  • OML4Py 数据转换存储:使用此记事本了解如何存储数值列并可视化分布。
  • OML4Py 数据转换分类 - 将分类变量转换为数字变量:使用此记事本了解如何使用 OML4Py 将分类变量转换为数字变量。笔记本演示了如何将每个不同级别/值的分类变量转换为整数数据类型。
  • OML4Py 数据转换规范化和扩展:使用此笔记本了解如何使用 z 评分(平均和标准差)、最小最大缩放和日志缩放来规范化和扩展数据。

    注意:

    在使用数据库内 Oracle Machine Learning 算法构建或应用模型时,自动数据准备将按特定算法根据需要自动规范化数据。
  • OML4Py 数据转换一个热编码:使用此记事本了解如何使用 OML4Py 执行一个热编码。机器学习算法无法直接处理分类数据。分类数据必须转换为数字。此笔记本使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。

    注意:

    如果您计划使用数据库内算法,系统会自动为需要该算法的算法应用一个热编码。数据库内算法会自动展开分类列,并在内部将模型与准备的数据相匹配。
  • OML4Py 异常检测:使用此记事本检测数据中的异常记录、客户或事务处理。此模板使用无监督学习算法 1 类支持向量机。笔记本模板构建了一个 1 级支持向量机 (SVM) 模型。
  • OML4Py 关联规则:使用此记事本对数据进行购物篮分析,或检测数据中的共同发生项、故障或事件。此模板使用使用 SH 方案数据 (SH.SALES) 的 apriori 关联规则模型。
  • OML4Py 属性重要性:使用此记事本可标识对目标属性具有最大影响力的关键属性。监督模型的构建数据中的目标属性是您要预测的属性。模板使用 SH 方案数据构建属性重要性模型。
  • OML4Py 分类:使用此记事本预测客户行为和类似预测。模板构建并应用分类算法“决策树”,以基于预测值与目标值之间的关系构建分类模型。模板使用 SH 方案数据。
  • OML4Py 集群:使用此记事本标识数据中的自然集群。记事本模板对 SH schema 数据使用无监督学习 k- 表示算法。
  • OML4Py 数据转换:使用此记事本可使用 OML4Py 将分类变量转换为数字变量。此模板说明如何将每个不同级别/值的分类变量转换为整数数据类型。
  • OML4Py 数据集创建:使用此记事本可使用 OML4Py 创建从 sklearn 程序包到 OML 数据帧的数据集。
  • OML4Py 功能工程汇总:使用此记事本模板可使用 OML4Py 填写缺少的值。此笔记本使用 SH 方案 SALES 表,其中包含每个客户和所购买产品的事务处理记录。通过汇总每个客户和产品对的销售金额来创建功能。
  • OML4Py 基于功能选择监督算法:使用此记事本可使用 OML4Py 使用数据库内监督算法执行功能选择。
  • OML4Py 功能选择概要统计信息:使用此记事本模板可使用 OML4Py 使用概要统计信息执行功能选择。笔记本显示如何使用 OML4Py 根据相异值数量、空值和常量值的比例选择功能。此处使用的数据集 CUSTOMER_INSURANCE_LTV_PY 具有由 OML4SQL 噪声记事本人为生成的空值。在运行 OML4Py 功能选择摘要统计信息记事本之前,必须先运行 OML4SQL 噪声记事本。
  • OML4Py 分区模型:使用此记事本构建分区模型。此笔记本构建了 SVM 模型,用于预测客户居住的年数,但根据客户性别进行分区。它使用模型预测目标,然后使用预测详细信息预测目标。

    Oracle Machine Learning 支持自动构建由多个子模型组成的集合模型,每个数据分区一个。子模型存在并用作一个模型,这导致仅使用顶级模型进行简化评分。系统根据要评分的数据行中的分区值选择正确的子模型。分区模型可通过多个目标模型实现更高的准确性。

  • OMP4Py REST API:使用此记事本调用嵌入式 Python 执行。OML4Py 包含一个 REST API,用于运行保存在脚本资料档案库中的用户定义 Python 函数。在客户机与数据库服务器之间进行分离很有用时,使用 REST API。使用 OML4Py REST API 构建、训练、部署和管理脚本。

    注意:

    要运行脚本,它必须驻留在 OML4Py 脚本资料档案库中。必须为验证提供 Oracle Machine Learning 云服务账户用户名和密码。
  • OML4Py 回归建模以预测数值:使用此记事本可使用多重回归预测数值。
  • OML4Py 统计函数:使用此记事本可使用各种统计函数。统计函数通过 OML4Py 透明度层使用来自 SH 方案的数据。
  • OML4Py 文本挖掘:使用此笔记本在 Oracle Machine Learning 中使用文本挖掘功能构建模型。

    在此笔记本中,SVM 模型旨在预测最有可能对 Affinity Card 忠诚度计划做出积极响应的客户。数据附带一个文本列,其中包含用户生成的注释。通过一些附加规范,算法会自动使用文本列,并在结构化数据和非结构化文本上构建模型。

Oracle Machine Learning for SQL 示例模板

您可以根据以下任何 Oracle Machine Learning for SQL 示例模板创建 Oracle Machine Learning 笔记本:

图 10-4 Oracle Machine Learning for SQL 模板示例

OML4SQL 示例模板
  • OML4SQL 异常检测:使用此记事本可检测异常或罕见事件。Oracle Machine Learning 支持使用半监督学习算法 One-Class Support Vector Machine 进行异常检测,以识别数据中的罕见或异常记录(客户、事务处理等)。该笔记本构建了一个 1Class-SVM 模型,然后使用它来标记异常或可疑的记录。整个机器学习方法都在 Oracle Autonomous Database 中运行。
  • OML4SQL 关联规则:使用此记事本应用关联规则机器学习技术(也称为“市场篮子分析”),以发现共发生项、导致失败的状态或非明显事件。此记事本使用 A Priori 算法与 SH 方案中的 SH.SALES 数据构建关联规则模型。所有计算都发生在 Oracle Autonomous Database 内。
  • OML4SQL 属性重要性 - 确定关键因素:使用此记事本可标识对目标属性影响最大的属性、预测器和变量。此笔记本使用 SH 方案数据构建属性重要性模型,该模型使用最小说明长度算法。所有功能都在 Oracle Autonomous Database 内运行。
  • OML4SQL 分类 - 预测目标客户:使用此记事本可预测最有可能对关联卡忠诚度计划做出积极响应的客户。此记事本使用 SH 方案数据构建和应用分类决策树模型。所有处理都在 Oracle Autonomous Database 内进行。
  • OML4SQL 集群 - 标识客户群:使用此记事本标识自然客户群。Oracle Machine Learning 支持使用多种算法进行集群,包括 k-Means、O-Cluster 和 Expectation Maximization。此记事本使用无监督学习 k- 均值算法从 SH 方案中使用 CUSTOMERS 数据集。数据探索、准备和机器学习在 Oracle Autonomous Database 中运行。
  • OML4SQL 数据清理 - 删除重复项:使用此记事本可使用 Oracle SQL 删除重复记录。该笔记本使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。数据集 CUSTOMER_INSURANCE_LTV_SQL 具有由 OML4SQL 噪声记事本生成的重复值。

    注意:

    在运行 OML4SQL 数据清理记事本之前,必须先运行 OML4SQL 噪声记事本。
  • OML4SQL 数据清理 - 缺少数据:使用此模板可以使用 Oracle SQL 和 DBMS_DATA_MINING_TRANSFORM 程序包替换缺少的值。数据集 CUSTOMER_INSURANCE_LTV_SQL 缺少由 OML4SQL 噪声记事本人为生成的值。在运行 OML4SQL 数据清理记事本之前,必须先运行 OML4SQL 噪声记事本。

    注意:

    使用数据库内 Oracle Machine Learning 算法构建或应用模型时,如果启用了自动数据准备,则可能不需要单独执行此操作。自动数据准备使用模式自动将数字属性的缺失值替换为分类属性的平均值和缺失值。
  • OML4SQL 数据清理异常删除:使用此记事本可使用 Oracle SQL 和 DBMS_DATA_MINING_TRANSFORM 程序包删除异常。该笔记本使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。在数据集 CUSTOMER_INSURANCE_LTV 中,它侧重于数值,并删除顶部和底部值为 5% 的记录。
  • OML4SQL 数据清理重新编码同义值:使用此记事本可使用 Oracle SQL 重新编码列的同义值。该笔记本使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。数据集 CUSTOMER_INSURANCE_LTV_SQL 已重新编码 OML4SQL 噪声记事本生成的值。在运行 OML4SQL Data Cleaning - Recode Synonymous Values 笔记本之前,必须先运行 OML4SQL Noise 笔记本。
  • OML4SQL 数据转换存储:使用此记事本可以使用 Oracle SQL 和 DBMS_DATA_MINING_TRANSFORM 程序包来存储数字列。此笔记本显示如何将数字列放在一起并可视化分布。
  • OML4SQL 数据转换分类:使用此记事本可使用 Oracle SQL 将分类变量转换为数字变量。笔记本显示如何将分类变量与每个不同的级别/值编码成整数,以及如何基于简单的谓词创建指示符变量。
  • OML4SQL 数据转换规范化和扩展:使用此记事本可以使用 Oracle SQL 和 DBMS_DATA_MINING_TRANSFORM 程序包规范化和扩展数据。该笔记本说明如何使用 z 评分(平均和标准差)、最小最大缩放和日志缩放对数据进行规范化。在使用数据库内 Oracle Machine Learning 算法构建或应用模型时,自动数据准备会根据需要通过特定算法自动规范化数据。
  • OML4SQL 减少维数 - 非负矩阵因子化:使用此记事本可使用数据库内非负矩阵因式分解算法执行维数减少。此笔记本说明如何将包含多个列的表转换为精简功能集。非负矩阵因子分析生成非负系数。
  • OML4SQL 减少维数 - 奇异值分解:使用此记事本可使用数据库内奇异值分解 (SVD) 算法执行减少维数。
  • OML4SQL:导出序列化模型:使用此记事本可将序列化模型导出到 Oracle Cloud 对象存储。此笔记本创建 Oracle Machine Learning 回归和分类模型,并以序列化格式导出模型,以便可以使用 Oracle Machine Learning (OML) 服务 REST API 对模型进行评分。OML 服务提供 Oracle Autonomous Database 上托管的 REST API 端点。这些端点支持存储 Oracle Machine Learning 模型及其元数据,并为模型创建评分端点。适用于 OML 服务的 REST API 支持 Oracle Machine Learning 模型和 ONNX 格式模型,并支持认知文本功能。
  • OML4SQL 功能工程汇总和时间:使用此记事本可以生成汇总功能,还可以使用 Oracle SQL 提取日期和时间功能。该笔记本还显示如何从字段 TIME_ID 中提取日期和时间功能。
  • OML4SQL 基于功能选择算法:使用此记事本可使用数据库内监督算法执行功能选择。该笔记本首先构建一个随机森林模型来预测客户是否购买保险,然后使用特征重要性值进行特征选择。然后,它为同一分类任务构建决策树模型,并获取拆分节点。对于支持最多的顶级拆分节点,将选择与这些节点关联的功能。
  • OML4SQL 功能选择无监督属性重要性:使用此记事本使用数据库内无监督算法期望最大化 (Expectation Maximization,EM) 执行功能选择。此记事本说明了如何使用 CREATE_MODEL 函数,该函数利用设置表与其他记事本中使用的 CREATE_MODEL2 函数对比。
  • OML4SQL 使用概要统计信息选择功能:使用此记事本可以使用 Oracle SQL 使用概要统计信息执行功能选择。数据集 CUSTOMER_INSURANCE_LTV_SQL 的空值由 OML4SQL 噪声记事本人为生成。在使用概要统计信息运行 OML4SQL 功能选择之前,必须先运行 OML4SQL 噪声记事本。
  • OML4SQL 噪声:使用此记事本可将常规值替换为空值,并添加重复的行。在此笔记本中,准备了数据准备笔记本使用的数据集,特别是用于数据清理和功能选择的数据集。它使用客户保险终身价值数据集,其中包含客户财务信息、终身价值以及客户是否购买保险。

    注意:

    在数据准备记事本之前运行 OML4SQL 噪声记事本。
  • OML4SQL 分区模型:使用此记事本构建分区模型。分区模型可通过多个目标模型实现更高的准确性。该笔记本构建了一个 SVM 模型,以预测客户在其住所居住的年数,但根据客户的性别进行分区。然后使用模型先预测目标,然后使用预测详细信息预测目标。
  • OML4SQL 文本挖掘:使用此记事本可以使用文本挖掘功能构建模型。Oracle Machine Learning 可处理结构化和非结构化文本数据。Oracle Machine Learning 数据库内算法利用 Oracle Text 自动从文本列中提取预测功能。

    此笔记本构建了 SVM 模型,可预测最有可能积极响应 Affinity Card 忠诚度计划的客户。数据附带一个文本列,其中包含用户生成的注释。通过一些附加规范,算法会自动使用文本列,并在结构化数据和非结构化文本上构建模型。

  • OML4SQL 回归:使用此记事本可预测数值。此模板使用多种回归算法,例如广义线性模型 (GLM)。
  • OML4SQL 统计函数:使用此记事本执行描述性和比较统计函数。记事本模板使用 SH 方案数据。
  • OML4SQL 时间序列:使用此记事本根据您的时间序列数据构建时间序列模型以进行预测。此笔记本基于指数平滑算法。此记事本中的销售预测示例基于 SH.SALES 数据。所有计算都在 Oracle Autonomous Database 内完成。