关于构建机器学习沙盒

如果要在单个计算机上设置一个或多个隔离环境,以便使用流行机器学习工具和库与数据播放,请在Oracle Cloud Infrastructure Compute上安装分布。

分析是一种用于设计、构建和管理数据科学项目的通用工具。使用 Anaconda,您可以访问 R 和 Python 中的 1,500 多个数据科学程序包。它管理 TensorFlow、NumPy、pandas、scikit-learn 等库。它还处理安装和更新机器学习环境,例如 Jupyter Notebook 和 RStudio。

体系结构

此体系结构显示了一个示例沙盒,其中包含多个在 Oracle Cloud Infrastructure 的单个计算实例上安装的机器学习环境。

每个环境与其他环境无关并与其隔离。每种版本都有各自的 Python、R 或者任何其他语言、工具和库组合版本。此设置允许您在一个系统上具有多个独立项目,您可以在其中轻松地从一个环境切换到另一个环境。

后面是体系结构和计算机环境环境中的说明 s.png
插图 archie-Architecture oci-compute-environs.png 的说明

先决条件

虽然不要求机器学习系统和计算机系统的专业知识,但是您应该至少对用于收集、移动和转换数据的技术和流程有一些了解。

具体来说,您应该具有以下技能:

  • 熟悉 Python。

  • 熟悉 Jupyter Notebook。

  • 机器学习流程和方法的一些知识。

  • 熟悉 Linux 命令行。

  • 能够使用 SSH 或 PuTTY 连接到远程计算机。

关于必需的服务和产品

您必须有权访问运行 Linux 的 Oracle Cloud Infrastructure Compute。

您可以使用 Oracle Linux 7.7或 Ubuntu 18.04.在此解决方案中,我们向您展示了如何同时使用这两者。我们使用 GPU 计算配置 VM.GPU3.1,其中具有一个 NVIDIA Tesla V100 GPU 和 6 个 OCPU,但也可以在非 GPU 配置上设置沙盒。

请参阅了解如何为 Oracle 解决方案获取 Oracle Cloud 服务以获取所需的云服务。