加载

您将了解三个架构和中间存储选项,以将 Oracle Cloud ERP 数据加载到 Snowflake 中。

使用低代码将数据加载到 Snowflake

此架构使用 OCI GoldenGate 和 Oracle Data Transforms 作为主要数据集成工具。如果您已经在使用这些工具,并且至少有一个 Oracle Database 在 OCI 上运行,可以用作 Snowflake 的暂存,请使用此选项。



migrate-fa-snowflake-goldengate-data-int-oracle.zip

该选项使用 Oracle Data Transforms 和 OCI GoldenGate 作为主要提取和复制工具。数据首先加载到 Oracle Database 暂存区域,然后加载到 Snowflake 中。GoldenGate-Snowflake 连接器具有不同的配置选项。此体系结构使用默认配置。每 30 秒在目标上刷新一次数据。它是源上的实时,但接近目标上的实时。

参阅 OCI GoldenGate Data Transforms Extracting Data from Oracle Fusion ERP 博客,将 Oracle Data Transforms 配置为从 Oracle Cloud ERP 中提取数据。在 OCI GoldenGate 上,您需要创建两个部署。第一个用于 Oracle 技术,其中为 Oracle Data Transforms 创建的表列表配置了提取。第二种部署是针对包含 Snowflake 的大数据技术。

查看此博客,了解使用 OCI GoldenGate 进行 Snowflake 初始加载和实时数据同步,以配置部署以及 Snowflake 的提取和复制流程。

此体系结构支持以下组件:

  • 自治数据仓库

    Oracle Autonomous Data Warehouse 是一个自我驱动、自我保护和自我修复的数据库服务,针对数据仓库工作负载进行了优化。您不需要配置或管理任何硬件,或者安装任何软件。Oracle Cloud Infrastructure 负责创建、备份、打补丁、升级和优化数据库。

  • 对象存储

    通过 OCI Object Storage ,您可以访问任何内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据和丰富的内容,例如图像和视频。您可以直接从互联网或云平台安全地存储数据。您可以在不降低性能或服务可靠性的情况下扩展存储。

    将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留、很少访问或很少访问的“冷”存储。

  • Oracle Data Transforms

    借助 Oracle 数据转换,您可以以数据加载、数据流和工作流的形式设计图形数据转换,而无需编写任何代码。数据加载提供了将数据加载到 Oracle Autonomous Database 的便捷方式。数据流定义数据在不同系统之间的移动和转换方式,而工作流定义数据流的执行顺序。

  • OCI GoldenGate

    Oracle Cloud Infrastructure GoldenGate 是一项托管服务,它提供实时数据网格平台、复制以保持数据的高可用性以及实时分析。您可以设计、运行和监视数据复制和数据流处理解决方案,而无需分配或管理计算环境。

使用 Spark 将数据加载到 Snowflake

此架构使用 Spark(数据流)从 OCI Object Storage 读取数据,然后使用 Snowflake Python API 将数据加载到 Snowflake 中。

配置 BICC 作业后,ZIP 文件将落在 OCI Object Storage 上。此参考体系结构使用两种不同的工具。数据科学,用于开发和测试。数据流作为 Spark 工具,用于运行代码并将数据从 OCI 对象存储加载到 Snowflake。Spark 使用可从 Snowflake 文档下载的 JDBC 驱动程序。



migrate-fa-snowflake-spark-object-storage-oracle.zip

此体系结构支持以下组件:

  • 数据科学

    Oracle Cloud Infrastructure Data Science 是一个完全托管的无服务器平台,数据科学团队可以使用该平台在 Oracle Cloud Infrastructure (OCI) 上构建、训练和管理机器学习 (ML) 模型。它可以轻松与其他 OCI 服务(例如 Oracle Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage 等)集成。您可以构建和评估高质量的机器学习模型,通过快速部署企业可信数据来提高业务灵活性,还可以通过更轻松地部署机器学习模型来支持数据驱动的业务目标。借助数据科学,数据科学家和机器学习工程师可以免费使用 Anaconda Repository 中的程序包。

  • 对象存储

    通过 OCI Object Storage ,您可以访问任何内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据和丰富的内容,例如图像和视频。您可以直接从互联网或云平台安全地存储数据。您可以在不降低性能或服务可靠性的情况下扩展存储。

    将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留、很少访问或很少访问的“冷”存储。

  • 数据流

    数据流是一项完全托管的 Apache Spark 服务,可以对超大数据集执行处理任务,没有要部署或管理的基础结构。数据流是一个可视化程序,表示从源数据资产(例如数据库或平面文件)到目标数据资产(例如数据湖或数据仓库)的数据流。在创建、查看或编辑数据流时,将打开 OCI 数据集成直观的 UI 设计器。

将数据加载到云存储中并复制到 Snowflake

此架构使用带有 Python 的各种云存储 API 将数据从 OCI Object Storage 复制到其他云提供商,例如 AWS S3、Google Cloud Storage 或 Azure Blob Storage。

您必须首先为您的组织安装和配置相关的云存储:

  1. 将数据加载到 Amazon S3 并复制到 Snowflake:
    1. 安装 Boto3
    2. 用于 Snowflake 存储集成的 S3 配置
    该过程从 OCI Object Storage 中读取 ZIP 文件,并提取目标 Amazon S3 中的内容。复制文件后,可以使用 COPY INTO Snowflake 命令将数据加载到表中。
  2. 将数据加载到 Google Cloud Storage 中并复制到 Snowflake 中:
    1. 安装 Google Cloud SDK
    2. 用于 Snowflake 存储集成的 Google Cloud Storage 配置
    该过程从 OCI Object Storage 中读取 ZIP 文件,并提取目标 Google Cloud 中的内容。复制文件后,可以使用 COPY INTO Snowflake 命令将数据加载到表中。
  3. 将数据加载到 Azure Blob Storage 并复制到 Snowflake:用于 Snowflake 存储集成的 Azure 容器配置。该过程从 OCI Object Storage 中读取 ZIP 文件,并提取目标 Azure Blob Storage 中的内容。复制文件后,可以使用 COPY INTO Snowflake 命令将数据加载到表中。


migrate-fa-snowflake-third-party-storage-oracle.zip

此体系结构支持以下组件:

  • 数据科学

    Oracle Cloud Infrastructure Data Science 是一个完全托管的无服务器平台,数据科学团队可以使用该平台在 Oracle Cloud Infrastructure (OCI) 上构建、训练和管理机器学习 (ML) 模型。它可以轻松与其他 OCI 服务(例如 Oracle Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage 等)集成。您可以构建和评估高质量的机器学习模型,通过快速部署企业可信数据来提高业务灵活性,还可以通过更轻松地部署机器学习模型来支持数据驱动的业务目标。借助数据科学,数据科学家和机器学习工程师可以免费使用 Anaconda Repository 中的程序包。

  • 对象存储

    通过 OCI Object Storage ,您可以访问任何内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据和丰富的内容,例如图像和视频。您可以直接从互联网或云平台安全地存储数据。您可以在不降低性能或服务可靠性的情况下扩展存储。

    将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留、很少访问或很少访问的“冷”存储。