重新加载数据集的数据

通过在数据集数据更新时重新加载数据集数据,使分析内容保持最新。

关于重新加载数据集的数据

您可以重新加载数据集中的数据以使其保持最新。

重新加载数据可确保工作簿和可视化包含当前数据。数据集重新加载完成并刷新工作簿之后,最新数据将显示在工作簿和可视化中。请参见刷新工作簿的数据

如何重新加载数据集取决于数据来源。

数据集源类型 如何重新加载数据
支持增量加载的数据库中的数据

如果数据集使用的数据源支持增量加载,您可以用增量方式重新加载数据集的数据。增量加载仅加载新数据或更新的数据。请参见以增量方式重新加载数据集的数据

来自外部连接的数据 为具有外部连接的数据集重新加载数据时,将重新运行该数据集的 SQL 语句,并且将数据访问字段设置为自动高速缓存的表的当前数据加载到高速缓存中。

如果您的数据集包含一个或多个数据访问字段设置为自动高速缓存的表,则可以使用数据页重新加载数据集中的表。 您还可以设置一个调度,以每小时一次的频率重新加载数据集的表。请参见调度数据集重新加载

来自 Excel、CSV 或 TXT 文件的数据 重新加载 Microsoft Excel 文件(XLSX 或 XLS)时,新的电子表格文件必须包含与原始文件同名的工作表。并且该工作表必须包含与数据集中相同的列。如果加载的文件缺少列,则数据重新加载会失败。

重新加载 CSV 或 TXT 文件时,它必须包含与数据集中相同的列。如果加载的文件缺少列,重新加载将失败。

要重新加载使用一个文件作为源的数据集,请使用数据

来自 Oracle Fusion Cloud Applications Suite 的数据

您可以重新加载 Fusion Applications Suite 数据源的数据和元数据。如果 Fusion Applications Suite 数据源使用逻辑 SQL,则重新加载数据将重新运行数据集的 SQL 语句。

从工作簿编辑器重新加载数据

编辑工作簿时,可以重新加载数据,以使用最新的数据更新工作簿。

  1. 主页上,找到相应工作簿并单击打开
  2. 单击可视化选项卡。
  3. 在“数据”窗格上,右键单击连接名称或数据集名称,然后选择重新加载数据

重新加载数据集中的单个表

可以使用数据集编辑器为使用连接的单个数据集表重新加载数据。重新加载会查询表的数据源,并将当前数据加载到高速缓存中。

如果要重新加载使用文件作为源的表,则请参见重新加载数据集的文件
“重新加载”选项可用于数据访问字段设置为自动高速缓存的所有数据集表。
通常,您会同时重新加载数据集的所有表,以便所有表的数据均一致。但是,有时仅重新加载数据集的其中一个表更有意义。例如,您知道数据在一个事实表中发生了更改,而在任何维表中都没有发生更改。
重新加载不会更新表的概要分析数据预览信息。要在数据预览中查看最新数据,请在重新加载表后重新对表进行概要分析。
  1. 主页上,依次单击数据数据
  2. 单击数据集选项卡。
  3. 将光标悬停在要重新加载的数据集上,依次单击操作重新加载数据
  4. 选择表,然后单击立即运行

重新加载数据集中的表

可以使用数据集选项卡重新加载使用连接且数据访问字段设置为自动高速缓存的数据集表的数据。重新加载会查询表的数据源,并将当前数据加载到高速缓存中。

注:

还可以使用 REST API 以编程方式重新加载基于连接的现有数据集的数据。请参见 REST API for Oracle Analytics Cloud 中的 Reload data for a dataset

重新加载数据可确保工作簿和可视化包含当前数据。数据集重新加载完成并刷新工作簿之后,最新数据将显示在工作簿和可视化中。

如果要重新加载包含多个表且使用文件作为源的数据集,或者数据集包含从连接和文件创建的表组合,则请参见重新加载数据集的文件
如果将一个或多个表的数据访问字段设置为自动高速缓存,并且数据源连接包含一个或多个表的身份证明,则重新加载数据选项可用于所有数据集。
数据访问字段设置为实时的数据集表不会包含在重新加载中。请参见指定数据集表是高速缓存还是实时
已创建或拥有数据集的用户,或者具有数据集读写权限的用户以及具有数据源连接只读权限的用户,可以重新加载数据集的表。
您可以创建并使用调度来运行数据集重新加载。请参见调度数据集重新加载
  1. 主页上,依次单击导航器 用于显示导航器的“导航器”图标数据
  2. 将光标悬停在要重新加载的数据集上,依次单击操作重新加载数据

  3. 选择要重新加载的表,然后单击立即运行

重新加载数据集的文件

基于 XLSX、XLS、CSV 或 TXT 文件重新加载数据集中的数据,确保您拥有最新的工作簿内容。

开始之前,请确保要上载的文件包含的列与现有数据集相同。

重新加载数据集的文件可确保工作簿和可视化包含当前数据。文件重新加载完成并刷新工作簿之后,最新数据将显示在工作簿和可视化中。

从主页中重新加载数据集的文件
  1. 主页上,依次单击导航器 用于显示导航器的“导航器”图标数据
  2. 单击数据集选项卡。
  3. 将光标悬停在要重新加载的数据集上,依次单击操作重新加载数据
  4. 上载文件对话框中,将文件拖放到对话框上,或单击选择文件以浏览文件。

  5. 单击确定
如果您在使用数据集编辑器,则可以通过右键单击“联接图表”中的数据集并选择上载文件来重新加载数据。

以增量方式重新加载数据集的数据

在源数据库中有新数据时,可通过高效地重新加载数据集,使分析内容保持最新。

以增量方式加载数据集概览

您可以通过实施增量数据集加载使工作簿保持最新。

以增量方式重新加载数据可刷新数据并最大限度减少处理时间。

在何处配置增量加载?

在 Oracle Analytics 中,可以使用数据访问选项中的高速缓存重新加载类型为数据集配置增量加载。
GUID-8F20639A-2EB8-40DF-BE20-9B49B1CCD16C-default.png 的说明如下
.png 的说明

支持哪些增量加载类型?

在 Oracle Analytics 中,您可以:
  • 使用加载新数据和更新的数据选项,加载新记录和现有记录的更新(称为更新插入)。
  • 使用将新数据添加到现有数据选项,仅加载新记录(称为插入)。

如果增量加载不适合您的数据,您可以选择通过选择替换现有数据选项重新加载所有数据。例如,如果数据中有很大一部分会定期更改,则完整加载可能更高效。

支持增量加载数据集的数据库类型

  • Oracle 数据库
  • Oracle 应用产品
  • Oracle Autonomous Data Warehouse (ADW)
  • Oracle Autonomous Transaction Processing (ATP)
  • Oracle Cloud Infrastructure Object Storage
  • Oracle Talent Management Cloud/Oracle Talent Acquisition Cloud (Taleo)
  • DB2
  • Informix
  • MySQL
  • SQL Server
  • Sybase ASE 和 Sybase IQ

处理不同时区的数据

如果数据中的时间戳与默认 Oracle Analytics 时区(世界协调时间 (Universal Time Coordinated, UTC))之间存在时间差异,您可以指定一个考虑了该时间差异的偏移,以便正确加载数据。例如,如果您的源系统采用太平洋标准时间 (Pacific Standard Time, PST)(比 UTC 慢八小时)进行记录,则将增量偏移时间设置为 8 小时。请参见将数据集配置为以增量方式加载

将数据集配置为以增量方式加载

可通过将数据集配置为以增量方式加载来使其保持最新。例如,如果源系统具有新记录,则仅将新记录加载到数据集,以最大限度地减少系统流量和处理时间。

如果您未指定新数据指示符列,Oracle Analytics 将使用文件修改时间戳来确定新数据的可用时间。完成此配置后,可以按增量方式重新加载数据集。
开始之前,请确保您的数据集基于支持增量加载的数据库类型。请参见支持以增量方式重新加载数据集的数据库
  1. 主页上,依次单击导航器 用于显示导航器的“导航器”图标数据,然后将光标悬停在要刷新的数据集上。
  2. 依次单击操作 列出您可以执行的操作的“操作”选项打开
  3. 联接图表中,双击要刷新的表。
  4. 单击编辑定义
  5. 确保右侧显示数据访问选项。
    如果未显示数据访问选项,请将光标悬停在窗口右边缘的中心以找到展开选项,然后单击展开
    使用数据访问面板上的高速缓存重新加载类型选项配置刷新。
  6. 数据访问中,选择自动高速缓存
  7. 高速缓存重新加载类型中,指定增量刷新类型。
    • 选择加载新数据和更新的数据(也称为更新插入)以在有新记录或更新了现有记录时加载新数据。例如,您可能想要加载新事务处理以及对现有事务处理的更改。
    • 选择将新数据添加到现有数据(也称为插入)以在有新记录时加载新数据。例如,您可能想要仅加载新事务处理。
    替换现有数据选项将完全重新加载数据。
  8. 用户键列中,指定唯一标识记录的用户键列。单击字段以显示可用列,然后选择一列或多列。
  9. 新数据指示符列中,指定一个或多个用于检测新数据或更新数据的列。例如,您可以指定唯一事务处理 ID 列来标识数据源中的新事务处理。
    如果要从 Oracle Cloud Infrastructure Object Storage 中的文件加载数据,则不会显示新数据指示符列字段,因为 Oracle Analytics 使用文件修改时间戳。
  10. 如果数据中的时间戳与默认 Oracle Analytics 时区(世界协调时间 (Universal Time Coordinated, UTC))之间存在时间差异,在增量偏移时间中,更改默认值(“无”)。例如,如果您的源系统采用太平洋时区 (Pacific Time Zone, PST)(比 UTC 慢八小时)进行记录,则将增量偏移时间设置为 8 小时。
  11. 单击确定

以增量方式加载数据集数据

以增量方式加载数据集数据以使工作簿保持最新。您可以加载一次数据,也可以定期加载数据。

开始之前,将数据集配置为以增量方式加载。请参见将数据集配置为以增量方式加载
  1. 主页上,依次单击导航器 用于显示导航器的“导航器”图标数据,然后将光标悬停在要刷新的数据集上以显示操作 列出您可以执行的操作的“操作”选项 选项。

  2. 要加载一次数据,请单击重新加载数据
    单击运行重新加载,选择要重新加载的表,然后单击立即运行

  3. 要定期加载数据,请单击新建调度
    使用“调度”对话框指定所需的刷新开始时间和数据刷新频率,然后单击确定

可使用“检查”对话框上的“调度”选项卡查看更新。请参见查看数据集的重新加载历史记录查看和下载数据集重新加载作业的日志文件
如果您钻探到增量加载的任务级别详细信息,您将会看到刷新模式设置为“增量”。

查看数据集的重新加载历史记录

系统会在作业级别和表级别为数据集重新加载生成历史信息。

使用数据集的重新加载历史记录可以查找以下方面的信息:重新加载的执行方式(手动还是按调度)、作业状态、开始时间、结束时间以及重新加载的数据量(以字节为单位)等。您还可以钻探了解作业的已重新加载表的相关信息。例如,表的源名称、重新加载状态和行数。
当重新加载使用连接的数据集时,Oracle Analytics 会生成历史信息。
重新加载以下数据集时,Oracle Analytics 不会生成历史信息和日志文件:
  • 数据集仅使用文件。
  • 数据集使用连接和文件。Oracle Analytics 仅为数据集中使用连接的表生成历史信息。
  • 数据集使用 Oracle EPM Cloud 或 Oracle Essbase 连接。
  1. 主页上,依次单击导航器 用于显示导航器的“导航器”图标数据
  2. 数据集选项卡上,将光标悬停在数据集上,然后依次单击操作检查
  3. 单击历史记录选项卡以查看对该数据集完成的数据加载作业。

  4. 单击列表中的作业以显示一般信息选项卡,此选项卡提供作业的概览。
  5. 可选: 单击状态选项卡以显示在作业中执行的任务。

    单击列表中的任务可显示该任务的日志信息。如果加载是增量加载,您将会看到刷新模式设置为“增量”。

查看和下载数据集重新加载作业的日志文件

您可以查看数据集重新加载作业的日志文件,以帮助您排除数据集重新加载问题。

例如,如果您在重新加载数据时遇到问题,日志可以帮助您确定是否是配置存在问题,例如,密码无效或过时,或者是否是数据过多的问题。在这种情况下,日志文件包含关键操作的时间戳和处理的记录数信息。您可以在作业级别和表级别查看日志。
当您重新加载使用连接的数据集时,Oracle Analytics 会生成日志文件。如果数据集使用一个或多个文件,或者使用 Oracle EPM Cloud 或 Oracle Essbase 连接,则不会生成日志文件。
  1. 在主页上,依次单击导航器 用于显示导航器的“导航器”图标数据
  2. 数据集选项卡上,将光标悬停在数据集上,依次单击操作检查
  3. 单击历史记录选项卡,然后单击要查看的作业。

  4. 一般信息选项卡中,单击右上角的作业详细信息菜单 省略号 并选择查看日志以查看日志,或者选择下载日志以将日志保存到本地文件区域。
  5. 如果作业重新加载了多个表,而您想要查看特定表的日志信息,则依次单击状态、该表的重新加载任务名称、右上角的作业任务菜单 省略号查看日志