OCI 数据流 SQL 端点分析概览

您可以使用 Oracle Analytics Cloud 来分析对象存储、数据湖和应用程序中 OCI 数据流 SQL 端点的数据。

数据流 SQL 端点专为开发人员、数据科学家和高级分析师而设计,可直接访问数据在数据湖中的存储位置来对数据进行交互式查询。

使用 OCI 数据流 SQL 端点的好处

  • 您可以分析数据湖上的大量事件和时间序列数据,而无需移动和汇总数据以提高性能。
  • 您可以将来自多个应用程序和数据存储(例如,在企业资源规划中)的数据合并到对象存储中,并执行即席查询,无论数据源自何处。
  • 您可以省去提取和预聚合,并在任意粒度级别上处理实时数据。因此,您不仅可以在准备数据时节省时间和精力,还可以使用更强大的分析功能。
提升性能的最佳实践


  • 要在 Spark 集群层利用索引编制和缓存功能,请基于单个表或视图创建数据集。基于多表联接的数据集受支持,但是不建议使用。
  • 配置 OCI 数据流 SQL 端点集群时,将 incrementalCollect 设置为 true,例如:

    spark.sql.thriftServer.incrementalCollect=true;

可视化来自 OCI 数据流 SQL 端点的数据

在 Oracle Analytics Cloud 工作簿编辑器中,添加多个 OCI 数据流 SQL 端点表或多维数据集。选择表或多维数据集时,可以将维列和度量列添加到数据集以进行分析。