规划数据资源池

规划数据资源池时,请考虑针对拥有数十亿条数据记录的银行、经纪人和金融服务的以下相关用例:

  1. 建立企业级数据中心,包括用于结构化数据的数据仓库以及用于半结构化和非结构化数据的数据湖。此数据资源池将成为数据的唯一事实来源。
  2. 使用大数据处理技术将关系数据源与其他非结构化数据集集成。
  3. 使用语义建模和强大的可视化工具简化数据分析。

了解业务使用案例

下面是资金评估系统的高级视图,它使用旧会计系统在数据集市中分批提供估价数据。

数据集市还从其他参考数据源获取批参考数据。数据集市将分批的资金估价数据推送到工作流中的下游系统。

因为定价是静态的,通常在一天结束时,旧系统,即使所有系统都正常工作,也不像用户需要那样响应。

例如,在 2022 年第二季度,当市场极度波动时,所有用户群体都处于高度警戒状态,每个人都希望了解最新的价格和市场价值,以便他们能够识别整天的持仓。获取最新价格并实时获得市场价值,是传统基金估值制度的重大要求。



为了实时捕获最新价格并获取市场价值,旧会计系统必须捕获最新价格,将数据推送到数据集市,并每天重复多次批处理工作流程,这既没有响应,也没有可持续性。

了解解决方案

此解决方案不需要对旧系统进行任何更改,而旧系统会像以前一样继续发布批估价数据。

实时定价和汇率从各自的流中获取,并应用于定价以查找不同货币的市场价值。



无服务器 Oracle Cloud Infrastructure 体系结构支持批处理和实时数据。批数据包括组合参考数据的快照流、增量增量增量增量以及估价数据的更改数据捕获 (CDC) 流。实时数据包括价格和汇率流。该架构包括用于整理批和实时数据以获得实时价格、以本位币表示的市场价值以及以外币表示的市场价值的流程。

示例体系结构

下图显示了 Oracle Cloud Infrastructure (OCI) 上客户启动的现代化数据平台架构。

此架构可用于财务用例,例如用于获取实时资金洞察、检测异常交易以及用于一般财务数据清理、汇总和可视化的案例。



oci-fund-lakehouse-arch-oracle.zip

此架构的核心功能之一是其多层数据湖库。它包含数据资源池中的三个不同级别的数据处理,即用于结构化仓库的 Oracle Autonomous Data Warehouse (ADW),用于元数据和监管的 Oracle Cloud Infrastructure 数据目录,以及用于使用 Spark 作业进行大数据处理和转换的数据流

青铜数据资源池是数据格式的第一个目标,通常为原始数据,或者它靠近它。这包括驻留在 OCI 中的数据以及来自第三方平台的数据。Oracle Data Integration (ODI) 是用于此集成的工具之一。

数据流应用程序可以处理大多数铜到银数据转换和清理。Oracle Cloud Infrastructure Vision 使用光学字符识别 (OCR) 技术从传真图像中提取文本。Vision 输出数据(文本)由青铜湖在 Oracle Functions 的帮助下发送到银湖。

数据流从银湖层到黄金数据湖执行其他数据转换,数据将加载到 ADW 中,而 ADW 则提供 Oracle Analytics Cloud 和第三方分析和可视化工具。

该体系结构包括以下附加功能:

  • 通过使用 OCI 服务连接器中心集成的 OCI 流处理和 OCI 通知,可提供异常的交易通知。
  • 通过使用 Kafka Connect 将 OCI 流数据发送到 OCI Search Service,并通过 OpenSearch 提供流分析以获得实时资金洞察。OpenSearch 仪表盘是 OCI 搜索服务的集成组件,可提供 OpenSearch 数据的直接可视化。
  • 数据科学家可以使用 OCI 数据科学来探索数据池,这是一个完全托管的无服务器平台,可用于查询 ADW、对象存储、第三方云以及正确连接的内部部署系统。