資料平台 - 業務範圍的部門資料倉儲 (LOB)

使用 Oracle Autonomous Data WarehouseOracle Analytics CloudOracle E-Business Suite 、試算表、第三方和其他來源的資料載入集中式資料倉儲並進行最佳化,讓部門可以分析資料並取得可操作的洞察分析。

此參照架構將技術解決方案定位於整體商業相關資訊環境內:



業務範圍通常沒有及時或有效率的資料與資訊存取權。分析員可以手動收集資料、個別處理資料,然後透過電子郵件或檔案伺服器共用檔案複本。資料並未集中化,因此請確保資料的準確性與安全性難以解決。分析可能需要很長的時間,而且結果無法輕鬆重複。

部門資料倉儲是一種簡單的資料倉儲形式,著重於單一主題或功能區域,例如銷售、行銷或財務,且通常是由組織內的單一部門建立和控制。由於部門資料倉儲僅需單一主旨即可從少數來源提取資料。來源可包含內部系統、中央資料倉儲或外部資料。

治理企業和部門資料倉儲可為業務使用者提供豐富的資訊,並更有效地提供組織的主要績效指標,而無須仰賴 IT 資源和可用性。

架構

此架構使用 Oracle Autonomous Data Warehouse 將多個財務系統、試算表和其他資料來源的資料載入集中式資料倉儲,然後使用 Oracle Analytics Cloud 分析資料以提供可行的洞察分析。

此架構支援多個使用案例。最直接路徑提供的簡單方法,就是使用 Oracle Autonomous Data Warehouse (ADW) 內嵌的工具,來取得、轉換並將資料載入資料倉儲中。其他路徑支援使用資料湖或具有更複雜擷取、轉換及載入 (ETL) 需求的情境。


data-platform-ebs.png 的描述如下
資料平台的圖解描述 -ebs.png

資料平台 -ebs-oracle.zip

架構著重於下列邏輯部門:

  • 擷取、轉換、連線

    將資料納入並縮小架構中每個資料層使用的資料。

  • 保留、曲線、建立

    協助存取與瀏覽資料以顯示目前的業務檢視。對於關聯技術而言,資料可以是邏輯或實體結構化,採用簡單的關聯式、縱向、維度或 OLAP 表單。對於非關聯式資料,此層包含一或多個資料集區,可以是來自分析程序的輸出,或是針對特定分析任務最佳化的資料。

  • 分析、學習、預測

    摘錄用戶資料的邏輯業務檢視。此抽象可協助靈活的方法開發、移轉至目標架構,以及從多個聯合來源佈建單一報表層。

下圖顯示架構與 Oracle Cloud Infrastructure 上所提供服務的對應 (基本安全性)。



oci-adb-oac-arch-public-oracle.zip

此架構具有下列元件:

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse 是一項針對資料倉儲工作負載最佳化的自我驅動、自我保護、自行修復資料庫服務。您不需要設定或管理任何硬體,或是安裝任何軟體。Oracle Cloud Infrastructure 可處理建立資料庫,以及備份、修正、升級和調整資料庫。

  • 分析

    Oracle Analytics Cloud 是一項可擴展且安全的公有雲服務,提供一組完整的功能來瀏覽及執行您、工作群組以及您企業的協作分析。

    透過 Oracle Analytics Cloud,您也可以取得彈性的服務管理功能,包括快速設定、輕鬆擴展與修正,以及自動化的生命週期管理。

  • 資料整合

    Oracle Autonomous Data Warehouse 包括針對許多部門案例取得、載入及轉換資料的工具。

    對於進階使用案例,您可以使用 Oracle Cloud Infrastructure Data Integration、完全受管理、無伺服器、原生雲端服務,協助您進行一般擷取、載入及轉換 (ETL) 工作,例如從不同來源擷取資料、清除、轉換及重新整理該資料,然後有效地將其載入 Oracle Cloud Infrastructure 上的目標資料來源。

此架構還包含下列元件:
  • 區域

    Oracle Cloud Infrastructure 區域是一個本地化的地理區域,包含一或多個資料中心 (稱為可用性網域)。區域與其他區域無關,因此廣大的距離可加以區隔 (跨國家或甚至洲)。

  • 區間

    區間是 Oracle Cloud Infrastructure 租用戶內的跨區域邏輯分割區。使用區間組織您在 Oracle Cloud 中的資源、控制對資源的存取,以及設定使用配額。若要控制對指定區間中資源的存取,您可以定義原則來指定可存取資源的人員及可執行的動作。

  • 身分識別與存取管理 (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) 是 Oracle Cloud Infrastructure (OCI) 和 Oracle Cloud Applications 的存取控制層。IAM API 和使用者介面可讓您管理識別網域和識別網域內的資源。每個 OCI IAM 識別網域代表獨立身分識別與存取管理解決方案或其他使用者群體。

  • 原則

    Oracle Cloud Infrastructure Identity and Access Management 原則可指定誰可以存取哪些資源,以及存取方式。您會在群組和區間層次授予存取權,這表示您可以撰寫一個原則,讓群組在特定區間或租用戶內具有特定類型的存取權。

  • 可用性網域

    可用性網域是區域內的獨立資料中心。每個可用性網域中的實體資源會與其他可用性網域中的資源隔離,以提供容錯能力。可用性網域並不共用基礎設施,例如電力或冷卻系統或內部可用性網域網路。因此,一個可用性網域發生失敗並不會影響區域中的其他可用性網域。

  • 虛擬雲端網路 (VCN) 和子網路

    VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可自訂軟體定義網路。就像傳統的資料中心網路,VCN 可讓您完全控制網路環境。VCN 可以有多個非重疊 CIDR 區塊,而您可以在建立 VCN 之後進行變更。您可以將 VCN 區隔成子網路,然後對區域或可用性網域進行調整。每個子網路都是由不與 VCN 中其他子網路重疊的連續位址範圍所組成。您可以在建立子網路後變更其大小。子網路可以是公用網路或專用子網路。

  • 安全清單

    您可以為每個子網路建立安全規則,以指定必須允許進出子網路的來源、目的地和流量類型。

  • 路由表

    虛擬路由表包含規則,可將流量從子網路遞送至 VCN 外部的目的地,通常透過閘道。

  • 網際網路閘道

    網際網路閘道可允許 VCN 中的公用子網路與公用網際網路之間的流量。

  • 網站至網站 VPN

    網站至網站 VPN 可讓企業內部部署網路與 Oracle Cloud Infrastructure 中 VCN 之間的 IPSec VPN 連線。IPSec 通訊協定套件會先加密 IP 流量,再將封包從來源傳輸至目的地,並在抵達時將流量解密。

  • 動態路由閘道 (DRG)

    DRG 是一個虛擬路由器,可為 VCN 與區域外部網路之間的 VCN (例如另一個 Oracle Cloud Infrastructure 區域中的 VCN、企業內部部署網路或其他雲端提供者中的網路) 之間的專用網路流量提供路徑。

  • 網路位址轉譯 (NAT) 閘道

    NAT 閘道可讓 VCN 中的專用資源存取網際網路上的主機,而不需將這些資源暴露給內送網際網路連線。

  • 服務閘道

    服務閘道可讓您從 VCN 存取其他服務,例如 Oracle Cloud Infrastructure Object Storage 。VCN 到 Oracle 服務的流量會透過 Oracle 網路光纖通道,而一律不會周遊網際網路。

  • 網路安全群組 (NSG)

    網路安全群組 (NSG) 會成為您雲端資源的虛擬防火牆。有了 Oracle Cloud Infrastructure 的零信任安全模型,系統便會拒絕所有流量,而您可以控制 VCN 內的網路流量。NSG 由一組傳入和傳出安全規則組成,僅適用於單一 VCN 中一組指定的 VNIC。

  • 物件儲存

    物件儲存可快速存取任何內容類型的大量結構化與非結構化資料,包括資料庫備份、分析資料,以及豐富內容 (例如影像和影片)。您可以安全地儲存,然後直接從網際網路或雲端平台內擷取資料。您可以無縫擴充儲存,而不會發生任何效能或服務可靠性的降低。針對快速、立即和經常存取的「熱」儲存,使用標準儲存。將封存儲存用於長時間且鮮少存取的「冷」儲存。

建議

您可以使用下列建議作為起點,將多個純文字檔來源的資料載入並最佳化至集中的資料倉儲位置進行分析。

您的需求可能會與此處描述的架構不同。

  • Data Refinery

    Autonomous Database Tools 內嵌於 Oracle Autonomous Data Warehouse 中,提供載入、轉換、目錄、取得洞察分析,甚至以簡單的方式開發商業模型的功能。您可以在「資料庫動作 (Database Actions)」功能表找到這些工具。

  • Oracle Analytics Cloud

    Oracle Analytics Cloud 連線至 Oracle Autonomous Data Warehouse 之前,請讓資料庫管理員將 Oracle Analytics Cloud 執行處理的 IP 位址 (或位址範圍) 新增至允許的位址清單。資料庫管理員必須新增允許從 Oracle Analytics Cloud 至資料庫之 TCP/IP 流量的安全規則。

考量

將多個純文字檔來源的資料載入並最佳化至集中式資料倉儲位置進行分析時,請考慮這些實行選項。

指導 Data Refinery 資料保存平台 存取與解譯
建議 Oracle Autonomous Database 工具 (資料庫動作) Oracle Autonomous Data Warehouse Oracle Analytics Cloud
其他選項 Oracle Cloud Infrastructure 資料整合 Oracle Exadata Database Service  
理由 Oracle Autonomous Data Warehouse 是一個易於使用且完全自治的資料庫,提供直接存取及擷取各種資料來源 (例如 CSV 檔案和關聯式資料來源)。 Oracle Autonomous Data Warehouse 是一個容易使用且完全自發性的資料庫,可靈活地擴展、提供快速的查詢效能,不需要資料庫管理。它也可以透過外部表格,直接從物件儲存存取資料。 Oracle Analytics Cloud 是一個完全受管理且與策劃的資料層 (Oracle Autonomous Data Warehouse) 緊密整合。

建置

GitHub 中提供此參照架構的 Terraform 程式碼。只要按一下即可將程式碼提取至 Oracle Cloud Infrastructure Resource Manager,建立堆疊並加以部署。或者,您也可以使用 Terraform 命令行介面 (CLI),將程式碼從 GitHub 下載至您的電腦、自訂程式碼以及建置架構。

  • 使用 Oracle Cloud Infrastructure Resource Manager 進行部署:
    1. 一下 部署到 Oracle Cloud

      如果您尚未登入,請輸入租用戶和使用者證明資料。

    2. 複查並接受條款與條件。
    3. 選取要建置堆疊的區域。
    4. 依照畫面上的提示和指示建立堆疊。
    5. 建立堆疊之後,按一下 Terraform 動作,然後選取畫。
    6. 等待工作完成,然後複查計畫。

      若要進行任何變更,請返回「堆疊詳細資訊」頁面,按一下編輯堆疊,然後進行必要的變更。然後再執行一次「畫」動作。

    7. 如果不需要進一步的變更,請返回「堆疊詳細資訊」頁面,按一下 Terraform 動作,然後選取用。
  • 使用 GitHub 中的 Terraform 程式碼進行部署:
    1. 前往 GitHub
    2. 將儲存區域複製或下載至您的本機電腦。
    3. 依照 README 文件中的指示進行。

變更日誌

此日誌僅列出重要的變更: