Oracle Cloud 上部署 Informatica IDMC 的分析平台

Oracle 與 Informatica 的合作夥伴關係中整合了資料庫與資料管理中的兩個業界頂尖人才,提供全方位的企業資料倉儲和湖泊生態系統。

此參考架構展示 Informatica IDMC 安全代理程式如何在 Oracle Cloud Infrastructure (OCI) 中運作。只要使用超過 300 個連接器,然後匯入 Oracle Autonomous Database 中,就能從廣泛的內部部署和雲端來源匯出資料,以供分析或資料科學流程使用。

若無此整合,我們可從應用系統資料 (例如 Oracle E-Business Suite) 存取可操作的資訊,但無法以其他資料來源強化此資料,以獲取寶貴的洞察分析。在作業系統上執行分析工作負載也是不錯的做法。

此參考架構可在整體業務內容中定位技術解決方案:



此整合提供一個分析平台,其中包含互動記錄的應用程式資料會與管理層層中的其他一組精心策劃資料合併,並精簡入侵層中的可行資訊和洞察力。

架構

此參考架構展示 Informatica IDMC 安全代理程式如何在 Oracle Cloud Infrastructure (OCI) 中運作。資料從內部部署和雲端型企業應用程式、檔案、物件儲存和資料庫匯出,然後匯入到 Oracle Autonomous Database 中,供分析或資料科學流程使用。

下圖是參照架構的功能表示。



iratica-oci-oracle.zip

一般而言,架構包含下列邏輯分支。此參照架構著重於資料中心與資料持續性架構元件:

  • 擷取、轉換

    將資料納入並縮小架構中每個資料層使用的資料。

  • 保留、曲線、建立

    協助存取及瀏覽資料,以顯示目前與歷史業務檢視。它包含原始資料以及精細和聚總的策劃資料。對於關聯式技術,資料可能以簡單關聯式、縱向、維度或 OLAP 表單進行邏輯或實體結構化。對於非關聯式資料,這一層包含一或多個資料集區,可輸出分析處理作業或針對特定分析工作最佳化的資料。

    Oracle Autonomous Data Warehouse 是一項自我驅動、自我保護、自我修復的資料庫服務,專為資料倉儲工作負載最佳化。您不需要設定或管理任何硬體,或安裝任何軟體。Oracle Cloud Infrastructure 可處理建立資料庫,以及備份、打補丁、升級和調整資料庫。

  • 分析、學習、預測

    將消費者的資料邏輯業務視圖摘要。此抽象概念有助於靈活運用開發方法、移轉至目標架構,以及從多個聯合來源提供單一報告層。



iratica-oci-arch-oracle.zip

在上述架構中,運算資源配置代管了 Informatica Cloud 安全代理程式。Informatica Cloud Secure Agent 是輕量型計畫,可執行所有任務,並在您的組織與 Informatica Intelligent Data Management Cloud 之間透過防火牆進行安全通訊。Secure Agent 執行作業時,會連線至 Informatica Cloud 代管設施以存取任務資訊。它可直接安全地連線至來源和目標、在來源與目標之間傳輸資料、協調作業流程、執行處理,以及執行任何其他作業需求。

架構具有下列元件:

  • 租用戶

    租用戶是指註冊 Oracle Cloud Infrastructure 時,Oracle 在 Oracle Cloud 內設定的安全獨立分割區。您可以在租用戶的 Oracle Cloud 中建立、組織及管理您的資源。租用戶與公司或組織同義。通常,公司會有單一租用戶,並反映其在該租用戶內的組織結構。單一租用戶通常與單一訂閱關聯,而單一訂閱通常只有一個租用戶。

  • 區域

    Oracle Cloud Infrastructure 區域是一個包含一或多個資料中心 (稱為可用性網域) 的本地化地理區域。區域與其他區域無關,而且遠距離也能分隔它們 (跨國家或甚至大陸)。

  • 可用性網域

    可用性網域是區域內的獨立資料中心。每個可用性網域中的實體資源會與其他可用性網域中的資源隔離,以提供容錯能力。可用性網域並不共用基礎架構,例如電源或冷卻系統,或內部可用性網域網路。因此,一個可用性網域發生失敗並不會影響區域中的其他可用性網域。

  • 區間

    區間是 Oracle Cloud Infrastructure 租用戶的跨區域邏輯分割區。使用區間在 Oracle Cloud 中組織您的資源、控制對資源的存取,以及設定使用狀況配額。若要控制對指定區間中資源的存取,您需要定義可指定誰存取資源的原則,以及可執行哪些動作。

  • 虛擬雲端網路 (VCN) 和子網路

    VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可客製化的軟體定義網路。與傳統資料中心網路一樣,VCN 可讓您完整控制您的網路環境。VCN 可以有多個非重疊的 CIDR 區塊,您可以在建立 VCN 之後變更這些區塊。您可以將 VCN 區段成子網路,可以將範圍擴展到區域或可用性網域。每個子網路都包含一個連續的位址範圍,這些位址不會與 VCN 中的其他子網路重疊。您可以在建立子網路後變更其大小。子網路可以是公用或專用。

  • 安全清單

    針對每個子網路,您可以建立指定來源、目的地以及必須允許進出子網路之流量類型的安全規則。

  • 路由表格

    虛擬路由表包含規則,用於將流量從子網路遞送至 VCN 以外的目的地 (通常是透過閘道)。

  • 網際網路閘道

    網際網路閘道可允許 VCN 中公用子網路與公用網際網路之間的流量。

  • 網路位址轉譯 (NAT) 閘道

    NAT 閘道可讓 VCN 中的專用資源存取網際網路上的主機,而不會將這些資源暴露給內送網際網路連線。

  • 服務閘道

    服務閘道可讓您從 VCN 存取其他服務,例如 Oracle Cloud Infrastructure Object Storage。從 VCN 到 Oracle 服務的流量透過 Oracle 網路架構旅行,而一律不透過網際網路。

  • 堡壘主機服務

    Oracle Cloud Infrastructure 堡壘主機針對沒有公用端點的資源,並且需要嚴格的資源存取控制,例如裸機和虛擬機器、Oracle MySQL Database ServiceAutonomous Transaction Processing (ATP)、Oracle Container Engine for Kubernetes (OKE) 以及允許 Secure Shell 協定 (SSH) 存取的其他資源,提供有限且時間的安全存取。您可以使用 Oracle Cloud Infrastructure 堡壘主機,無須部署和維護跳躍主機,即可存取專用主機。此外,您還可以使用身分識別型權限以及集中化、稽核且有時間限制的 SSH 階段作業來改善安全態勢。Oracle Cloud Infrastructure 堡壘主機不再需要公用 IP 進行堡壘主機存取,因此在提供遠端存取時,完全免除此麻煩和潛在攻擊面。

  • 計算

    Oracle Cloud Infrastructure Compute 服務可讓您在雲端佈建及管理運算主機。您可以根據 CPU、記憶體、網路頻寬與儲存等資源需求,啟動具有資源配置的運算執行處理。建立運算執行處理之後,您可以安全地存取它、重新啟動它、連附磁碟區,然後在不再需要磁碟區時將它終止。

  • 身分識別與存取管理 (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) 是 Oracle Cloud Infrastructure (OCI) 和 Oracle Cloud Applications 的存取控制層。您可以使用 IAM API 和使用者介面管理識別網域和識別網域內的資源。每個 OCI IAM 識別網域代表獨立的身分識別和存取管理解決方案,或是不同的使用者群體。

  • 原則

    Oracle Cloud Infrastructure Identity and Access Management 原則可指定誰可存取哪些資源,以及如何存取資源。存取權會在群組和區間層次被授予,這表示您可以撰寫一個原則,讓群組成為特定區間或租用戶的特定存取類型。

  • 物件儲存

    物件儲存可讓您快速存取任意內容類型的大量結構化和非結構化資料,包括資料庫備份、分析資料,以及影像和影片等豐富內容。您可以安全地儲存資料,然後直接從網際網路或雲端平台內擷取資料。順暢調整儲存體,不會發生任何效能或服務可靠性的降低情形。使用標準的「熱門」儲存空間,快速、立即、經常存取。將封存儲存體用於您長期保留的「冷」儲存體,極少或罕見地存取。

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse 是一項自我驅動、自我保護、自我修復的資料庫服務,專為資料倉儲工作負載最佳化。您不需要設定或管理任何硬體,或安裝任何軟體。Oracle Cloud Infrastructure 可處理建立資料庫,以及備份、打補丁、升級和調整資料庫。

建議

使用以下建議作為在 Oracle Cloud 上整合 Informatica IDMC 平台的起點。

您的需求可能與此處所述的架構不同。

  • 虛擬雲端網路 (VCN)

    建立 VCN 時,請根據計畫要在 VCN 中連附至子網路的資源數目,決定所需的 CIDR 區塊數目與每個區塊的大小。使用標準專用 IP 位址空間內的 CIDR 區塊。

    選取未與任何其他網路重疊的 CIDR 區塊 (在 Oracle Cloud Infrastructure 中、企業內部部署資料中心或其他雲端提供者),以設定專用連線。

    建立 VCN 之後,您可以變更、新增以及移除其 CIDR 區塊。

    設計子網路時,請考量您的流量和安全需求。將特定層或角色中的所有資源連附至相同的子網路,作為安全界限。

    使用區域子網路。

  • 虛擬機器和其他建議

    如需瞭解虛擬機器的大小和其他建議,請參閱「部署」區段中的連結。

  • 安全清單

    使用安全清單定義套用至整個子網路的輸入和輸出規則。

注意事項

Oracle Cloud 上整合 Informatica IDMC 平台時,請考慮以下導入選項。

Informatica 整合 資料轉換 資料持續性平台
建議 Informatica Intelligent Data Management Cloud (IDMC) Oracle Autonomous Data Warehouse (廣告)
其他選項 不適用 Exadata
理由 Informatica 認為 Informatica IDMC 是最全面的微服務型、API 導向和 AI 驅動的企業整合平台即服務。透過 IDMC,客戶可以彈性使用任何雲端服務 Informatica,以滿足其整合和治理需求。 ADW 是一項容易使用的完全自治式資料庫,可靈活調整規模、提供快速的查詢效能,且無需資料庫管理。它也可使用外部表格,直接從物件儲存存取資料。

部署

Terraform 程式碼在 Oracle Cloud Infrastructure Resource Manager 提供範例堆疊。您也可以從 GitHub 下載程式碼,然後依據您的需求加以自訂。

  • 使用 Oracle Cloud Infrastructure Resource Manager 中的範例堆疊進行部署:
    1. 請前往 部署到 Oracle Cloud

      如果您尚未登入,請輸入租用戶和使用者證明資料。

    2. 選取您想要部署此堆疊的區域。
    3. 請依照螢幕上的提示與指示建立堆疊。
    4. 建立堆疊之後,按一下 Terraform 動作,然後選取計畫 (Plan)
    5. 等待工作完成,並複查計畫。

      若要進行任何變更,請返回「堆疊詳細資訊」頁面,按一下編輯堆疊,然後進行必要的變更。接著,再次執行計畫 (Plan) 動作。

    6. 如果不需要進一步的變更,請返回「堆疊詳細資訊 (Stack Details)」頁面,按一下 Terraform 動作,然後選取套用 (Apply)
  • 使用 GitHub 中的 Terraform 程式碼部署:
    1. 前往 GitHub
    2. 複製或下載儲存區域到您的本機電腦。
    3. 遵循 README 文件中的說明。

變更日誌

此日誌列出重大變更:

確認

  • 作者:Larry Fumagalli,Wei Han
  • 貢獻者:Robert Lies