資料平台 - 資料聯合

資料湖倉儲架構可協助您有效地收集和分析事件資料,並即時從裝置串流資料,並將其與廣泛的企業資料資源建立關聯,以運用您的資料投資並取得所需的洞察力。

但您如何將資料湖倉儲中的資料與異質資料來源上的資料建立關聯,或部署在其他雲端或內部部署系統上的資料建立關聯,而不需要複製資料?

答案是利用資料聯合方法,將資料湖倉儲資料與來自第三方雲端存放區的聯合資料,以及來自雲端和內部部署資料庫的資料結合,無論其實體位置為何。

此參考架構將技術解決方案定位於整體業務內容中:



資料聯合是一種技術,可透過聯合查詢引擎,將單一查詢轉換為出貨至來源資料存放區的子查詢,來整合、統一及治理儲存在不同資料存放區中的資料。結果接著會合併並呈現給使用者或應用程式,如下所述。



data-platform-federation-overview-oracle.zip

資料聯合通常與資料虛擬化互換。資料虛擬化會從多個來源建立統一的資料檢視,而不會複製資料,並即時提供全新資料。

就此參照架構而言,即使下方所述的功能同時處理同盟和虛擬化,也一律使用資料同盟一詞。

使用資料聯合可簡化消費者 (例如分析和資料科學引擎) 的資料存取,方法是將他們連線至聯合服務引擎,而不是與多個資料來源相互連結,從而提高聯合資料的重複使用性、治理和安全性。

傳統上,分析引擎提供資料聯合功能,可作為聯合服務引擎的輔助。同盟資料服務引擎通常具備更多功能,可提升效能及因應擴展性,進而隱含地受益於這些分析引擎。

本文件說明 Oracle Cloud Infrastructure 內資料同盟的潛在解決方案,但也可以針對不同案例使用不同技術的替代方案。

功能架構

此架構使用資料湖倉儲來儲存及處理資料,不論其形狀或形式為何。此架構的核心是部署在 Oracle Autonomous Data Warehouse 上的資料倉儲。

此外,架構使用統一的查詢引擎,將所選來源的策劃資料與湖倉一體中的資料同盟。透過使用外部表格、資料庫連結和資料共用等機制 (視資料存放區而定) 取得聯合資料。

結合湖倉一體資料和現有資料存放區的聯合架構可讓您:

  • 無論資料儲存在何處,都結合所有資料
  • 支援將儲存在其他雲端和內部部署的資料聯合在一起的多雲端和混合雲端資料平台
  • 簡化從不同引擎取得及查詢資料的消費者體驗
  • 在聯合查詢引擎強制實行單一資料安全模型以提高安全性
  • 使用資料目錄將儲存在湖倉一體中的個體描述資料統一並與查詢引擎聯合,以增加治理
  • 運用資料具體化和自主資料庫快取提升效能
  • 使用分析儀表板、SQL 介面、API 端點和資料共用功能,向不同的消費者公開整合且精心策劃的資料
  • 運用多模型資料庫作為同盟查詢引擎

下圖說明功能架構。為了簡潔的清酒,並非所有湖倉的功能都會顯示出來。



資料平台同盟 - 功能 -oracle.zip

請注意,此架構描述使用大部分批次處理的聯合資料平台,但可增強資料湖倉儲即時功能以處理串流資料。

串流資料處理通常需要在資料管線內使用相關資訊資料。相關資訊環境資料可能儲存在不同的資料來源上,但將所有相關資訊環境資料提供給資料管線的資料聯合引擎則可簡化這些管線。

架構著重於下列邏輯事業群:

擷取、轉換

擷取及精簡架構中每個資料層所使用的資料。

同盟資料會依需求從雲端儲存、資料庫及資料共用中取用。資料未在此層上轉換,因為來源資料存放區上已加以策劃。

保存、策展、建立

協助存取及瀏覽資料以顯示目前的業務檢視。對於關聯式技術,資料可以在簡單關聯式、縱向、維度或 OLAP 表單中進行邏輯或實體結構化。對於非關聯式資料,此層包含一或多個資料集區,可從分析處理輸出或針對特定分析任務最佳化的資料。

此層包含聯合服務引擎,可統一並提供資料倉儲、資料湖及聯合資料來源中的資料。它可以視需要查詢聯合資料,並將聯合資料具體化,以提高查詢效能。

當資料取用者連線至單一服務引擎而非數個資料存放區時,聯合引擎可以使用 SQL、REST API 或資料共用來服務資料,從而提高互通性,同時簡化連線。

分析、學習、預測

抽象用戶資料的邏輯業務視圖。此抽象有助於靈活的開發方法、移轉至目標架構,以及從多個聯合來源提供單一報告層。

這一層利用服務引擎取得聯合資料,此資料可進一步擴增此層上可用的資料連接器,並由視覺化或資料科學服務提供。

使用聯合查詢引擎可讓資料取用者從基礎資料存放區中抽取存取,因資料同盟一次且由許多資料取用而提高生產力。這也可讓系統更互通,因為任何可與 SQL、REST API 或資料共用互通的用戶都可以使用和加入湖庫和聯合資料。

架構具有下列功能元件:

批次擷取

對於無法即時擷取的資料,或因應即時擷取的成本太高而無法擷取的資料,批次擷取非常有用。將資料轉換為可靠且值得信賴的資訊也十分重要,這些資訊可以進行策劃和保存以供定期使用。

Batch Ingest 可補充資料聯合引擎,因為它可以擷取聯合引擎沒有原生存取的資料,或針對需要轉換資料以符合湖倉一體資料模型的特定使用案例。

您可以一起或獨立使用下列服務,以實現高度彈性且有效的資料整合與轉換工作流程。

  • Oracle Cloud Infrastructure Data Integration 是一項完全受管理的無伺服器雲端原生服務,可從各種資料來源擷取、載入、轉換、清理及重新塑造資料至目標 Oracle Cloud Infrastructure 服務,例如 Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage 。ETL (擷取轉換載入) 運用 Spark 上完全受管理的橫向擴展處理,而 ELT (擷取載入轉換) 運用 Autonomous Data Warehouse 的完整 SQL 下推功能,將資料移動降到最低,並縮短新擷取資料價值的時間。使用者使用直觀且無程式碼的使用者介面設計資料整合程序,將整合流程最佳化以產生最有效率的引擎和協調、自動配置及調整執行環境。Oracle Cloud Infrastructure Data Integration 提供互動式探索和資料準備,並定義處理綱要變更的規則,協助資料工程師防止綱要漂移。

  • Oracle Data Integrator 提供全面的資料整合,從大量和高效能批次載入,到事件驅動的技巧整合流程,到啟用 SOA 的資料服務。宣告式設計方法可確保更快、更簡單的開發與維護,並提供獨特的擷取載入轉換 (ELT) 方法,協助保證資料轉換與驗證程序可能的最高效能。Oracle 資料轉換使用 Web 介面來簡化 ELT 的組態和執行,並協助使用者使用宣告式設計方法建置及排定資料和工作流程。

  • Oracle Data Transforms 可為選取的支援技術啟用 ELT,並透過 Web 使用者介面簡化資料管線的組態與執行,讓使用者能夠以宣告方式建置及排定資料流程與工作流程。Oracle Data Transforms 是 Oracle Autonomous Data Warehouse 內完全受管理的環境,可將資料從數個資料來源載入並轉換成 ADW 執行處理。

視使用案例而定,這些元件可獨立使用或一起使用,以實現高度彈性且高效能的資料整合與轉換。

批次處理

批次處理會轉換儲存在資料湖倉儲中的大型資料集。批次處理運用與 Oracle Cloud Infrastructure Object Storage 緊密整合的 Oracle Cloud Infrastructure 原生服務,並可讓您為使用案例 (例如資料聚總與強化、資料倉儲擷取,以及大規模機器學習和 AI 資料使用) 建立策劃的資料。

上述 Oracle Cloud Infrastructure Data Integration 是一項完全受管理的無伺服器雲端原生服務,可從各種資料來源擷取、載入、轉換、清理及重新塑造資料至目標 Oracle Cloud Infrastructure 服務,例如 Oracle Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage

Oracle Cloud Infrastructure Data Flow 是一項完全受管理的大數據服務,可讓您無須部署或管理基礎架構,即可執行 Apache Spark 應用程式。它可以讓您更快地交付大數據和 AI 應用程式,因為您可以專注於應用程式,而無需管理操作。資料流程應用程式是包含 Spark 應用程式與其相依性、預設參數以及預設程式實際執行資源規格的可重複使用樣板。

份量

Oracle Autonomous Data Warehouse 是一項自我驅動、自我保護、自我修復的資料庫服務,已針對資料倉儲工作負載進行最佳化。您不需要設定或管理任何硬體,也不需要安裝任何軟體。Oracle Cloud Infrastructure 可處理建立資料庫,以及備份、修補、升級和調整資料庫。

佈建之後,您可以隨時調整資料庫的 CPU 核心數目或儲存容量,而不會影響可用性或效能。

ADW 也可以將物件儲存體中的資料虛擬化為外部和混合分割表格,讓您能夠結合和使用從其他來源衍生的資料與倉儲資料。您也可以將歷史資料從倉儲移到物件儲存,然後使用混合分割表格以無縫接軌的方式使用。

ADW 可以使用儲存在 Oracle Cloud Infrastructure Data Catalog 中先前收集的中繼資料來建立外部表格,也可以自動將 Oracle Cloud Infrastructure Data Catalog 中的中繼資料更新與外部表格定義同步,以維持一致性、簡化管理並減少工作負擔。

分析視觀表是 Autonomous Database 功能,提供快速且有效率的方式來建立儲存在現有資料庫表格和視觀表中的資料分析查詢。分析視觀表使用維度模型來組織資料。它們可讓您輕鬆地將聚總和計算式新增至資料集,以及在檢視中呈現資料,這些資料可以用相對較簡單的 SQL 查詢。此功能可讓您使用內部和外部儲存的資料,直接在 ADW 中以半方式建立星狀或雪花狀綱要模型,並使用 SQL 和任何 SQL 相容的資料用戶來允許使用模型。

ADW 可讓您在第三方雲端資料庫 (即 AWS Redshift、Azure Synapse Analytics、Google BigQuery 和 Snowflake)、第三方資料庫 (即 IBM DB2、MongoDB、PostrgreSQL、Hive) 以及甚至是 SaaS 應用程式上,聯合及查詢儲存在第三方雲端商店 (即 AWS S3、Azure Blob 和 GCP CGS) 上的資料。

在單一查詢中,ADW 可以查詢和加入來自雲端存放區、雲端資料庫和其他熱門資料庫的資料,簡化對服務引擎用戶的資料存取,因為這些使用者從個別查詢 (數個查詢引擎) 的複雜性中抽取,以取得統一的結果。它也可以將此資料與從產生器提供的資料共用中取得的資料結合,以符合 Delta Sharing 開放通訊協定。

雲端儲存

Oracle Cloud Infrastructure Object Storage 是一個網際網路規模的高效能儲存平台,提供可靠且符合成本效益的資料持久性。Oracle Cloud Infrastructure Object Storage 可以儲存任何內容類型的非結構化資料,包括分析資料。您可以直接從網際網路或雲端平台內,安全地儲存或擷取資料。多個管理介面可讓您輕鬆從小規模開始並無縫擴展,而不會發生效能或服務可靠性降低的情況。

Oracle Cloud Infrastructure Object Storage 也可以用來作為資料倉儲的冷儲存層,方法是儲存不常使用的資料,然後使用 Oracle Autonomous Data Warehouse 中的混合式表格以無縫接軌的方式與最新資料結合。

視覺化 / 學習

Oracle Analytics Cloud 是可擴展且安全的公有雲服務,可為您提供一組完整功能,供您、您的工作群組和企業進行協作分析。它支援公民資料科學家、進階業務分析師訓練,以及執行機器學習 (ML) 模型。機器學習模型可以在分析服務上執行,或直接在 Oracle Autonomous Data Warehouse 上執行,作為 OML 內嵌模型,用於運用倉儲和 OCI AI 服務 (例如 Oracle Cloud Infrastructure Vision) 的處理能力、擴展性及彈性大型批次預測。

透過 Oracle Analytics Cloud ,您還可以獲得靈活的服務管理功能,包括快速設定、輕鬆擴展和修補,以及自動化生命週期管理。

瞭解並預測

Oracle Cloud Infrastructure Data Science 提供基礎架構、開源技術、程式庫、套裝程式及資料科學工具,讓資料科學團隊在 Oracle Cloud Infrastructure 中建置、訓練及管理機器學習 (ML) 模型。協同合作和專案導向的工作區提供端對端整合式使用者體驗,並支援預測模型的生命週期。資料科學使資料科學家和機器學習工程師能夠直接從 Anaconda Repository 免費下載和安裝套裝程式,從而使他們能夠透過精心策劃的機器學習程式庫資料科學生態系統來創新專案。

資料科學工作功能可讓資料科學家在完全託管的基礎架構上定義和執行可重複的機器學習工作。

資料科學模型部署功能可讓資料科學家將經過訓練的模型部署為完全受管理的 HTTP 端點,以即時提供預測、將智慧融入流程和應用程式,並允許業務在發生相關事件時反應。

Oracle Machine Learning 提供緊密整合在 Oracle Autonomous Database 中的強大機器學習功能,並支援 Python 和 AutoML。它支援使用開放原始碼和可擴展的資料庫內演算法來減少資料準備和移動的模型。AutoML 使用自動演算法選擇、調適型資料抽樣、自動功能選擇和自動模型調整,協助資料科學家縮短實現公司機器學習計畫價值的時間。有了 Oracle Autonomous Data Warehouse 中提供的 Oracle Machine Learning 服務,您不僅可以管理模型,還可以將這些模型部署為 REST 端點,以便在公司內實現即時預測,讓企業能夠在發生相關事件時 (而非事實之後) 反應相關事件。

AI 服務

Oracle Cloud Infrastructure AI Services 服務提供一組立即可用的 AI 服務,可用來支援各種使用案例,從文字分析到預測性維護。這些服務具有預先建置、精細調整的模型,可供您使用 API 整合至資料管線、分析及應用程式。

Oracle Cloud Infrastructure Anomaly Detection 提供一組豐富的工具來即時識別商業資料中不想要的事件或觀測,以便採取行動以避免業務中斷。

Oracle Cloud Infrastructure AI Language 會大規模執行複雜的文字分析。藉由預先訓練和自訂模型,開發人員無需資料科學專業知識即可處理非結構化文字並擷取洞察力。預先訓練的模型支援情感分析、關鍵詞組擷取、文字分類及具名實體辨識。您也可以使用網域特定資料集訓練具名實體識別和文字分類的自訂模型。翻譯服務可讓您翻譯 21 種不同語言的文字。

Oracle Cloud Infrastructure Speech 可讓您輕鬆地將包含人類語音的媒體檔案轉換為高度精確的文字轉錄,藉此充分發揮口說語言的強大功能。OCI Speech 可用於轉譯客戶服務來電、自動建立字幕,以及產生媒體資產的描述資料以建立完全可搜尋的存檔。

Oracle Cloud Infrastructure Vision 會執行影像辨識和文件分析作業,例如將影像分類、偵測和臉部、擷取文字以及辨識表格。您可以利用預先訓練的模型,或輕鬆為產業和客戶特定案例建立自訂視覺模型。Vision 服務是完全受管理的多租用戶原生雲端服務,可協助處理所有常見的電腦視覺作業。

Oracle Cloud Infrastructure Document Understanding 會執行文件分析作業,例如擷取文字和辨識表格。OCI 文件理解服務是完全託管的多租戶原生雲端服務,可協助處理所有常見的文件分析工作。

資料增強功能

資料強化可改善用於訓練機器學習模型的資料,以獲得更好且更準確的預測結果。

Oracle Cloud Infrastructure Data Labeling 可讓您建立和瀏覽資料集、檢視資料記錄 (文字或影像),以及套用標籤以建立 AI/ML 模型。此服務也提供專為協助標示程序而設計的互動式使用者介面。記錄加上標籤之後,即可將資料集匯出為以行分隔的 JSON,以用於 AI/ML 模型開發。

API

API 層可讓您將從資料科學Oracle Machine Learning 衍生的智慧融入應用程式、業務流程和事物中,以影響並改善其作業和功能。API 層可安全地使用資料科學部署的模型至 Oracle Machine Learning REST 端點,並可治理系統以確保程式實際執行環境的可用性。您也可以視需要利用函數來執行其他邏輯。

Oracle Cloud Infrastructure API Gateway 可讓您發布內含可從網路存取之專用端點的 API,如果您想要讓 API 接受網際網路流量,可以使用公用 IP 位址公開這些 API。端點支援 API 驗證、要求與回應轉換、CORS、認證與授權,以及要求限制。它允許 API 可觀察性監控使用情況並保證 SLA。使用量計畫也可用來監控及管理存取 API 的 API 用戶和 API 用戶端,並為不同客戶設定不同的存取層,以追蹤使用 API 所使用的資料使用量。使用計劃是支援資料貨幣化的關鍵功能。

Oracle Cloud Infrastructure Functions 是一個完全託管、多租戶、可高度擴展、隨選函數即服務平台。它是以企業級 Oracle Cloud Infrastructure 為基礎,並由 Fn Project 開放原始碼引擎提供技術支援。

Oracle REST Data Services (ORDS) 是一個 Java 應用程式,可讓具備 SQL 和資料庫技能的開發人員開發適用於 Oracle Database 的 REST API。任何應用程式開發人員都可以從任何語言環境使用這些 API,無須安裝和維護用戶端驅動程式,就像使用最廣泛使用的 API 技術 REST 存取其他外部服務一樣。ORDS 在 ADW 中部署為完全受管理的功能,可用於向資料取用者使用 API 顯示湖倉一體資訊。

資料管控

Oracle Cloud Infrastructure Data Catalog 可讓您檢視描述資料和個別屬性等技術資產所在的位置,並提供維護對應至該技術描述資料之業務詞彙的功能。Oracle Cloud Infrastructure Data Catalog 也可為 Oracle Autonomous Data Warehouse 倉儲提供描述資料,以協助在資料倉儲中建立外部表格。

資料安全性

資料安全性對於探索及使用湖倉一體資料至關重要。利用具有深度防禦和 RBAC 功能的零信任安全模型,並確保符合最嚴格的法規,資料安全提供預防、偵測及更正的安全控制,以確保防止資料外洩。

Oracle Data Safe 是完全整合的 Oracle Cloud 服務,著重於資料安全性。它提供一組完整的整合功能,可保護 Oracle Cloud 資料庫中的機密和受規範資料,例如 Oracle Autonomous Data Warehouse 。功能包括安全評估、使用者評估、資料尋找、資料遮罩及活動稽核。

Oracle Cloud Infrastructure Audit 可讓您檢視 Oracle Cloud Infrastructure (OCI) 資源和租用戶的相關活動。稽核日誌事件可用來進行安全性稽核,以追蹤 OCI 資源的使用情況和變更,並協助確保遵守標準與法規。

Oracle Cloud Infrastructure Logging 為租用戶中的所有日誌 (包括稽核日誌) 提供可高度擴展且完全受管理的單一介面。使用 OCI 日誌記錄存取所有 OCI 資源的日誌,以便啟用、管理及搜尋這些日誌。

Oracle Cloud Infrastructure Vault 是一項加密管理服務,可儲存及管理加密金鑰和加密密碼,以安全地存取資源。讓客戶管理的金鑰可用於 Oracle Autonomous Data Warehouse 和資料湖加密,以增加靜態資料保護。可讓加密密碼安全地儲存服務和使用者證明資料,以改善您的安全狀態,並確保證明資料不會遭到入侵及不當使用。

實體架構

此資料平台的實體架構支援下列功能:
  • Oracle Autonomous Data Warehouse (ADW) 使用 Oracle 管理的異質連線功能從聯合資料來源取得資料
  • ADW 使用可從已設定且允許內送 SSL/TLS 連線的公用網際網路存取的目標資料庫,讓 Oracle 管理的異質連線能夠安全地連線和查詢資料
  • ADW 使用資料共用從資料庫讀取資料
  • 資料庫區塊資料共用可使用公用網際網路存取,但可使用資料磚提供的證明資料檔案來保護資料共用
  • AWS S3、Azure Blob 和 Google Cloud Storage 的資料可使用外部表格進行聯合和隨選讀取,或根據使用案例和需求複製到 ADW
  • 使用非同盟資料來源的微型批次和非關聯資料來源的檔案,安全地擷取非同盟資料來源的資料
  • 利用 Oracle Cloud Infrastructure Data IntegrationOracle Cloud Infrastructure Data Flow 的組合來處理資料
  • 資料儲存在 ADW 和 Oracle Cloud Infrastructure Object Storage 中,並根據其品質和價值進行組織
  • ADW 可安全地為消費者提供倉儲、湖泊及同盟資料
  • Oracle Analytics Cloud 透過視覺化呈現資料給業務使用者
  • Oracle Analytics Cloud 的公開方式為使用 Oracle Cloud Infrastructure Load Balancing (由 Oracle Cloud Infrastructure Web Application Firewall (WAF) 保護) 以使用網際網路提供存取權
  • Oracle Cloud Infrastructure Data Science 是用來建置、訓練及部署機器學習 (ML) 模型
  • Oracle Cloud Infrastructure API Gateway 可用來管理資料科學 ML 模型部署
  • Oracle Cloud Infrastructure Data Catalog 會從 ADW 和物件儲存收集描述資料
  • 管理員可以使用 Oracle Cloud Infrastructure Bastion 管理私有雲資源

下列圖表說明架構:



資料平台聯合實體 -oracle.zip

實體架構的設計:

  • 運用 2 個 VCN,一個用於中樞,另一個用於工作負載本身
  • 內部部署連線同時運用 Oracle Cloud Infrastructure FastConnect 和網站至網站 VPN 進行備援
  • 來自內部部署和網際網路的所有內送流量會先遞送至中樞 VCN,然後再遞送至工作負載 VCN
  • 所有資料在傳輸和靜態都安全無虞
  • 服務會與專用端點一起部署,以增加安全性狀態
  • VCN 已分成數個專用子網路,以增加安全態勢
  • 運用中介架構,將資料湖資料區分為物件儲存中的數個儲存桶
  • 使用公用連線和連附至工作負載 VCN 的 NAT 閘道存取聯合資料來源和雲端存放區

此部署中未描述簡化之假的潛在設計改良包括:

  • 使用 Oracle Database Gateway 運用客戶管理的異質連線,透過專用連線連線至同盟資料來源
  • 運用完全符合 CIS 規範的登陸區
  • 藉由檢查所有流量及強制實行原則,運用網路防火牆提升整體安全狀態

建議

使用下列建議作為使用異質資料來源資料進行業務分析和機器學習的起點。

您的需求可能與此處描述的架構不同。

Oracle Autonomous Data Warehouse

此架構在共用基礎架構上使用 Oracle Autonomous Data Warehouse (ADW)。

  • 存取聯合資料時,請考慮使用具體化視觀表來提升效能。
  • 請考慮以所需的頻率重新整理具體化視觀表,以避免將聯合資料停滯。
  • 若要在 Oracle Cloud Infrastructure Data Catalog 中收集和編入這些檢視的資料庫連結來增加資料治理,請考慮建立檢視來查詢資料。
  • 請考慮將聯合資料來源證明資料儲存在 Oracle Cloud Infrastructure Vault 的加密密碼中,以提高安全性狀態。
  • 請考慮在呈現聯合資料的檢視中使用 Autonomous Database 安全功能,例如隱匿 (動態資料遮罩),以提升資料安全性。
  • 您可以考慮使用資料共用,從與「差異共用」開啟協定相容的異質資料來源使用同盟資料。
  • 考慮使用資料共用將策劃的資料分享給與 Delta Sharing 開放通訊協定相容的用戶。
  • 請考慮使用客戶管理的異質連線搭配 Oracle Database Gateway,以透過專用連線連線至聯合資料來源,以提高安全性、降低延遲或同時提高安全性。

Oracle Analytics Cloud

此架構運用 Oracle Analytics Cloud (OAC) 為一般使用者提供增強分析。

  • 請考慮使用 OAC 的豐富資料來源範圍來補充 ADW 所使用的聯合資料來源。
  • 請考慮 ADW 上 OAC 所需的聯合資料來源,以提高效能、快取、處理卸載至服務引擎,以及簡化分析語意層。

請注意,此架構依賴資料湖倉儲參照架構,包括適用於您架構的建議。如需湖倉一體參照架構和 othe 資源的連結,請參閱「深入瞭解」一節。

注意事項

聯合資料以進行分析時,請考慮下列導入選項。

指引 建議 其他選項 理由
資料轉換程式

Oracle Cloud Infrastructure Data Integration

  • Oracle Data Integrator
  • Oracle Autonomous Database 資料轉換

Oracle Cloud Infrastructure Data Integration 提供可擴展且符合成本效益的雲端原生、無伺服器、完全受管理的 ETL 平台。

資料保存
  • Oracle Autonomous Data Warehouse
  • Oracle Cloud Infrastructure Object Storage
Oracle Exadata Database Service

Oracle Autonomous Data Warehouse 是一個易於使用且完全自治的資料庫,可彈性調整規模、提供快速查詢效能,且無需任何資料庫管理。它也提供從物件儲存體外部或混合分割表格直接存取資料的方式。

Oracle Cloud Infrastructure Object Storage 以原始格式儲存無限量的資料。

資料處理
  • Oracle Cloud Infrastructure Data Integration
  • Oracle Cloud Infrastructure Data Flow
第三方工具

Oracle Cloud Infrastructure Data Integration 提供可擴展且符合成本效益的雲端原生、無伺服器、完全受管理的 ETL 平台。

Oracle Cloud Infrastructure Data Flow 提供無伺服器 Spark 環境,以按使用量付費的極具彈性模型大規模處理資料。

訪問和解譯
  • Oracle Analytics Cloud
  • Oracle Cloud Infrastructure Data Science
  • Oracle Machine Learning
  • Oracle Cloud Infrastructure AI 服務
第三方工具

Oracle Analytics Cloud 完全託管並與 Oracle Autonomous Data Warehouse 中的精選資料緊密整合。

資料科學是一個完全託管的自助服務平台,供資料科學團隊在 Oracle Cloud Infrastructure 中建置、訓練及管理機器學習 (ML) 模型。資料科學服務提供基礎架構和資料科學工具,例如 AutoML 和模型部署功能。

Oracle Machine Learning 是一個完全託管的自助服務平台,適用於 Oracle Autonomous Data Warehouse 的資料科學,運用倉儲的處理能力大規模建置、訓練、測試和部署 ML 模型,而無需將資料移到倉儲之外。

Oracle Cloud Infrastructure AI 服務是一組服務,提供特別建置和訓練的預先建置模型,以執行如推斷潛在異常或偵測情緒等任務。

認可

  • Author: José Cruz
  • Contributors: Robert Lies