資料平台 - 資料聯盟
但是,您如何將資料湖倉儲中的資料與您位於異質資料來源或部署在其他雲端或內部部署系統上的資料建立關聯,而不需要複製資料?
答案是利用資料聯合方法,將資料湖庫資料與來自第三方雲端商店的聯合資料以及來自雲端和內部部署資料庫的資料相結合,無論其實體位置為何。
此參考架構將技術解決方案定位在整體業務情境中:
資料聯合是一種技術,允許整合、統一及治理儲存在不同資料存放區中的資料,方法是使用聯合查詢引擎,將單一查詢轉譯為出貨至來源資料存放區的子查詢。接著會合併結果並呈現給使用者或應用程式,如下所述。
data-platform-federation-overview-oracle.zip#GUID-6CFF3896-837A-4379-90C4-C1797B831AA6
通常資料聯合會與資料虛擬化互換。資料虛擬化會從多個來源建立統一的資料檢視,而不會複製資料,並即時提供新資料。
就此參考架構而言,即使下列功能涉及同盟和虛擬化,仍會使用資料同盟一詞。
透過資料聯合,將消費者 (例如分析和資料科學引擎) 連線到聯合服務引擎而非多個資料來源,藉此簡化資料存取,從而提高同盟資料的重複使用性、治理和安全性。
分析引擎傳統上提供資料聯合功能,可作為聯合服務引擎的補充功能。同盟資料服務引擎通常具有更多功能來提升效能及處理擴展性,而這些分析引擎隱含地受惠。
本文件說明 Oracle Cloud Infrastructure 內資料聯合的一個潛在解決方案,但也有針對不同案例使用不同技術的替代方案。
功能架構
此架構使用資料湖庫來儲存和使用資料,無論其形狀或形式為何。此架構的核心是部署在 Oracle Autonomous AI Lakehouse 上的資料倉儲。
此外,架構使用統一的查詢引擎,將所選來源的精選資料與湖倉一體中的資料聯合在一起。視資料儲存而定,聯合資料是使用外部表格、資料庫連結和資料共用等機制來取得。
結合資料湖庫資料和現有資料存放區的聯合架構可讓您:
- 結合所有資料 (無論資料儲存位置為何)
- 支援多重雲端和混合雲端資料平台,可將儲存在其他雲端和內部部署的資料聯合起來
- 簡化從不同引擎取得及查詢資料的資料消費者體驗
- 可在同盟查詢引擎強制實行單一資料安全模型,以提高安全性
- 使用可統一資料湖倉儲中儲存實體描述資料並與查詢引擎聯合的資料目錄來增加治理
- 運用資料具體化與自治式資料庫快取提升效能
- 使用分析儀表板、SQL 介面、API 端點和資料共用,向不同的消費者公開統一且經過策劃的資料
- 運用多重模型資料庫作為同盟查詢引擎
下圖說明功能架構。為了簡潔的清酒,而不是顯示湖庫的所有功能。
資料平台同盟功能 -oracle-1.zip#GUID-827999E3-20E0-4D6C-B343-7AD45CF085A9
請注意,此架構描述了使用大部分批次處理的聯合資料平台,但它可以增強資料湖庫即時功能來處理串流資料。
串流資料處理通常需要在其資料管線內使用情境資料。情境式資料可能儲存在不同資料來源中,但提供所有情境資料給資料管線的資料聯合引擎可簡化這些管線。
此架構著重於下列邏輯劃分:
擷取、轉換
擷取並調整資料,以用於架構中的每個資料層。
雲端儲存、資料庫和資料共用的需求會視需要使用聯合資料。資料未在此層上轉換,因為其已在來源資料儲存上進行策劃。
持續、策劃、建立
協助存取和導覽資料,以顯示目前的業務視圖。對於關聯式技術,資料可以在簡單關聯式、縱向、維度式或 OLAP 表單中邏輯或實體結構化。對於非關聯式資料,此層包含一或多個資料集區,可輸出自分析程序或針對特定分析工作最佳化的資料。
這一層包含聯合服務引擎,可統一及提供位於資料倉儲、資料湖及聯合資料來源中的資料。它可以視需要查詢聯合資料,並將聯合資料具體化以提高查詢效能。
聯合引擎可以使用 SQL、REST API 或資料共用來提供資料服務,從而提高互通性,同時簡化連線能力,因為資料取用者會連線至單一服務引擎而非多個資料存放區。
分析、學習、預測
摘要消費者資料的邏輯業務檢視。此抽象有助於靈活的開發方法、移轉至目標架構,以及從多個聯合來源提供單一報告層。
這一層利用服務引擎取得聯合資料,這些資料可以進一步增強此層上可用的資料連接器,並由視覺化或資料科學服務提供。
使用聯合查詢引擎可將資料取用者從基礎資料存放區中抽取存取,隨著資料一次聯合並被許多資料取用,提高生產力。這也讓系統更能互通,因為任何可與 SQL、REST API 或資料共用互通的用戶都可以使用及結合資料湖庫和同盟資料。
此架構具有下列功能元件:
批次擷取
批次擷取對無法即時擷取或因應即時擷取而太過昂貴的資料很有用。將資料轉換為可靠且值得信賴的資訊也很重要,這些資訊可以經過策劃和保存以供定期使用。
「批次擷取」會補充資料聯合引擎,因為它會擷取聯合引擎沒有原生存取權的資料,或針對需要轉換資料以符合湖倉一體資料模型的特定使用案例。
您可以將下列服務一起使用或獨立使用,以實現高度彈性且有效的資料整合與轉換工作流程。
-
Oracle Cloud Infrastructure Data Integration 是完全受管理的無伺服器服務,可用於設計及執行資料管線。它可以無縫擷取、轉換資料,並將其載入 OCI 目標中,例如 Autonomous AI Lakehouse 和 OCI Object Storage 。使用者可以透過可自動擴展執行環境的無程式碼直觀式介面來建置整合流程。它同時支援 ETL 與 Spark 型處理,以及使用 SQL Pushdown 提供效能與效率的 ELT。此服務也提供資料準備工具,並透過以規則為基礎的處理防止綱要漂移。
-
Oracle Data Integrator 提供從大量和高效能批次載入到事件驅動、棘手的整合流程,到支援 SOA 的資料服務的全方位資料整合。宣告式設計方法可確保更快、更簡單的開發和維護,並提供擷取載入轉換 (ELT) 的獨特方法,有助於保證資料轉換和驗證流程的最高效能。Oracle 資料轉換使用 Web 介面來簡化 ELT 的組態和執行,並協助使用者使用宣告式設計方法建置和排定資料和工作流程。
-
Oracle 資料轉換可針對選取的支援技術啟用 ELT,透過 Web 使用者介面簡化資料管線的組態和執行,讓使用者能夠以宣告方式建置和排定資料流程和工作流程。Oracle Data Transforms 是 Oracle Autonomous AI Lakehouse 內的完全受管理環境,可將多個資料來源的資料載入並轉換成 Oracle Autonomous AI Lakehouse 實例。
視使用案例而定,這些元件可獨立使用或一起使用,以實現高度彈性且高效能的資料整合與轉換。
批次處理
批次處理會轉換儲存在資料湖庫中的大型資料集。批次處理利用與 Oracle Cloud Infrastructure Object Storage 無縫整合的 Oracle Cloud Infrastructure 原生服務,並允許您為使用案例 (例如資料聚總與強化、資料倉儲擷取,以及大規模的機器學習和 AI 資料) 建立策劃資料。
上述的 Oracle Cloud Infrastructure Data Integration 是完全託管的無伺服器雲端原生服務,可擷取、載入、轉換、清理及重新塑造來自各種資料來源的資料至目標 Oracle Cloud Infrastructure 服務,例如 Oracle Autonomous AI Lakehouse 和 Oracle Cloud Infrastructure Object Storage 。
Oracle Cloud Infrastructure Data Flow 是一項完全受管理的大數據服務,可讓您無須部署或管理基礎架構,即可執行 Apache Spark 應用程式。它可讓您更快地交付大數據和 AI 應用程式,因為您可以專注於應用程式,而無需管理作業。資料流程應用程式是由 Spark 應用程式與其相依性、預設參數以及預設程式實際執行資源規格所組成的可重複使用樣板。
份量
Oracle Autonomous AI Lakehouse 是一項自主驅動、自主防護、自主修復的資料庫服務,已針對資料倉儲工作負載進行最佳化。您不需要設定或管理任何硬體,或安裝任何軟體。OCI 會處理資料庫的建立、備份、修正、升級及調整。
佈建之後,您可以隨時調整資料庫的 CPU 核心數目或儲存容量,而不會影響可用性或效能。
Oracle Autonomous AI Lakehouse 也可以將位於物件儲存中的資料虛擬化為外部和混合分割表格,以結合和使用來自其他來源的資料與倉儲資料。您也可以將歷史資料從倉儲移至物件儲存,然後使用混合分割表格以無縫接軌的方式使用。
Oracle Autonomous AI Lakehouse 可以使用儲存在 Oracle Cloud Infrastructure Data Catalog 中的先前收集的中繼資料來建立外部表格,並且可以自動將 Oracle Cloud Infrastructure Data Catalog 中的中繼資料更新與外部表格定義同步,以維持一致性、簡化管理並減少工作。
分析視觀表是自治式 AI 資料庫功能,提供快速且有效率的方式來建立儲存在現有資料庫表格和視觀表中的資料分析查詢。分析視觀表會使用維度模型來組織資料。他們可讓您輕鬆將彙總與計算新增至資料集,並在檢視中呈現資料,這些資料可透過相對簡單的 SQL 查詢。此功能可讓您使用內部和外部儲存的資料,在 Oracle Autonomous AI Lakehouse 中以語意方式直接建立星狀或雪花狀綱要模型,並使用 SQL 和任何 SQL 相容資料取用者來允許使用模型。
Oracle Autonomous AI Lakehouse 可在第三方雲端資料庫 (即 AWS S3、Azure Blob 和 GCP CGS) 上,聯合和查詢第三方雲端資料庫 (即 AWS Redshift、Azure Synapse Analytics、Google BigQuery 和 Snowflake)、第三方資料庫 (即 IBM DB2、MongoDB、PostrgreSQL、Hive),甚至是 SaaS 應用程式。
在單一查詢中,Oracle Autonomous AI Lakehouse 可以查詢並結合雲端存放區、雲端資料庫和其他熱門資料庫中的資料,簡化對服務引擎用戶的資料存取,因為這些使用者是從個別查詢 (數個查詢引擎) 的複雜性中抽取出來,以獲得統一的結果。它也可以結合此資料與產生者提供的資料共用 (符合 Delta Sharing 開放協定) 取得的資料。
雲端存放區
Oracle Cloud Infrastructure Object Storage 是一個網際網路規模的高效能儲存平台,可提供可靠且符合成本效益的資料持久性。Oracle Cloud Infrastructure Object Storage 可以儲存任何內容類型的無限量非結構化資料,包括分析資料。您可以安全地從網際網路或雲端平台內直接進行資料儲存,或進行資料擷取。多個管理介面可讓您輕鬆從小規模開始,並無縫擴展,而不會發生任何效能或服務可靠性的降低。
Oracle Cloud Infrastructure Object Storage 也可以用來作為資料倉儲的冷儲存層,方法是儲存不常使用的資料,然後使用 Oracle Autonomous AI Lakehouse 中的混合表格,以無縫接軌的方式與最新資料結合。
視覺化 / 學習
Oracle Analytics Cloud 是一項可擴展且安全的公共雲端服務,提供一套完整的功能,可為您、您的工作小組和您的企業探索和執行協作分析。它支援公民資料科學家、進階業務分析師訓練,以及執行機器學習 (ML) 模型。機器學習模型可以在分析服務上執行,也可以直接在 Oracle Autonomous AI Lakehouse 上執行,作為運用倉儲和 OCI AI 服務 (例如 Oracle Cloud Infrastructure Vision) 處理能力、可擴展性和彈性的大規模批次預測的 OML 嵌入模型。
藉助 Oracle Analytics Cloud ,您還可以獲得靈活的服務管理功能,包括快速設定、輕鬆擴展和修補,以及自動化生命週期管理。
學習並預測
Oracle Cloud Infrastructure Data Science 為資料科學團隊提供基礎架構、開放原始碼技術、程式庫、套裝程式及資料科學工具,讓資料科學團隊在 Oracle Cloud Infrastructure 中建置、訓練及管理機器學習 (ML) 模型。協同合作式和專案導向的工作區提供端對端整合式使用者體驗,並支援預測模型的生命週期。
資料科學工作功能可讓資料科學家在完全受管理的基礎架構上定義和執行可重複的機器學習工作。
資料科學模型部署功能可讓資料科學家將受過訓練的模型部署為完全受管理的 HTTP 端點,以即時提供預測、將智慧融入流程和應用程式中,並讓企業在發生相關事件時做出反應。
Oracle Machine Learning 提供與 Oracle Autonomous AI Database 緊密整合的強大機器學習功能,並支援 Python 和 AutoML。它支援使用開放原始碼和可擴展的資料庫內演算法的模型,以減少資料準備和移動。AutoML 使用自動演算法選擇、調適型資料抽樣、自動功能選擇和自動模型調整功能,協助資料科學家加快對公司機器學習計畫的價值。藉助 Oracle Autonomous AI Lakehouse 中提供的 Oracle Machine Learning 服務,您不僅可以管理模型,還可以將這些模型部署為 REST 端點,以民主化公司內部的即時預測,讓企業能夠在發生相關事件時 (而非事實後) 做出反應。
AI 服務
Oracle Cloud Infrastructure AI Services 服務提供一組立即可用的 AI 服務,可用來支援各種使用案例,從文字分析到預測性維護。這些服務具有預先建置且經過精細調整的模型,您可以使用 API 整合至資料管線、分析及應用程式。
Oracle Cloud Infrastructure Anomaly Detection 提供一組豐富的工具,可即時識別不想要的業務資料事件或觀察,以避免業務中斷。
Oracle Cloud Infrastructure Language 會大規模執行複雜的文字分析。透過預先訓練和自訂模型,開發人員無需具備資料科學專業知識即可處理非結構化文字並擷取洞察分析。預先訓練的模型支援情感分析、關鍵詞擷取、文字分類及命名實體識別。您也可以使用網域特定資料集訓練具名實體識別和文字分類的自訂模型。翻譯服務可讓您翻譯 21 種不同語言的文字。
Oracle Cloud Infrastructure Speech 可讓您將包含人類語音的媒體檔案轉換為高度準確的文字轉錄,藉此利用口語的功能。OCI Speech 可用於轉錄客戶服務電話、自動轉字及產生媒體資產的中繼資料,以建立完全可搜尋的檔案。
Oracle Cloud Infrastructure Vision 會執行影像辨識和文件分析任務,例如將影像分類、偵測和臉部、擷取文字以及辨識表格。您可以運用預先訓練的模型,或輕鬆為特定產業和客戶案例建立自訂視覺模型。OCI Vision 是完全受管理的多租戶原生雲端服務,可協助處理所有常見的電腦視覺任務。
Oracle Cloud Infrastructure 文件理解會執行文件分析任務,例如擷取文字和辨識表格。OCI Document Understanding 服務是完全受管理的多租用戶原生雲端服務,可協助所有常見的文件分析工作。
資料增強
資料強化可以改善用於訓練機器學習模型的資料,以獲得更好且更準確的預測結果。
Oracle Cloud Infrastructure Data Labeling 可讓您建立和瀏覽資料集、檢視資料記錄 (文字或影像),以及套用標籤來建置 AI/ML 模型。此服務也提供互動式使用者介面,旨在協助進行標籤處理。標示記錄之後,資料集可以匯出為以線分隔的 JSON,以用於 AI/ML 模型開發。
API
API 層可讓您將從資料科學和 Oracle Machine Learning 衍生的智慧融入應用程式、業務流程和情境中,以影響並改善其作業和功能。API 層可安全地將資料科學部署模型使用至 Oracle Machine Learning REST 端點,並可控管系統以確保執行階段環境的可用性。您也可以視需要利用函數來執行其他邏輯。
Oracle Cloud Infrastructure API Gateway 可讓您發布具有可從網路存取之專用端點的 API,如果您希望 API 接受網際網路流量,可以使用公用 IP 位址公開這些 API。端點支援 API 驗證、要求與回應轉換、CORS、認證與授權,以及要求限制。它可讓 API 可觀察性監控使用狀況並保證 SLA。使用量計畫也可用來監控和管理存取 API 的 API 用戶和 API 用戶端,以及為不同客戶設定不同的存取層,以追蹤使用 API 的資料使用情況。用量計畫是支援資料貨幣化的關鍵功能。
Oracle Cloud Infrastructure Functions 是一個完全託管、多租用戶、可高度擴展、隨選、功能即服務平台。它是以企業級 Oracle Cloud Infrastructure 為基礎,並由 Fn Project 開放原始碼引擎提供技術支援。
Oracle REST Data Services (ORDS) 是一個 Java 應用程式,可讓具備 SQL 和資料庫技能的開發人員為 Oracle Database 開發 REST API。任何應用程式開發人員都可以從任何語言環境使用這些 API,而不需要安裝和維護用戶端驅動程式,就像使用最廣泛使用的 API 技術 REST 存取其他外部服務一樣。ORDS 在 Oracle Autonomous AI Lakehouse 中部署為完全受管理的功能,並可使用 API 向資料取用者顯示湖倉一體資訊。
資料治理
Oracle Cloud Infrastructure Data Catalog 可檢視中繼資料和個別屬性等技術資產所在的位置,並提供維護對應至該技術中繼資料的業務詞彙的能力。Oracle Cloud Infrastructure Data Catalog 還可以為 Oracle Autonomous AI Lakehouse Warehouse 提供中繼資料,以協助在資料倉儲中建立外部表格。
資料安全性
資料安全性對於探索和使用湖倉一體資料至關重要。利用具有深度防禦和 RBAC 功能的零信任安全模型,並確保符合最嚴格的法規,資料安全性提供預防性、偵測性及更正性安全控制,以確保防止資料外洩和外洩。
Oracle Data Safe 是完全整合的 Oracle Cloud 服務,著重於資料安全性。它提供一組完整的整合式功能,可保護 Oracle Cloud 資料庫中的機密和受規範資料,例如 Oracle Autonomous AI Lakehouse 。功能包括安全評估、使用者評估、資料探索、資料遮罩和活動稽核。
Oracle Cloud Infrastructure Audit 可讓您檢視與 Oracle Cloud Infrastructure (OCI) 資源和租用戶相關的活動。稽核日誌事件可用於安全稽核,以追蹤 OCI 資源的用量與變更,並協助確保符合標準與法規。
Oracle Cloud Infrastructure Logging 為租用戶中的所有日誌 (包括稽核日誌) 提供可高度擴展且完全受管理的單一介面。您可以使用 OCI 日誌記錄從所有 OCI 資源存取日誌,以啟用、管理及搜尋這些資源。
Oracle Cloud Infrastructure Vault 是一項加密管理服務,可儲存及管理加密金鑰和加密密碼,以安全地存取資源。讓客戶管理的金鑰可用於 Oracle Autonomous AI Lakehouse 和資料湖加密,以提升靜態資料保護。它可讓加密密碼安全地儲存服務和使用者憑證,以改善您的安全性狀態,並確保憑證不會遭到洩漏和使用。
實體架構
- Oracle Autonomous AI Lakehouse 使用 Oracle 管理的異質連線功能,從聯合資料來源取得資料
- Oracle Autonomous AI Lakehouse 使用從已設定並允許內送 SSL/TLS 連線的公用網際網路存取的目標資料庫,讓 Oracle 管理的異質連線能夠安全地連線及查詢資料
- Oracle Autonomous AI Lakehouse 使用資料共用從資料磚讀取資料
- 資料庫區塊資料共用可使用公用網際網路存取,但必須使用 Databricks 提供的證明資料檔案來保護
- AWS S3、Azure Blob 和 Google Cloud Storage 的資料可以使用外部表格聯合並視需要讀取,或根據使用案例和需求複製到 Oracle Autonomous AI Lakehouse
- 非聯合資料來源的資料使用非聯合資料來源的微批次和來自非聯合關聯資料來源的檔案,安全地擷取
- 運用 Oracle Cloud Infrastructure Data Integration 與 Oracle Cloud Infrastructure Data Flow 的組合來處理資料
- 資料儲存在 Oracle Autonomous AI Lakehouse 和 Oracle Cloud Infrastructure Object Storage 中,並根據其品質和價值進行組織
- Oracle Autonomous AI Lakehouse 可安全地為消費者提供倉儲、湖泊和聯合資料
- Oracle Analytics Cloud 使用視覺化來向業務使用者顯示資料
- Oracle Analytics Cloud 使用受 Oracle Cloud Infrastructure Web Application Firewall (WAF) 保護的 Oracle Cloud Infrastructure Load Balancer ,透過使用網際網路提供存取。
- Oracle Cloud Infrastructure Data Science 用於建置、訓練及部署機器學習 (ML) 模型
- Oracle Cloud Infrastructure API Gateway 利用它來管理資料科學 ML 模型部署
- Oracle Cloud Infrastructure Data Catalog 可從 Oracle Autonomous AI Lakehouse 和物件儲存擷取中繼資料
- 管理員可以使用 Oracle Cloud Infrastructure Bastion 管理私有雲資源
下圖說明架構:
data-platform-federation-physical-oracle-1.zip#GUID-3A90BC57-5F07-494F-B23D-7E50E7D1ED7A
實體架構的設計:
- 利用 2 個 VCN,一個用於中樞,另一個用於工作負載本身
- 內部部署連線運用 Oracle Cloud Infrastructure FastConnect 和 Oracle Cloud Infrastructure Site-to-Site VPN 進行備援
- 來自內部部署和來自網際網路的所有內送流量會先遞送至中樞 VCN,然後再遞送至工作負載 VCN
- 所有資料在傳輸中和靜態都是安全的
- 服務會與專用端點一起部署,以增加安全態勢
- VCN 會隔離成數個專用子網路以增加安全態勢
- 資料湖會運用中介架構,將資料區分為物件儲存中的數個儲存桶
- 您可以使用公用連線存取同盟資料來源和雲端存放區,以及連附至工作負載 VCN 的 NAT 閘道
此部署未針對簡易性驗證所描述的潛在設計改善包括:
- 使用 Oracle Database Gateway 利用客戶管理的異質連線功能,透過專用連線連線至同盟資料來源
- 運用符合 CIS 規範的完整登陸區
- 利用網路防火牆檢查所有流量並強制執行原則,以改善整體安全狀態
建議
使用下列建議作為使用異質資料來源的資料進行業務分析和機器學習的起點。
您的需求可能與此處說明的架構不同。
Oracle Autonomous AI Lakehouse
此架構在共用基礎架構上使用 Oracle Autonomous AI Lakehouse 。
- 請考慮使用具體化視觀表來提升存取聯合資料時的效能。
- 請考慮使用所需的頻率重新整理具體化視觀表,以避免將同盟資料停滯。
- 您可以考慮使用聯合來源的資料庫連結來建立檢視以查詢資料,以便在 Oracle Cloud Infrastructure Data Catalog 中收集並編入目錄,以加強資料治理。
- 請考慮將聯合資料來源證明資料儲存在 Oracle Cloud Infrastructure Vault 的加密密碼中,以增加安全性狀態。
- 請考慮在顯示聯合資料的檢視中使用自治式 AI 資料庫安全功能,例如隱匿 (動態資料遮罩),以提升資料安全性。
- 請考慮使用資料共用來使用與 Delta Sharing 開放通訊協定相容的異質資料來源的聯合資料。
- 請考慮使用資料共用,將策劃的資料分享給與 Delta Sharing 開放通訊協定相容的消費者。
- 您可以考慮使用客戶管理的異質連線與 Oracle Database Gateway,透過專用連線連線至同盟資料來源,而這些專用連線需要更高的安全性、更低的延遲或兩者。
Oracle Analytics Cloud
此架構利用 Oracle Analytics Cloud (OAC),為終端使用者提供增強分析。
- 您可以考慮使用 OAC 的各種資料來源來補充 Oracle Autonomous AI Lakehouse 所使用的聯合資料來源。
- 考慮 Oracle Autonomous AI Lakehouse 上 OAC 所需的同盟資料來源,以提高效能、快取、處理卸載至服務引擎,以及簡化分析語意層。
請注意,此架構依賴資料湖庫參考架構,包括適用於您架構的建議。如需湖倉一體參考架構和資源的連結,請參閱「探索更多」一節。
注意事項
聯合資料進行分析時,請考慮下列實行選項。
| 指引 | 建議 | 其他選項 | 理由 |
|---|---|---|---|
| 資料轉換處理作業 |
Oracle Cloud Infrastructure Data Integration |
|
Oracle Cloud Infrastructure Data Integration 提供可擴展且符合成本效益的雲端原生、無伺服器、完全受管理的 ETL 平台。 |
| 資料持續性 |
|
Oracle Exadata Database Service |
Oracle Autonomous AI Lakehouse 是一種易於使用、完全自主的資料庫,可彈性調整規模、提供快速查詢效能,並且不需要資料庫管理。它也提供從物件儲存外部或混合分割表格直接存取資料的方式。 Oracle Cloud Infrastructure Object Storage 以原始格式儲存無限資料。 |
| 數據處理 |
|
第三方的工具 |
Oracle Cloud Infrastructure Data Integration 提供可擴展且符合成本效益的雲端原生、無伺服器、完全受管理的 ETL 平台。 Oracle Cloud Infrastructure Data Flow 提供無伺服器 Spark 環境,以隨用隨付的極具彈性模型大規模處理資料。 |
| 訪問和解釋 |
|
第三方的工具 |
Oracle Analytics Cloud 完全受管理,並與 Oracle Autonomous AI Lakehouse 中的精選資料緊密整合。 Data Science 是一個完全受管理的自助服務平台,可供資料科學團隊在 Oracle Cloud Infrastructure 中建置、訓練及管理機器學習 (ML) 模型。資料科學服務提供基礎架構和資料科學工具,例如 AutoML 和模型部署功能。 Oracle Machine Learning 是完全託管的自助服務平台,適用於 Oracle Autonomous AI Lakehouse ,運用倉儲的處理能力大規模建置、訓練、測試和部署 ML 模型,而無需將資料移出倉儲。 Oracle Cloud Infrastructure AI 服務是一組服務,提供專門建置和訓練的預先建置模型,以執行任務,例如推論潛在異常或偵測情緒。 |



