使用 Oracle Autonomous Database 識別資料中的連線並執行圖表分析
圖表資料庫和圖表分析可與 Oracle 的整合式資料庫方案整合。使用 Oracle Database 內建的圖表功能,不再需要單獨的單一用途資料庫及複寫資料。分析師與開發者可以執行全方位分析,找出能夠洞察客戶趨勢或詐騙偵測資料中的連線,或改善智慧型製造業的可追蹤性。它們可以在取得企業級安全性、容易擷取資料及支援多種資料工作負載時執行這些分析。
Oracle Autonomous Database (ADB) 提供一鍵整合式佈建自助服務工具,稱為 Graph Studio,可在資料生命週期中自動化並簡化模型製作、管理、分析及視覺化圖表。Graph Studio 提供完整的一組圖形分析,包括超過 60 個預先建置的圖形演算法,以及類似 SQL 的宣告語言,稱為 Property Graph Query Language (PGQL)。Graph Studio 支援記事本,讓資料愛好者和開發人員在使用記憶體內圖表分析引擎 (PGX) 進行最高效能時,執行逐步分析。
圖表是一種極為直觀的方式,可將資料建立模型,並將焦點放在資料實體之間的連線,因為大部分資料都已連線。圖表可讓您更容易在互連的資料實體之間瀏覽、探索連結及繪製新的結論。圖表的主要元件是頂點 (或節點) 和邊緣,連接兩個頂點。圖形的典型範例包括社交網路、現金流量、物料清單或資料歷程。
下列範例影像說明圖表分析在識別財務交易中的詐騙有什麼好處。
graph-analysis-example.png 圖解說明
為了讓詐騙偵測更為簡單,您可以從實體之間以及共用某些資訊的實體 (包括電子郵件地址、密碼、地址等) 建立一個圖表。建立圖表之後,執行簡單查詢會尋找具有類似資訊之帳戶的所有客戶,並顯示哪些帳戶要彼此傳送金錢。
如需更多資訊和圖表的一般範例,請參閱 eBook "17 Use Cases for Graph Databases and Graph Analytics"。您可以在此參照架構的結尾處的「瀏覽更多」區段找到它。
- 執行圖形演算法
圖形演算法會分析頂點、頂點重要性或頂點叢集之間的路徑和距離。它們對下列各項有幫助:
- 偵測社群 (例如 Louvain、標籤傳播)
- 偵測連接的元件 (例如,嚴格連接的元件、弱點連接元件)
- 評估結構 (例如週期偵測、三角形計數、可連線性)
- 在圖表中預測連結 (例如,從上到下)、排名和走路節點 (例如 PageRank、度中心、接近中心性、SALSA)
- 尋找路徑 (例如 Bellman-Ford、Dijkstra、Fattest Path、Hopistance)
- 執行圖形樣式比對查詢
圖表樣式比對查詢可偵測符合指定限制條件集的頂點和邊緣之間的模式,例如週期或間接相依性。
架構
此架構使用 Oracle Autonomous Data Warehouse 作為集中式資料倉儲,此資料會從多個企業儲存區域和部門資料來源載入及整理資料。
然後,它會使用 Graph Studio 將資料建立圖表模型。Graph Studio 的整合式記事本介面,搭配 Java、PGQL 以及 Python 的解譯器,可讓您快速執行圖形演算法、查詢圖表以及視覺化結果。此參照架構可協助您開始使用圖表,並針對圖形分析建立實驗室環境,無需其他工具或軟體元件。您可以使用包含數百萬個頂點和邊緣的圖表,包括其屬性。
下圖是參照架構的功能表示。
propertygraph-analysis-arch-oracle.zip
- 資料轉換
擷取及調整架構中每個資料層中所使用的資料。資源配置的用途是說明處理成本之間的差異,這些成本可在每個層級儲存及調整資料,並且在之間移動資料。
- 資料持續性平台 (提供的資訊層)
協助存取和瀏覽資料以顯示目前的業務檢視。這一層可讓您從關聯式資料建立圖形檢視或永久圖形結構。
- 存取與解譯
抽象消費者資料的邏輯業務視圖。此抽象化有助於靈活的資料分析方法,為您的組合資料提供單一分析層。
架構具有下列元件:
- 資料整合
Oracle Autonomous Database 內含內嵌工具,可針對許多部門案例和特定進階使用案例取得、載入及轉換資料。Autonomous Data Warehouse 提供的快速從本機或物件儲存載入資料功能。此外,也包括自治式資料轉換,可讓您從許多不同的來源類型連線至資料,並存取 EL-T 類型功能。
Oracle Cloud Infrastructure Data Integration Cloud 服務適用於更進階的使用案例。這是完全受管理、無伺服器、原生雲端服務。此服務可讓您設計和執行從不同來源擷取、載入及轉換 (ETL) 資料的任務。
- 物件儲存
Oracle Cloud Infrastructure Object Storage 是網際網路規模的高效能儲存平台,可提供可靠且符合成本效益的資料持久性。Oracle Cloud Infrastructure Object Storage 可儲存任意內容類型的非結構化資料,包括分析資料。例如,您可以安全地擷取部門資料,並將其保留在物件儲存的儲存桶中。接著,您可以使用 Autonomous Database 的資料載入工具,將資料從儲存桶載入 Autonomous Database。
- Autonomous Database (ADW, ATP)
Oracle Autonomous Database 是最佳化資料倉儲工作負載的自我驅動、自我保護、自我修復的資料庫服務。您不需要設定或管理任何硬體,也不會安裝任何軟體。Oracle Cloud Infrastructure 可處理建立資料庫及備份、打補丁、升級及調整資料庫。使用 Autonomous Data Warehouse,您可以彈性將資料載入多種格式,包括結構化、JSON、XML、圖形及空間。此服務隨附的自治式工具可讓您有效地將資料載入表格及進行 ETL 作業。
- Graph Studio
Graph Studio 是共用基礎架構上的 Oracle Autonomous Database 功能。它內建於自治式異動處理 (ATP) 和 Autonomous Data Warehouse (ADW)。它為使用圖形的開發人員、分析師、資料工程師和資料科學家提供工具。Graph Studio 包含一個低程式碼使用者介面,可自動從資料倉儲中現有的關聯式表格建立圖形模型設計圖形、執行圖形分析、開發圖形應用程式以及視覺化和共用結果。Autonomous Database and Graph Studio 組合提供一鍵部署、整合工具及安全性的完整圖形資料庫平台,可快速部署。並不需要您是資料庫專家或圖表專家,即可開始使用及具備高生產力。
下圖針對安全使用最佳做法,將上方架構對應至 Oracle Cloud Infrastructure 中提供的服務。
oci-adb-graph-studio-arch.png 圖解說明
oci-adb-graph-studio-arch-oracle.zip
此參照架構具有下列主要元件:
- 虛擬雲端網路 (VCN) 和子網路
VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可客製化的軟體定義網路。與傳統資料中心網路一樣,VCN 可讓您完整控制您的網路環境。VCN 可以有多個非重疊的 CIDR 區塊,您可以在建立 VCN 之後變更這些區塊。您可以將 VCN 區段成子網路,可以將範圍擴展到區域或可用性網域。每個子網路都包含一個連續的位址範圍,這些位址不會與 VCN 中的其他子網路重疊。您可以在建立子網路後變更其大小。子網路可以是公用或專用。
- 可用性網域
可用性網域是區域內的獨立資料中心。每個可用性網域中的實體資源會與其他可用性網域中的資源隔離,以提供容錯能力。可用性網域並不共用基礎架構,例如電源或冷卻系統,或內部可用性網域網路。因此,一個可用性網域發生失敗並不會影響區域中的其他可用性網域。
- 堡壘主機
堡壘主機是運算執行處理,可作為與雲端外部拓樸安全、受控制的進入點。堡壘主機通常是在分散式區域 (DMZ) 中佈建。它可將機密資源配置在無法直接從雲端存取的專用網路中,藉此保護機密資源。拓樸具有單一的已知進入點,您可以定期監督和稽核。因此,您可以避免讓拓樸的機密元件暴露,而不用存取拓樸。
- 網路位址轉譯 (NAT) 閘道
NAT 閘道可讓 VCN 中的專用資源存取網際網路上的主機,而不會將這些資源暴露給內送網際網路連線。
- 網際網路閘道
網際網路閘道可允許 VCN 中公用子網路與公用網際網路之間的流量。
- 服務閘道
服務閘道可讓您從 VCN 存取其他服務,例如 Oracle Cloud Infrastructure Object Storage。從 VCN 到 Oracle 服務的流量透過 Oracle 網路架構旅行,而一律不透過網際網路。
- 具備自動調整功能的 Autonomous Database
在此架構中,Oracle Autonomous 可以是已設定自動調整和專用端點的 Autonomous Data Warehouse (ADW) 或 Autonomous Transactional Processing (ATP)。它可用來儲存應用程式特定的資料,以及建立模型、建立、維護、查詢及視覺化圖表。存取控制清單 (ACL) 可限制 Autonomous Database 網路存取。它具有預先建立的應用程式使用者,並授予開發及維護圖形的必要權限,並使用 Graph Studio 作為 Autonomous Database 的內嵌工具。範例資料會預先載入資料庫使用者綱要,以便從 Graph Studio 開始。
建議
- 資料轉換
Autonomous Database Tools 是內嵌在 Oracle Autonomous Data Warehouse 中的功能,提供載入、轉換、型錄、取得洞察力,甚至以簡單明瞭的方式開發業務模型。
- Graph Studio在您連接 Graph Studio 之前,建議您:
- 建立具有必要權限的資料庫使用者。
- 使用圖表大小預估程式來預估圖表大小。載入 Graph Studio 記憶體的圖表所允許的記憶體內表示上限為 109 GB。
注意:
如果您的圖表估計要使用超過 109 GB,請考慮將 Oracle Graph Server and Clients 工具從 Oracle MarketPlace 部署到具有所需記憶體的運算 VM。VM.Standard.E3.Flex 和 VM.Standard.E4.Flex 資源配置最多可有 1024 GB 的記憶體。
注意事項
將多個資料庫和檔案來源的資料載入至啟用圖表分析的集中式資料倉儲時,請考慮下列導入選項:
指引 | 資料轉換 | 資料持續性平台 | 存取與解譯 |
---|---|---|---|
建議 | Oracle Autonomous Database 工具 | Oracle Autonomous Database (ADW 或 ATP) | Oracle Graph Studio |
其他選項 |
|
|
|
- 資料重力:
讓您的圖表分析作業與資料保持密切,以限制高成本的資料移動。
部署
此參照架構的 Terraform 程式碼可作為 Oracle Cloud Infrastructure Resource Manager 的範例堆疊使用。您也可以從 GitHub 下載原始碼,然後自訂該程式碼以符合您的特定需求。
- 使用 Oracle Cloud Infrastructure Resource Manager 中的範例堆疊進行部署:
- 使用 GitHub 中的 Terraform 程式碼部署:
- 前往 GitHub。
- 複製或下載儲存庫至本機電腦。
- 依照
README
文件中的指示進行。
探索更多
若要深入瞭解此架構的功能,請參閱下列資源。
- 產品頁面:Oracle Graph Database and Graph Analytics
- 電子書:17 圖形資料庫和圖表分析使用案例
- 技術功能簡介:Oracle Graph Technologies
- 文件:Oracle Property Graph
- LiveLabs 工作室:開始使用 Oracle Autonomous Database 的圖表分析
- YouTube 通道:Oracle Spatial and Oracle Graph
- 「專案」頁面:屬性圖表查詢語言 (PGQL)
- Oracle Labs 專案頁面:平行圖表 AnalytiX (PGX)