瞭解串流詐騙偵測

Oracle Compute Cloud@CustomerOracle Roving Edge Infrastructure 產品組合的主要元件,為組織提供可擴展的解決方案,以低延遲的方式安全地處理機密資料。

在本解決方案手冊中,您將瞭解如何使用 NVIDIA Morpheus 網路安全架構,使用 GPU 加速的 Morpheus 管線部署即時、AI 導向的詐騙偵測,以及使用 Compute Cloud@Customer 發布結果。此解決方案可在不等待批次工作的情況下進行即時詐騙偵測,並透過在邊緣的本機處理來確保資料安全。

Before You Begin - 開始之前

請確定使用下列環境設定值在主機機器上執行部署:
  • 作業系統:Ubuntu 24.04 LTS
  • 平台:配備 NVIDIA L40S GPU 的單一節點 Oracle Compute Cloud@Customer 執行個體上的 NVIDIA AI Enterprise

開始之前,請確定主機機器上已安裝下列工具:

  • DockerDocker 編寫 (docker compose V2)
  • Git 和 Git LFS (git-lfs)
  • Python 3 和 Pip

Workflow

此工作流程利用 NVIDIA Morpheus 網路安全架構,對財務交易資料串流執行 GPU 加速推論。

下圖顯示通過三個泳道的工作流程:主機環境、Apache Kafka 和 Morpheus 管線:



此管線會透過 Apache Kafka 擷取即時交易資料、使用預先訓練的圖形樣本與聚總 (GraphSAGE) 模型執行以圖形為基礎的相關資訊分析,以及使用 XGBoost 執行最終詐騙分類。所有階段都使用 NVIDIA RAPIDS 程式庫 (cuDF,cuML) 加速,讓整個工作流程 GPU 針對高輸送量進行最佳化。以下為處理程序的流程:

  • Transaction data (.csv) 是由 Python 產生器所產生。
  • 資料會進入 Kafka 主題 INPUT 串流。
  • 資料會透過 Morpheus 管線進行處理,步驟為:從 Kafka 來源讀取、還原序列化、建構圖表、與 Graph Neural Network (GNN) 介面 (GraphSAGE) 連接、使用 XGBoost 分類、序列化結果,以及寫入 Kafka sink。
  • 結果會傳送至 Kafka 主題 OUTPUT 串流。
  • Python 用戶會接收輸出並提供即時詐騙預測。

模型來源

此架構核心的推論管線使用兩種預先訓練的機器學習模型:GraphSAGE GNN 和 XGBoost 分類器。這些模型是使用個別的訓練管道所產生,此管道包含在 Morpheus 儲存庫中供參考。

  • 訓練指令檔位置:examples/gnn_fraud_detection_pipeline/training.py
  • 程序:程序檔會處理標有標籤的歷史資料集,以圖形功能訓練 GNN,並在產生的內嵌上訓練 XGBoost 模型。

在本解決方案中,您不需要執行訓練腳本,因為已提供預先訓練的模型。專注於部署和執行即時推論管道。

此架構支援下列元件:

  • Oracle Compute Cloud 客戶私有雲

    Oracle Compute Cloud@Customer 是完全受管理的機架規模基礎架構,可讓您隨時隨地使用 OCI Compute 。透過在 Compute Cloud@Customer 上執行 OCI Compute 和 GPU 資源配置搭配儲存和網路服務,獲得資料中心雲端自動化和經濟效益的優勢。您可以在資料中心的雲端基礎架構上執行應用程式並利用 GenAI 的強大功能,同時協助解決與本機資源和即時作業的資料常駐、安全性和低延遲連線問題。

  • NVIDIA Morpheus

    NVIDIA Morpheus 是 GPU 加速的端對端 AI 架構,可讓開發人員建立最佳化的應用程式,以篩選、處理及分類大量串流網路安全資料。Morpheus 結合 AI 來減少識別、擷取和處理威脅的相關時間和成本,為資料中心、雲端和邊緣帶來新的安全等級。

  • Apache Kafka

    Apache Kafka 是一個開放原始碼的分散式事件串流平台,由數千家公司用於高效能資料管線、串流分析、資料整合及關鍵任務應用程式。

  • GraphSAGE GNN + XGBoost

    GraphSAGE GNN + XGBoost 是一種功能強大的兩階段詐騙偵測模型,其中 Graph Neural Network (GNN) 會學習資料中的關聯式模式,而 XGBoost 則進行最終分類。

  • RAPIDS cuDF/cuML

    RAPIDS cuDF/cuML 是適用於 Morpheus 管道內高效能資料處理和機器學習公用程式的 GPU 加速程式庫套件。

  • Docker + Conda

    Docker + Conda 提供分層式的相依性管理方法,使用 Docker 進行作業系統層次隔離,以及使用 Conda 管理容器內的複雜 Python 環境。

生產的考量

在生產環境中導入此解決方案時,請考慮 Kubernetes 可提供的可擴展性和彈性。您可以透過下列方式將此解決方案移轉至 OCI Kubernetes 引擎 ( OKE):

  • 容器化產生器與用戶協助程式命令檔。
  • 使用生產級 Kubernetes 操作員部署 Kafka
  • 將 Morpheus 管線部署為 Kubernetes 工作或部署。

關於必要服務與角色

此解決方案需要下列服務與角色:

  • Oracle Compute Cloud 客戶私有雲
  • NVIDIA AI 企業版 6.0
  • Ubuntu Linux (或相容的 Linux 發行套件)

  • Docker
  • NVIDIA Morpheus 25.02

這些是每項服務所需的角色。

服務名稱:角色 必須為 ...
Oracle Compute Cloud@Customer :administrator 設定並部署 NVIDIA AI Enterprise 虛擬機器執行處理、管理網路資源,以及確保存取 NVIDIA L40S GPU。
Ubuntu Linux:root 或具備 sudo 權限的使用者 安裝先決條件軟體 (Docker 、Git)、管理系統服務,以及執行 Docker 命令。
NVIDIA AI Enterprise :帳戶使用者 NVIDIA GPU 雲 ( NGC) 目錄提取必要的 NVIDIA Morpheus 容器映像檔。

請參閱 Oracle 產品、解決方案和服務,以取得您需要的內容。