分析醫療照護資料並將 AI 應用於 OCI 並將其視覺化,以解決實際挑戰

Oracle Cloud Infrastructure (OCI) 和服務提供許多選項,可讓您透過電子病歷和病患監控資料建置、部署及監控可擴展的高效能分析解決方案,並透過簡單且直覺的 Web 介面,以無縫接軌的使用者體驗輕鬆存取可操作的情報。

從醫療設備收集的資料可進行分析,以最佳化警報參數,而 AI 可協助開發智慧型應用程式,以提升臨床效率並降低風險。

對於此參考架構,我們正在展示使用 Snowflake 和 Snowpark 來儲存及分析資料的客戶使用案例。這使得成本成長及整體性價比效益降低了挑戰。隨著越來越多的醫院和醫療保健供應商註冊使用這項服務,資料成長的速度和分析數百 TB 資料的成本指數成長。此解決方案缺乏彈性,無法配合用途資料分析解決方案。

效率不佳的資料和模型管理阻礙了快速將客戶上線並將產品推向市場的能力。系統安全是一項畢竟的,且通常需要手動程序,在部署的每一層實作適當的安全控制措施。缺乏對開放原始碼工具和程式庫的支援,造成了供應商鎖定並防止可攜性。

架構

OCI 支援開放原始碼工具,而其架構讓使用內部技術資源無縫導入架構,同時提供可攜性。

在此參考架構中,我們將討論可針對使用案例導入的解決方案設計,包括改善病患照護與預防疾病;在預先授權中做出證據型決策;以及偵測、分析及最佳化醫院和醫療照護提供者的醫療警報參數。

資料分析和機器學習

對醫療照護客戶來說,Oracle Autonomous Data Warehouse 是理想的解決方案,因為客戶使用來自 Oracle Autonomous Data Warehouse 最佳擴展性和其湖倉一體功能的感測器串流資料。Oracle Autonomous Data WarehouseOracle Machine Learning 輕鬆整合,可協助客戶在預先處理階段更妥善地準備和瞭解資料。Oracle Machine Learning 也支援將資料匯出至 Jupyter Notebooks,讓資料科學家將 Oracle 的資料庫內 ML 與其他常用資料科學程式庫結合。Oracle Machine Learning 有許多優點,包括:簡易安裝、使用資料庫內運算、減少管理負荷、適用於 SQL 的跨用途強大且可擴展的資料庫運算、大規模的 Python 分析。

客戶可以使用 Oracle Machine Learning 安裝和測試各種 Python 程式庫 (包括 Panda、NumPy),大規模執行現有的 Julia 應用程式和分析。Oracle Machine Learning 也提供自動模型部署功能,模型可在訓練後立即用於在應用程式或分析儀表板內評分,並簡化部署程序。客戶能夠將相同的 Python 使用者定義欄位和 UDTF 移植,以及從 Snowflake 到 Oracle Autonomous Data Warehouse 的相同 SQL 查詢,無須重製程式碼。對於 ML 模型,客戶使用 AutoML 功能,大幅簡化模型訓練流程,讓具備最少機器學習體驗的使用者能夠從醫療裝置資料中實現所需的準確性並產生洞察力。

OCI 上使用 GPU 運算的 AI 應用程式:

OCI 透過由 Nvidia 和 AMD GPU 提供的尖端雲端基礎架構,為 AI 應用程式提供最佳效能。OCI 透過模型訓練、推論和 AI 分析協助加速 AI 解決方案。OCI 與 Nvidia 合作將 Nvidia Nemo 帶入生成式 AI 的端對端開發,並使用 Nvidia Inference Microservices (NIM) 加速 AI 模型的 AI 推論。若要在 OCI AI 基礎架構上執行 AI 應用程式,OCI 會使用 HPC Slurm 叢集或 Oracle Cloud Infrastructure Kubernetes Engine ( OCI Kubernetes Engine 或 OKE) 使用自訂且可擴展的地形堆疊部署 GPU 運算執行處理,包括各種儲存選項。

以 AI 為基礎的醫療診斷和臨床資料管理包括 NLP/LLM,用於 EHR 資料、醫療影像、臨床資料和實驗室結果。Nvidia 應用程式架構,例如 BioNemo、MONAI、triton 推論伺服器,以及 Cohere,提供可加快 AI 採用速度的解決方案。

資料科學記事本與整合:

此參考架構使用 Oracle Cloud Infrastructure Data Science 服務,這是完全受管理的平台,供資料科學家團隊使用 Python 建置、訓練、部署及管理機器學習 (ML) 模型,其內建架構如 Pytorch、TensorFlow 及您選擇的其他開源架構。此服務可用來建立與 GitHub 內建整合的開放原始碼 Jupyter 型開發環境。Nvidia A10 GPU 運算可用於訓練 LLM 模型、建置與 mlfow 整合的 MLOps 管線,最後從記事本部署到可擴展且低延遲推論的安全端點,以及監控模型效能。客戶可以在裸機或虛擬實例上選擇各種支援的 Nvidia GPU,大規模訓練和部署 AI 模型。

備份與災害復原:

對於醫療照護業而言,客戶資料保護與可用性極為重要。根據各種法規,資料必須受到保護,並視需要提供。Oracle Autonomous Database 提供自動備份和復原選項,並且可以使用 Oracle Cloud Guard 建立複本資料庫。資料庫複本也可以作為資料庫的唯讀待命複本工作,以降低主要資料庫的負載,進而提高資料庫效能和負載平衡。

安全性與存取管理:

此架構使用架構所有層級的網路、資料和應用程式安全功能,實作 OCI Zero Trust 安全最佳實務。為確保網路安全,使用虛擬雲端網路 (VCN) 在專用網路中實作運算,並使用安全清單 (SL) 和網路安全群組 (NSG) 套用流量篩選條件。客戶提供的憑證管理功能可隨時以靜態 (AES256) 和傳輸中 (TLS 2.0) 加密資料。

Oracle Data Safe 包含在 Oracle Autonomous Database 中,提供統一的控制中心,可協助管理 Oracle 資料庫的日常安全性和合規性需求。Oracle Data Safe 提供醫療照護所需的進階資料安全功能,例如資料遮罩、資料混淆處理、活動稽核及 SQL 防火牆管理。

Oracle Cloud Infrastructure Identity and Access Management ( OCI Identity and Access Management) 實行最低權限原則,以及使用識別對一般使用者存取進行 OAuth 2.0 認證。它安全地提供進階功能,例如多重因素認證和權杖型驗證 (JWT)。

下圖說明此參考架構。



oci-ai-healthcare_arch-oracle.zip

架構具有下列元件:

  • API 閘道

    Oracle Cloud Infrastructure API Gateway 可讓您發布內含可從您網路存取之專用端點的 API,並視需要向公用網際網路公開。端點支援 API 驗證、要求和回應轉換、CORS、驗證和授權以及要求限制。

  • 物件儲存

    Oracle Cloud Infrastructure Object Storage 可讓您快速存取任何內容類型的大量結構化和非結構化資料,包括資料庫備份、分析資料,以及影像和影片等豐富內容。您可以直接從網際網路或雲端平台內,安全地儲存及擷取資料。您可以擴展儲存體,而不會發生任何效能或服務可靠性的降低問題。針對您需要快速、立即和經常存取的「熱」儲存,使用標準儲存。針對長時間保留且極少或極少存取的「冷」儲存,使用封存儲存。

  • Web 應用程式防火牆 (WAF)

    Oracle Cloud Infrastructure Web Application Firewall (WAF) 是符合支付卡產業 (PCI) 規範、以區域為基礎和邊緣強制執行服務,可附加至強制點,例如負載平衡器或 Web 應用程式網域名稱。WAF 可保護應用程式免於惡意和非必要網際網路流量的危害。WAF 可以保護任何連結網際網路的端點,為客戶的所有應用系統強制實施一致的規則。

  • 動態路由閘道 (DRG)

    DRG 是一個虛擬路由器,提供相同區域中 VCN 之間、VCN 與區域外網路 (例如其他 Oracle Cloud Infrastructure 區域中的 VCN、內部部署網路或其他雲端提供者中的網路) 之間的專用網路流量路徑。

  • 安全清單

    您可以為每個子網路建立安全規則,以指定必須允許進出子網路的來源、目的地和流量類型。

建議

使用下列建議作為起點。您的需求可能與此處描述的架構不同。
  • OCI Data Integration 是一項完全受管理的多租用戶服務,可協助資料工程師和開發人員執行資料移動和資料載入工作。此解決方案可以使用資料整合資料載入服務,將資料擷取並載入物件儲存的暫存區,以維持低成本、持久且高度可擴展的長期資料保留。使用安全 FTP、HL7v2 over MLP 和標準 Fast Healthcare Interoperability Resources (FHIR) Web 服務,即可完成大量資料傳輸。暫存資料可以進一步處理、準備和策劃,以植入 Oracle Autonomous Data Warehouse 資料庫,以便透過 Web 介面和特定查詢來使用應用程式和使用者。

    在 Spark ETL 或 ELT 處理作業的支援下,您可以從各種資料資產擷取大量資料,這些資料資產經過清理、轉換、重新塑造且有效率地載入至 Oracle Autonomous Data WarehouseOracle Autonomous Data Warehouse 資料庫是業界領先的完全託管和自動化資料庫,用於分析工作負載,包括資料市集、資料倉儲和資料湖。它可以自行調整並提供自動啟動設定、修正以及維護,因此將效能最佳化

    進一步的資料可以使用 Oracle Cloud Infrastructure Data Science 服務進行分析。使用高效能低成本 GPU 運算,即可建置、訓練及部署 AI 模型。自訂外送 Web 鉤點是為了使用安全端點和識別服務,將資料資產推送給一般使用者而建立的。

  • 使用私有虛擬雲端網路部署服務,並使用安全清單和 NSG 限制非預期的存取。
  • 使用 OCI Identity and Access Management 來套用最低權限的主體和以角色為基礎的存取控制。
  • OCI API 閘道可讓您發布內含可從您網路存取之專用端點的 API,並視需要向公用網際網路公開。端點支援 API 驗證、要求和回應轉換、CORS、驗證和授權以及要求限制。
  • OCI 可確保符合主要標準 (包括 HIPAA 和 FedRAMP) 的法規遵循,為保護機密資料提供安全的基礎。
  • 使用開源技術來避免在 OCI (例如 LangChain、REST API、Functions) 上鎖定供應商,並在頂端建立抽象層,以加速創新和轉型。

確認

  • 授權者Gautam Karmakar, Animesh Sahay
  • 提供者Ruzhu Chen