瞭解 OCI AI 和 ML 如何強化病患體驗
與任何企業一樣,醫療照護需要存取、分析、操作及儲存大量資料的能力。這種資料處理方式相當適合 Oracle Cloud Infrastructure Lakehouse (資料湖泊) 背後的技術,可協助人工智慧 (AI) 和機器學習 (ML) 強化病患體驗。
醫療照護系統的設定應考慮:
- 盡快為診所人員取得準確的病患資訊,以免除不必要的麻煩,讓臨床醫師盡可能花上病人個案的時間。
- 讓病患從症狀快速復原。
- 不論病人、醫療保險或公共衛生服務 (e.g,英國國家健康服務) 是否收取費用,確保流程符合成本效益。
例如,一般的醫師 (GP) 或主要照護提供者 (PCP) 相信,他們的病患都展現了肺炎的跡象。他們稱病人為醫療中心 (醫院或成像中心),為胸部 X 光檢查肺炎或其他導致病患的症狀。此處理程序的第一個步驟是設定與醫療中心的任用,並共用病患的電子醫療記錄 (EMR) 或電子健康記錄 (EHR)。在理想狀況下,此資料會整合在資料湖畔。
醫學中心的放射學人員會採用 x 射線,但從那一刻起,資料湖屋與相關技術在診斷過程中扮演著積極的角色。x 光影像是使用放射學資訊系統 (RIS) 所建立,並透過圖片歸檔與通訊系統 (PACS) 或新一代的資料儲存裝置 (例如「廠商中立歸檔 (VNA)」來儲存。這些影像可能使用醫療影像格式 (例如 Medicine 中的數位影像與通訊 (DICOM) 來儲存非常高解析度的影像與其相關描述資料,例如產生影像的位置和時間以及模型類型 (擷取影像的方式) 來儲存。此描述資料會連結至正確的病患及其記錄。
擷取影像之後,臨床醫師會複查並說明每個影像,以判斷病患的臨床需求。這是耗時過程,通常導致病患在家裡等候進一步資訊。
本手冊將著重於資料湖畔參與提供我們所描述結果的解決方案。
本電子書將專注於涉及一宗涉及區域醫院的使用案例的系統,並會呼叫相關區域,但不會進入解決方案明細。
架構
此架構顯示透過 OCI 資料湖進行的醫療中心存取和使用。
- 初始設定可能需要使用資料傳輸服務,以有效率且符合成本效益的方式,將所有現有資料從 PACS 解決方案移轉至 Oracle Cloud Infrastructure (OCI) 進行處理。如果進行中的作業連線效能有問題,這可能會延伸至每日傳輸。除了 PAC 資料外,這可能是大量出貨病患記錄與相關資訊的方法。
- 其他資料來源,例如在醫療保健提供者之間共用 EMR 的協同合作,可包含病患的 GP 或 PCP。
- 提供函數以執行複雜的資料處理。例如,它們會從 DICOM 影像擷取描述資料。這些流程過於複雜,無法在持續性工具和業務邏輯中有效進行處理。這表示我們可以在每次引進新的複雜非結構化資料物件 (例如新類型的映像檔) 時,採用新的邏輯。
- 資料輸入及退出服務支援病患 EHR/EMR 共用。
- 如案例所述,可源自使用案例的相關更多資料 (例如針對病患的額外洞察),就能獲得額外的洞察力。例如,CDC 資料集 Social Determinants of Health (SDOH) 提供各種狀況的社經指標 API。
- 這反映出直接或間接用來支援安全性和平台和解決方案作業的服務數目。
- 資料湖站服務會分組。視特定使用案例而定,您不需要所有服務。
- 主要的期望會成為以網路服務為中心,因為第三方會隱藏處理資料的方式。這也反映標準開發的方向,例如 FHIR。
如圖所示,醫療中心與 OCI 環境之間的資料流向透過 VPN 保護,並且使用 Oracle Cloud Infrastructure FastConnect (FastConnect) 保證效能,雖然影像資料的傳輸量過高而反向移動。
PACS 或 VNA 解決方案可以數種方式整合,視 PACS 解決方案的功能而定,只要將 PACS 儲存體公開到限制的 FTP 伺服器,就能定期輪詢 (e.g、每 10 至 15 分鐘) 至符合「訊息交換」DICOM 通訊模型的 API 規格。我們可以在使用 OCI 功能去取代內部部署 PACS 的架構圖中看到這項技術。
提供自訂函數,可在 DICOM 內擷取影像相關描述資料。擷取的描述資料可以分開儲存,以支援快速搜尋內容,因為每一次執行搜尋時不需要交替影像。
雖然可以使用各種協定和技術與其他資料來源整合,但偏好的機制則是採用 FHIR REST API。不過,這項整合工具也提供廣泛的整合技術和協定。請注意,FHIR 不支援影像,因為標準目前不支援此類資料。
集中處理資料可運用資料庫的佈建,使用 Oracle Cloud Infrastructure Data Catalog 及 API 閘道可讓組織深入瞭解資料網狀結構的想法。特別是資料擁有者能夠舒適地公開資料,以分散資料所有權。此外,API 也提供在執行存取控制的同時,有效率地存取資料。這表示相同的資料可提供給不同消費者的不同用途,而消費者行為與需求維持不良 (e.g,資料可提供給行動員工與臨床醫師在醫學視覺化平台上提供的資料)。
此架構支援下列資料湖站特定服務:
- 物件儲存
物件儲存可讓您快速存取任意內容類型的大量結構化和非結構化資料,包括資料庫備份、分析資料,以及影像和影片等豐富內容。您可以安全地儲存資料,然後直接從網際網路或雲端平台內擷取資料。順暢調整儲存體,不會發生任何效能或服務可靠性的降低情形。使用標準的「熱門」儲存空間,快速、立即、經常存取。將封存儲存體用於您長期保留的「冷」儲存體,極少或罕見地存取。
在此相關資訊環境中,物件儲存會用來保留非結構化內容 (例如 x 光影像),然後由更結構化的資料 (包括影像描述資料) 參照,讓映像檔可快速搜尋。
- 資料目錄
Oracle Cloud Infrastructure Data Catalog 是企業資料完全託管的自助服務資料探索與治理解決方案。它提供資料工程師、資料科學家、資料管理者以及資料主管的單一協同合作環境,用來管理組織的技術、業務和作業描述資料。
上下文中的資料目錄將有助於瞭解資料資產,以及如何在湖畔內部處理這些資產,提供額外的洞察力。這涵蓋內部持有的資料,以及可經由 API 呼叫和檔案傳輸等機制,深入到湖公司的第三方資料資源。其他技術則可用來擷取資料,但 API 和檔案是最常用的模型。
- 資料整合
使用 Oracle Cloud Infrastructure Data Integration 最佳化系統之間的資料流程。
它支援宣告和無程式碼或低程式碼 ETL 和資料管線開發。對於湖屋,這會是主要資料處理與處理工具之一。
資料整合也可套用至執行像將資料從半結構化轉換為完全結構化、可最小化的資料等作業。執行如資料清除等活動,讓已變更或損毀的資料無法扭曲發現項目。
- 資料流程
Oracle Cloud Infrastructure Data Flow 是完全託管的 Apache Spark 服務,可在不需要基礎架構部署或管理大型資料集上執行處理工作。開發者也可以使用 Spark 串流處理在持續產生串流資料方面執行雲端 ETL。因為開發者能夠專注於 App 開發,而非基礎架構管理,所以能夠快速交付應用程式。
資料流程可協助以更具事件或計時器序列的方式處理資料。這樣做意味著可以在事情發生時執行更多分析,而不是等到收到所有資料為止。
- Big Data Service,大數據服務
Oracle Big Data Cloud Service 可協助資料專業人員管理、目錄及處理原始資料。Oracle 提供物件儲存和 Hadoop 型資料湖,持續性。
- Autonomous Database
Oracle Cloud Infrastructure Autonomous Database 是一個完全託管且預先設定的資料庫環境,可用來進行交易處理和資料倉儲工作負載。您不需要設定或管理任何硬體,或者安裝任何軟體。Oracle Cloud Infrastructure 可處理建立資料庫,以及備份、打補丁、升級和調整資料庫。
建議
- 虛擬雲端網路 (VCN) 和子網路
VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可客製化的軟體定義網路。與傳統資料中心網路一樣,VCN 可讓您完整控制您的網路環境。VCN 可以有多個非重疊的 CIDR 區塊,您可以在建立 VCN 之後變更這些區塊。您可以將 VCN 區段成子網路,可以將範圍擴展到區域或可用性網域。每個子網路都包含一個連續的位址範圍,這些位址不會與 VCN 中的其他子網路重疊。您可以在建立子網路後變更其大小。子網路可以是公用或專用。
- 雲端保全
您可以使用 Oracle Cloud Guard 監控及維護 Oracle Cloud Infrastructure 中資源的安全。「雲端保全」使用偵測器處方,您可以定義檢查資源是否有安全弱點,以及監控操作員和使用者的危險活動。偵測到任何組態錯誤或不安全活動時,雲端保全會建議更正動作,並根據您可以定義的回應處方協助採取這些動作。
- 安全區域
安全區域透過強制實行原則 (例如加密資料) 並防止整個區間的網路公用存取,確保 Oracle 的安全性最佳做法。安全區域會與相同名稱的區間關聯,並且包含適用於區間及其子區間的安全區域原則或處方。您不能新增或移動標準區間到安全區域區間。
- 網路安全群組 (NSG)
網路安全群組 (NSG) 是作為雲端資源的虛擬防火牆。藉由 Oracle Cloud Infrastructure 的零信任安全模型,系統會拒絕所有流量,您可以控制 VCN 中的網路流量。NSG 包含一組輸入和輸出安全規則,這些規則只適用於單一 VCN 中一組指定的 VNIC。
- 負載平衡器
Oracle Cloud Infrastructure Load Balancing 服務可將單一進入點自動分配給後端多部伺服器的流量。
注意事項
部署此參考架構時,請考慮這些選項。
- 資料來源
我們看到 IoT 解決方案的可能性持續監控和報告病患的資料,例如心跳速率,以及讓病患能夠只記錄事件 (例如飲食習慣或醫學活動) 的應用程式。此資訊可提供大量額外的洞察力,可納入醫療記錄,並使用 AI/ML 所支援的醫療專業進行分析。這類資料饋送會使用事件串流技術 (例如 Kafka),以快速且有效率的方式擷取這些事件,並且以自然的時間序列方式儲存資料。
尋找可協助診斷的模式和異常時,一般而言,擷取並組織為 (半) 結構化資料且可輕易查詢的病患資料越多。因此,獲取病患資料 (例如病患記錄和其他醫療組織持有的資料) 可能不一定透露特定事實的見解。
- 效能
AI 訓練需要處理高解析度影像,因此必須定期重新出現 (例如因應較新的影像格式或更高品質影像)。此模型更新需要執行,因此不會影響進行診斷或治療的病患。這是透過在隔離的環境中執行模型更新,然後將目前環境調整為既運作環境和訓練環境可共存,而不需資源競爭或資源配置問題。
- 安全
在臨床環境中,安全是非常重要的,因為這些需求受到高度監管。不僅可將資料視為價值,但透過意外或蓄意動作破壞資料存取及使用,亦至關重要。因此,涉及這類資料的服務必須受到保護。
- 使用狀態
將服務移轉至雲端環境,從醫療中心移除許多抗逆力和可用性問題。雲端提供者無法保證網路的可用性。因此,必須主動擁有網路抗逆力和備用選項,才能確保「最後一英里」故障時可持續可用性。此外,請務必組織在發生這類失敗案例時,定期行使切換並倒回。因此,若確實需要,處理程序會執行與其他一般處理程序相同。
- 成本
任何特定使用案例都可能不需要所有已識別的湖泊服務。這反映與湖畔應用相關的註解技術。例如,如果不需要 Oracle Big Data Cloud Service ,就不應進行部署。透過將不需要的映像檔放入較低效能的儲存體組態,即可智慧地使用物件儲存體;當發生與病患相關的事件時,內容會移至較高效能的儲存體組態。儘管如此,在許多方面,就像資料庫適用於儲存體搬移資料或移出快取的原則一樣,快速存取儲存體 (e.g、NVMe) 以及較慢的佔用磁碟。