헬스케어 데이터를 분석 및 시각화하고, OCI에 AI를 적용하여 실제 도전 과제 해결
Oracle Cloud Infrastructure(OCI) 및 서비스는 전자 건강 기록 및 환자 모니터링 데이터를 통해 확장 가능한 고성능 분석 솔루션을 구축, 배포 및 모니터링하고, 간단하고 직관적인 웹 인터페이스를 통해 원활한 사용자 경험을 통해 실행 가능한 인텔리전스에 손쉽게 액세스할 수 있는 다양한 옵션을 제공합니다.
의료 기기에서 수집된 데이터를 분석하여 경보 매개변수를 최적화할 수 있으며, AI는 임상 효율성을 개선하고 위험을 줄이기 위한 지능형 애플리케이션을 개발하는 데 도움이 될 수 있습니다.
이 참조 아키텍처에서는 Snowflake 및 Snowpark를 사용하여 데이터를 저장하고 분석한 고객 사용 사례를 소개합니다. 이로 인해 비용이 증가하고 전체적인 가격 대비 성능 이득이 감소했습니다. 점점 더 많은 병원과 의료 기관이 서비스에 가입하면서 데이터가 기하급수적으로 증가하고 수백 테라바이트의 데이터를 분석하는 비용이 기하급수적으로 증가했습니다. 이 솔루션은 목적에 맞는 데이터 분석 솔루션을 제공할 수 있는 유연성이 부족했습니다.
비효율적인 데이터 및 모델 관리는 고객을 신속하게 온보딩하고 제품을 시장에 출시하는 데 방해가 되었습니다. 시스템의 보안은 사후에 고려되었으며 종종 배포의 각 계층에서 적절한 보안 제어를 구현하기 위해 수동 프로세스가 필요했습니다. 오픈 소스 도구 및 라이브러리에 대한 지원이 부족하여 벤더 종속을 초래하고 이식성을 저해했습니다.
구조
OCI는 오픈 소스 툴을 지원하며, 프레임워크를 통해 이식성을 제공하면서 사내 숙련된 리소스를 사용하여 아키텍처를 원활하게 구현할 수 있습니다.
이 참조 아키텍처에서는 환자 치료 및 질병 예방 개선, 사전 승인의 증거 기반 의사 결정, 병원 및 의료 기관의 의료 경보 매개 변수 감지, 분석 및 최적화 등 사용 사례에 맞게 구현할 수 있는 솔루션 설계에 대해 논의합니다.
데이터 분석 및 머신 러닝:
Oracle Autonomous Data Warehouse는 고객이 Oracle Autonomous Data Warehouse의 확장성과 레이크하우스 기능이 최적화된 센서의 스트리밍 데이터를 사용했기 때문에 이상적인 솔루션이었습니다. Oracle Autonomous Data Warehouse와 Oracle Machine Learning의 손쉬운 통합을 통해 고객은 사전 처리 단계에서 데이터를 더 잘 준비하고 이해할 수 있었습니다. 또한 Oracle Machine Learning은 Jupyter Notebooks에서 데이터를 내보낼 수 있도록 지원하므로 데이터 과학자는 Oracle의 데이터베이스 내 ML을 다른 인기 있는 데이터 과학 라이브러리와 결합할 수 있습니다. Oracle Machine Learning은 설치 용이성, 데이터베이스 내 컴퓨팅 사용, 관리 오버헤드 감소, SQL용 범용 강력하고 확장 가능한 데이터베이스 컴퓨팅, 대규모 Python 기반 분석 등 다양한 이점을 제공합니다.
고객은 Oracle Machine Learning을 사용하여 다양한 Python 기반 라이브러리(Panda, NumPy 포함)를 설치하고 테스트하고 기존 Julia 애플리케이션 및 분석을 대규모로 실행할 수 있었습니다. Oracle Machine Learning에는 자동 모델 배포 기능도 포함되어 있습니다. 자동 모델 배포는 모델 학습 및 배포 프로세스 간소화 후 애플리케이션 또는 분석 대시보드 내에서 즉시 점수를 부여할 수 있습니다. 고객은 코드를 리팩터링할 필요 없이 동일한 Python UDF 및 UDTF와 동일한 SQL 쿼리를 Snowflake에서 Oracle Autonomous Data Warehouse로 포팅할 수 있었습니다. ML 모델의 경우 고객은 AutoML 기능을 사용하여 모델 교육 프로세스를 크게 간소화함으로써 최소한의 머신 러닝 경험을 가진 사용자가 원하는 정확도를 달성하고 의료 기기 데이터로부터 통찰력을 얻을 수 있었습니다.
OCI에서 GPU 컴퓨팅을 사용하는 AI 애플리케이션:
OCI는 Nvidia 및 AMD GPU 기반의 최첨단 클라우드 인프라를 통해 AI 애플리케이션에 최적의 성능을 제공합니다. OCI는 모델 교육, 추론 및 AI 분석을 통해 AI 솔루션을 가속화할 수 있도록 지원합니다. OCI는 Nvidia와 협력하여 생성형 AI의 종단간 개발을 위해 Nvidia Nemo를 도입하고, Nvidia Inference Microservices(NIM)를 사용하여 AI 모델의 AI 추론 속도를 높였습니다. OCI AI 인프라에서 AI 애플리케이션을 실행하기 위해 OCI는 다양한 스토리지 옵션을 포함한 확장 가능한 커스터마이징 스택을 사용하여 HPC Slurm 클러스터 또는 Oracle Cloud Infrastructure Kubernetes Engine(OCI Kubernetes Engine 또는 OKE)을 통해 GPU 컴퓨트 인스턴스를 배포합니다.
AI 기반 의료 진단 및 임상 데이터 관리는 EHR 데이터, 의료 이미징, 임상 데이터 및 실험실 결과를 위한 NLP/LLM으로 구성됩니다. Nvidia 애플리케이션 프레임워크(예: BioNemo, MONAI, triton inference server)는 Cohere와 함께 AI 채택 속도를 높이는 솔루션을 제공합니다.
데이터 과학 노트북 및 통합:
이 참조 아키텍처는 데이터 과학자 팀이 Pytorch, TensorFlow 및 기타 오픈 소스 프레임워크와 같은 내장 프레임워크와 함께 Python을 사용하여 머신 러닝(ML) 모델을 구축, 교육, 배포 및 관리할 수 있는 전담 관리 플랫폼인 Oracle Cloud Infrastructure Data Science 서비스를 사용합니다. 이 서비스는 GitHub와 내장된 통합으로 오픈 소스 Jupyter 기반 개발 환경을 생성하는 데 사용할 수 있습니다. Nvidia A10 GPU 컴퓨팅은 LLM 모델을 교육하고, mlfow와 통합된 MLOps 파이프라인을 구축하고, 마지막으로 노트북에서 확장 가능하고 짧은 대기시간 추론 보안 엔드포인트로 배포하고, 모델 성능을 모니터링하는 데 사용할 수 있습니다. 고객은 베어 메탈 또는 가상 인스턴스에서 지원되는 다양한 Nvidia GPU 중에서 선택하여 AI 모델을 대규모로 교육하고 배포할 수 있습니다.
백업 및 Disaster Recovery:
의료 서비스의 경우 고객 데이터 보호 및 가용성이 매우 중요합니다. 다양한 규정으로 인해 데이터를 보호하고 필요에 따라 사용할 수 있어야 합니다. Oracle Autonomous Database는 자동화된 백업 및 복구 옵션을 제공하며 Oracle Cloud Guard를 사용하여 복제본 데이터베이스를 생성할 수 있습니다. 또한 데이터베이스 복제본은 데이터베이스의 읽기 전용 대기 복사본으로 작동하여 기본 데이터베이스의 로드를 줄일 수 있으므로 데이터베이스 성능과 로드 밸런싱을 향상시킵니다.
보안 및 접근 관리:
이 아키텍처는 아키텍처의 모든 계층에서 네트워크, 데이터 및 애플리케이션 보안 기능을 사용하여 OCI Zero Trust 보안 모범 사례를 구현합니다. 네트워크 보안을 위해 컴퓨트는 VCN(가상 클라우드 네트워크)을 사용하여 프라이빗 네트워크에서 구현되고 트래픽 필터는 SL(보안 목록) 및 NSG(네트워크 보안 그룹)를 사용하여 적용됩니다. 데이터는 항상 유휴 상태(AES256) 및 전송 중(TLS 2.0)으로 암호화되며 고객이 간편하게 인증서를 관리할 수 있습니다.
Oracle Autonomous Database에 포함된 Oracle Data Safe는 Oracle 데이터베이스의 일상적인 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 통합 제어 센터를 제공합니다. Oracle Data Safe는 데이터 마스킹, 데이터 난독화, 작업 감사, SQL 방화벽 관리 등 의료에 필요한 고급 데이터 보안 기능을 제공합니다.
Oracle Cloud Infrastructure Identity and Access Management(OCI Identity and Access Management)는 ID를 사용하여 최종 사용자 액세스에 대한 최소 권한 원칙 및 OAuth 2.0 인증을 구현합니다. 다중 요소 인증 및 JWT(토큰 기반 인증)와 같은 고급 기능을 안전하게 제공합니다.
다음 다이어그램은 이 참조 아키텍처를 보여 줍니다.
oci-ai-healthcare_arch-oracle.zip
구조에는 다음과 같은 구성 요소가 있습니다.
- API 게이트웨이
Oracle Cloud Infrastructure API Gateway를 사용하면 네트워크 내에서 액세스할 수 있고 필요한 경우 공용 인터넷에 노출할 수 있는 전용 엔드포인트가 있는 API를 게시할 수 있습니다. 엔드포인트는 API 검증, 요청 및 응답 변환, CORS, 인증 및 권한 부여, 요청 제한을 지원합니다.
- 오브젝트 스토리지
Oracle Cloud Infrastructure Object Storage를 사용하면 데이터베이스 백업, 분석 데이터, 이미지 및 비디오와 같은 리치 콘텐츠 등 모든 콘텐츠 유형의 대량의 구조적 및 비구조적 데이터에 빠르게 액세스할 수 있습니다. 인터넷 또는 클라우드 플랫폼 내에서 직접 안전하고 안전하게 데이터를 저장하고 검색할 수 있습니다. 성능 또는 서비스 안정성이 저하되지 않고 스토리지를 확장할 수 있습니다. 빠르고 즉각적이며 자주 액세스하는 데 필요한 "핫" 스토리지에 표준 스토리지를 사용합니다. 장기간 보존하고 거의 또는 거의 액세스하지 않는 "콜드" 스토리지에 아카이브 스토리지를 사용합니다.
- WAF(웹 애플리케이션 방화벽)
Oracle Cloud Infrastructure Web Application Firewall(WAF)은 로드 밸런서 또는 웹 애플리케이션 도메인 이름과 같이 강제 수행 지점에 연결된 PCI(Payment Card Industry) 호환 지역 기반 및 에지 적용 서비스입니다. WAF는 원치 않는 악의적인 인터넷 트래픽으로부터 애플리케이션을 보호합니다. WAF는 인터넷에 접속하는 모든 끝점을 보호할 수 있으며, 고객의 애플리케이션에 대해 일관된 규칙을 적용합니다.
- DRG(동적 경로 지정 게이트웨이)
DRG는 VCN과 지역 외부 네트워크(예: 다른 Oracle Cloud Infrastructure 지역의 VCN, 온프레미스 네트워크 또는 다른 클라우드 공급자의 네트워크) 간에 동일한 지역의 VCN 간 전용(private) 네트워크 트래픽에 필요한 경로를 제공하는 가상 라우터입니다.
- 보안 목록
각 서브넷에 대해 서브넷에 들어오고 나가도록 허용해야 하는 트래픽의 소스, 대상 및 유형을 지정하는 보안 규칙을 생성할 수 있습니다.
권장사항
- OCI Data Integration은 데이터 엔지니어 및 개발자가 데이터 이동 및 데이터 로딩 작업을 수행할 수 있도록 지원하는 완전 관리형 멀티 테넌트 서비스입니다. 이 솔루션은 데이터 통합 데이터 로딩 서비스를 사용하여 저렴한 비용, 내구성 및 확장성이 뛰어난 장기 데이터 보존을 위해 오브젝트 스토리지의 스테이징 영역으로 데이터를 입수하고 로드할 수 있습니다. 대량 데이터 전송은 보안 FTP, MLP를 통한 HL7v2 및 표준 FHIR(Fast Healthcare Interoperability Resources) 웹 서비스를 사용하여 수행할 수 있습니다. 웹 인터페이스 및 임시 쿼리를 통해 애플리케이션 및 사용자 사용을 위해 스테이징된 데이터를 추가로 처리, 준비 및 선별하여 Oracle Autonomous Data Warehouse 데이터베이스에 채울 수 있습니다.
Spark ETL 또는 ELT 프로세스를 기반으로 하는 대량의 데이터를 Oracle Autonomous Data Warehouse에 정제, 변환, 재구성 및 효율적으로 로드된 다양한 데이터 자산에서 수집할 수 있습니다. Oracle Autonomous Data Warehouse 데이터베이스는 데이터 마트, 데이터 웨어하우스 및 데이터 레이크를 포함한 분석 워크로드를 위한 업계 최고의 완전 관리형 자동 데이터베이스입니다. 자체 튜닝을 수행하며 자동화된 프로비저닝, 패치 및 유지 관리를 제공하므로성능을 최적화합니다.
Oracle Cloud Infrastructure Data Science 서비스를 사용하여 추가 데이터를 분석할 수 있습니다. 고성능 저비용 GPU 컴퓨트를 사용하여 AI 모델을 구축, 학습 및 배포할 수 있습니다. 사용자정의 송신 웹 후크는 보안 끝점 및 ID 서비스를 사용하여 최종 사용자에게 데이터 자산을 푸시하도록 구축됩니다.
- 프라이빗 가상 클라우드 네트워크를 사용하여 서비스를 배치하고 보안 목록 및 NSG를 사용하여 의도하지 않은 액세스를 제한합니다.
- OCI Identity and Access Management를 사용하여 최소 권한 주체 및 역할 기반 액세스 제어를 적용합니다.
- OCI API 게이트웨이를 사용하면 네트워크 내에서 액세스할 수 있고 필요한 경우 공용 인터넷에 노출할 수 있는 전용 엔드포인트가 있는 API를 게시할 수 있습니다. 엔드포인트는 API 검증, 요청 및 응답 변환, CORS, 인증 및 권한 부여, 요청 제한을 지원합니다.
- OCI는 HIPAA 및 FedRAMP를 비롯한 주요 표준에 대한 규제 준수를 보장하여 민감한 데이터를 보호하기 위한 안전한 기반을 제공합니다.
- 오픈 소스 기술을 사용하여 LangChain, REST API, Functions와 같은 OCI에서 벤더 종속을 방지하고 추상화 계층을 구축하여 혁신과 혁신을 가속화하십시오.