医療データを分析して可視化し、OCIにAIを適用して現実世界の課題を解決

Oracle Cloud Infrastructure (OCI)およびサービスには、Electronic Health Recordおよび患者モニタリング・データに対するスケーラブルで高パフォーマンスな分析ソリューションの構築、デプロイおよび監視を行うための多くのオプションがあり、シンプルで直感的なWebインタフェースを介してシームレスなユーザー・エクスペリエンスを使用して、アクショナブル・インテリジェンスに簡単にアクセスできます。

医療機器から収集されたデータを分析してアラームのパラメータを最適化でき、AIは臨床効率を改善し、リスクを軽減するためのインテリジェントなアプリケーションの開発に役立ちます。

このリファレンス・アーキテクチャでは、SnowflakeとSnowparkを使用してデータを格納および分析していた顧客のユース・ケースを紹介しています。これにより、コストが増加し、全体的なコスト・パフォーマンス・メリットが低下するという課題がありました。サービスに登録する病院や医療機関が増えるにつれ、データは急増し、数百テラバイトのデータ分析にかかるコストが飛躍的に増加していました。このソリューションには、目的のデータ分析ソリューションに適合する柔軟性がありませんでした。

非効率的なデータおよびモデル管理により、顧客の迅速なオンボーディングと製品の市場投入が妨げられました。システムのセキュリティは後から考えられ、多くの場合、デプロイメントの各レイヤーに適切なセキュリティ制御を実装するための手動プロセスが必要でした。オープンソースのツールとライブラリのサポートが不足しているため、ベンダーのロックインが発生し、移植性が妨げられました。

アーキテクチャ

OCIはオープンソース・ツールをサポートしており、そのフレームワークにより、移植性を実現しながら、社内の熟練したリソースを使用してアーキテクチャをシームレスに実装できます。

このリファレンス・アーキテクチャでは、患者ケアと疾病予防の改善、事前認可におけるエビデンスに基づく意思決定、病院や医療提供者の医療警報パラメータの検出、分析、最適化など、ユース・ケースに実装できるソリューション設計について説明します。

データ分析と機械学習:

ヘルスケアのお客様にとって、Oracle Autonomous Data Warehouseは、Oracle Autonomous Data Warehouseのスケーラビリティとレイクハウスの機能が最適であったセンサーからのストリーミング・データを使用していたため、理想的なソリューションでした。Oracle Autonomous Data WarehouseOracle Machine Learningの簡単な統合により、前処理段階でデータをより適切に準備および理解できるようになりました。Oracle Machine Learningでは、Jupyterノートブックとの間のデータのエクスポートもサポートされており、データ・サイエンティストはOracleのデータベース内MLを他の一般的なデータ・サイエンス・ライブラリと組み合せることができます。Oracle Machine Learningには、インストールのしやすさ、データベース内コンピューティングの使用、管理オーバーヘッドの削減、SQL用のクロスパーパスでスケーラブルなデータベース・コンピュート、大規模なPythonベースの分析など、多くの利点があります。

Oracle Machine Learningを使用することで、お客様は様々なPythonベースのライブラリ(Panda、NumPyなど)をインストールしてテストし、既存のJuliaアプリケーションおよび分析を大規模に実行できました。Oracle Machine Learningには、自動モデル・デプロイメントも備わっています。自動モデル・デプロイメントでは、トレーニングおよびデプロイメント・プロセスの簡略化の後、モデルをアプリケーションまたは分析ダッシュボード内で即座にスコアリングできます。お客様は、コードのリファクタリングを必要とせずに、同じPython UDFとUDTF、およびSnowflakeからの同じSQLクエリをOracle Autonomous Data Warehouseに移植できました。MLモデルでは、お客様はAutoML機能を使用することで、モデルのトレーニング・プロセスを大幅に簡素化し、最小限の機械学習エクスペリエンスで必要な精度を実現し、医療機器データからインサイトを生成できるようになりました。

OCIでGPUコンピュートを使用するAIアプリケーション:

OCIは、NvidiaとAMD GPUを搭載した最先端のクラウド・インフラストラクチャにより、AIアプリケーションに最適なパフォーマンスを提供します。OCIは、モデルのトレーニング、推論、AI分析により、AIソリューションを加速するのに役立ちます。OCIはNvidiaと提携し、生成AIのエンドツーエンド開発にNvidia Nemoを導入し、Nvidia Inference Microservices(NIM)を使用してAIモデルのAI推論をスピードアップしています。OCI AIインフラストラクチャ上でAIアプリケーションを実行するために、OCIは、HPC SlurmクラスタまたはOracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes EngineまたはOKE)のいずれかを使用して、様々なストレージ・オプションを含むカスタマイズされたスケーラブルなterraformスタックを使用して、GPUコンピュート・インスタンスをデプロイします。

AIベースの医療診断と臨床データ管理は、EHRデータ、医療イメージング、臨床データ、ラボ結果のためのNLP/LLMで構成されています。BioNemo、MONAI、triton推論サーバーなどのNVIDIAアプリケーション・フレームワークとCohereは、AI導入を高速化するソリューションを提供します。

データ・サイエンス・ノートブックと統合:

このリファレンス・アーキテクチャでは、データ・サイエンティストのチーム向けのフルマネージド・プラットフォームであるOracle Cloud Infrastructure Data Scienceサービスを使用して、Pytorch、TensorFlow、その他のオープンソース・フレームワークなどの組込みフレームワークを備えたPythonを使用して機械学習(ML)モデルを構築、トレーニング、デプロイおよび管理します。このサービスを使用すると、GitHubとの組込み統合により、オープンソースのJupyterベースの開発環境を作成できます。Nvidia A10 GPUコンピュートは、LLMモデルのトレーニング、mlfowと統合されたMLOpsパイプラインの構築、および最後にノートブックからスケーラブルで低レイテンシの推論セキュア・エンドポイントへのデプロイ、およびモデルのパフォーマンスのモニターに使用できます。お客様は、ベア・メタルまたは仮想インスタンス上でサポートされている様々なNvidia GPUから選択して、AIモデルを大規模にトレーニングおよびデプロイできます。

バックアップおよび災害復旧:

医療機関にとって、顧客のデータ保護と可用性は非常に重要です。様々な規制により、データを保護し、オンデマンドで利用できるようにする必要があります。Oracle Autonomous Databaseには、自動バックアップおよびリカバリのオプションがあり、Oracle Cloud Guardを使用してレプリカ・データベースを作成できます。また、データベース・レプリカは、データベースの読取り専用スタンバイ・コピーとして機能して、プライマリ・データベースの負荷を軽減できるため、データベースのパフォーマンスとロード・バランシングが向上します。

セキュリティーおよびアクセス管理:

このアーキテクチャは、アーキテクチャのすべてのレイヤーでネットワーク、データ、アプリケーション・セキュリティ機能を使用して、OCI Zero Trustのセキュリティのベストプラクティスを実装しています。ネットワーク・セキュリティの場合、コンピュートはVirtual Cloud Network (VCN)を使用してプライベート・ネットワークに実装され、トラフィック・フィルタはセキュリティ・リスト(SL)およびネットワーク・セキュリティ・グループ(NSG)を使用して適用されます。データは常に保存中(AES256)および転送中(TLS 2.0)で暗号化され、顧客提供の証明書管理が容易になります。

Oracle Autonomous Databaseに含まれているOracle Data Safeは、Oracleデータベースの日々のセキュリティおよびコンプライアンス要件の管理に役立つ統合コントロール・センターを提供します。Oracle Data Safeには、データ・マスキング、データ不明瞭化、アクティビティ監査、SQLファイアウォール管理など、ヘルスケアに必要な高度なデータ・セキュリティ機能が用意されています。

Oracle Cloud Infrastructure Identity and Access Management (OCI Identity and Access Management)は、アイデンティティを使用したエンド・ユーザー・アクセスの最小権限およびOAuth 2.0認証の原則を実装します。マルチファクタ認証やトークン・ベース認証(JWT)などの高度な機能を安全に提供します。

次の図は、このリファレンス・アーキテクチャを示しています。



oci-ai-healthcare_arch-oracle.zip

このアーキテクチャには、次のコンポーネントがあります。

  • APIゲートウェイ

    Oracle Cloud Infrastructure API Gatewayでは、ネットワーク内からアクセスでき、必要に応じてパブリック・インターネットに公開できるプライベート・エンドポイントを含むAPIを公開できます。エンドポイントは、API検証、リクエストとレスポンスの変換、CORS、認証と認可およびリクエスト制限をサポートします。

  • オブジェクト・ストレージ

    Oracle Cloud Infrastructure Object Storageでは、データベースのバックアップ、分析データ、イメージやビデオなどのリッチ・コンテンツなど、あらゆるコンテンツ・タイプの構造化データおよび非構造化データにすばやくアクセスできます。インターネットまたはクラウド・プラットフォーム内で、データを直接格納および取得できます。パフォーマンスやサービスの信頼性を低下させることなく、ストレージを拡張できます。迅速、即時、頻繁にアクセスする必要があるホット・ストレージには、標準ストレージを使用します。長期間保持し、ほとんどまたはほとんどアクセスしないコールド・ストレージには、アーカイブ・ストレージを使用します。

  • Webアプリケーション・ファイアウォール(WAF)

    Oracle Cloud Infrastructure Web Application Firewall (WAF)は、ロード・バランサやWebアプリケーション・ドメイン名などの強制ポイントにアタッチされている、PCI (Payment Card Industry)準拠のリージョンベースおよびエッジ強制サービスです。WAFは、悪意のある不要なインターネット・トラフィックからアプリケーションを保護します。WAFは、インターネット接続エンドポイントを保護することで、顧客のアプリケーションに対する一貫性のあるルール適用を実現できます。

  • 動的ルーティング・ゲートウェイ(DRG)

    The DRG is a virtual router that provides a path for private network traffic between VCNs in the same region, between a VCN and a network outside the region, such as a VCN in another Oracle Cloud Infrastructure region, an on-premises network, or a network in another cloud provider.

  • セキュリティ・リスト

    サブネットごとに、サブネット内外で許可する必要があるトラフィックのソース、宛先およびタイプを指定するセキュリティ・ルールを作成できます。

レコメンデーション

次の推奨事項を開始点として使用します。お客様の要件は、ここで説明するアーキテクチャとは異なる場合があります。
  • OCI Data Integrationは、フルマネージドのマルチテナント・サービスで、データ・エンジニアや開発者がデータ移動やデータ・ロード・タスクを実行するのに役立ちます。このソリューションは、データ統合データ・ロード・サービスを使用して、低コスト、耐久性、拡張性の高い長期データ保持のために、オブジェクト・ストレージのステージング領域にデータを取り込み、ロードできます。バルク・データ転送は、セキュアなFTP、MLPを介したHL7v2、および標準のFast Healthcare Interoperability Resources (FHIR) Webサービスを使用して実行できます。ステージングされたデータをさらに処理、準備およびキュレートして、Webインタフェースおよびアドホック問合せを介してアプリケーションおよびユーザー使用のためにOracle Autonomous Data Warehouseデータベースに移入できます。

    Spark ETLまたはELTプロセスにより、様々なデータ・アセットから大量のデータを取り込み、クレンジング、変換、再構築して、Oracle Autonomous Data Warehouseに効率的にロードできます。Oracle Autonomous Data Warehouseデータベースは、データマート、データウェアハウス、データレイクなどの分析ワークロードのための業界をリードするフルマネージドで自動化されたデータベースです。これは自己チューニングであり、自動プロビジョニング、パッチ適用およびメンテナンスを提供するため、パフォーマンスの最適化を行います。

    Oracle Cloud Infrastructure Data Scienceサービスを使用して、さらにデータを分析できます。AIモデルは、高パフォーマンスの低コストのGPUコンピュートを使用して構築、トレーニングおよびデプロイできます。カスタム送信Webフックは、保護されたエンドポイントおよびアイデンティティ・サービスを使用してエンド・ユーザーにデータ・アセットをプッシュするように構築されています。

  • プライベート仮想クラウド・ネットワークを使用してサービスをデプロイし、セキュリティ・リストおよびNSGを使用して意図しないアクセスを制限します。
  • OCI Identity and Access Managementを使用して、最小権限およびロールベースのアクセス制御のプリンシパルを適用します。
  • OCI APIゲートウェイでは、ネットワーク内からアクセスでき、必要に応じてパブリック・インターネットに公開できるプライベート・エンドポイントとともにAPIを公開できます。エンドポイントは、API検証、リクエストとレスポンスの変換、CORS、認証と認可およびリクエスト制限をサポートします。
  • OCIは、HIPAAやFedRAMPなどの主要基準への規制コンプライアンスを確保し、機密データを保護するための安全な基盤を提供します。
  • オープンソース・テクノロジを使用して、LangChain、REST API、FunctionsなどのOCIでのベンダー・ロックインを回避し、抽象レイヤーを上に構築してイノベーションと変革を加速します。

確認

  • 作成者: Gautam Karmakar, Animesh Sahay
  • コントリビュータ: Ruzhu Chen