分析とAIアーキテクチャを使用した医療データの標準化

ヘルスケア・データを最新化および標準化し、データ・モデルを適用し、実用的なインテリジェンスを抽出してインサイトを取得し、カスタマー・エクスペリエンスを向上させます。

支払人、プロバイダ、請求データを充実させ、人工知能を含む高度な分析手法を、患者ケアや疾病予防、事前承認での証拠に基づく意思決定、分析、検出、請求詐欺防止、病院や医療提供者の医療警報パラメータの最適化などのユース・ケースに適用できます。

アーキテクチャ

このアーキテクチャにより、既存のデータを使用して、医療ビジネス機能のデジタル化と最新化が加速されます。

Oracle Cloud Infrastructure(OCI)サービスを使用して、データの取り込み、処理、分析を行い、ビジネス・インテリジェンスの獲得、カスタマー・エクスペリエンスの向上、運用効率の向上を実現できます。Oracleは、クラウド・アプリケーションとクラウド・プラットフォーム・サービスの包括的で完全に統合されたスタックを提供します。

OCIは、大規模言語モデルの導入と拡張を簡単かつ柔軟に行うことができます。Oracleは、OracleのSaaSソリューション、データおよびAIプラットフォームを使用して人工知能をビジネス・アプリケーションに適用し、イノベーションを加速するための様々な選択肢を提供し、他のどのクラウド・プロバイダよりも低コストで高パフォーマンスのコンピュート、ストレージおよびネットワーク・インフラストラクチャを実現して、最先端のAIアプリケーションの構築、テスト、デプロイおよび使用を実現します。OCIを初めて利用する場合は、30日間300USドルの無料トライアル・クレジットを提供するOracle Cloud Free Tierを使用して、このソリューションを無料で試すことができます。Free Tierには、無料クレジットの有効期限が切れた後でも、無制限に使用できるAlways Freeサービスがいくつか含まれています。

このリファレンス・アーキテクチャのoracle cloudでは、Zero Trustのセキュリティ、データ保護とプライバシー、および自動ロギングおよび監視ソリューションを実装して適用できます。保存中および転送中のデータは、業界標準の暗号化テクノロジを使用して暗号化できます。システム・ロギングおよびアプリケーション・パフォーマンスの監視はOCI Loggingを使用して実装でき、Webアプリケーション・ファイアウォールをOCI API Gatewayとともに使用して、潜在的なDDoS攻撃およびサイバー脅威から保護できます。

次の図は、このリファレンス・アーキテクチャを示しています。



oci-healthcare-lifescience-aiml-oracle.zip

このアーキテクチャには、次のコンポーネントがあります。

  • データ統合

    Oracle Cloud Infrastructure Data Integrationは、様々なデータ・ソースからAutonomous Data WarehouseOracle Cloud Infrastructure Object Storageなどのターゲット・Oracle Cloud Infrastructureサービスにデータを抽出、ロード、変換、クレンジングおよび再シェイプする、フルマネージドのサーバーレスなクラウドネイティブ・サービスです。ユーザーは、直感的でコードレスなユーザー・インタフェースを使用してデータ統合プロセスを設計し、統合フローを最適化して最も効率的なエンジンとオーケストレーションを生成し、実行環境を自動的に割り当て、スケーリングします。

    ETL (変換ロードの抽出)では、Sparkでの完全管理型のスケールアウト処理が利用され、ELT (ロード変換の抽出)では、データの移動を最小限に抑え、新しく取り込まれたデータの価値実現までの時間を短縮するために、Autonomous Data Warehouseの完全なSQLプッシュダウン機能を利用します。

    Oracle Cloud Infrastructure Data Integrationは、対話型の探索およびデータ準備を提供し、データ・エンジニアがスキーマの変更を処理するルールを定義することでスキーマ・ドリフトから保護するのに役立ちます。

  • GoldenGate

    Oracle Cloud Infrastructure GoldenGateは、データの高可用性を維持し、リアルタイム分析を有効にするためにレプリケーションを使用するリアルタイム・データ・メッシュ・プラットフォームを提供するマネージド・サービスです。お客様は、コンピュート環境を割り当てたり管理したりすることなく、データ・レプリケーションを設計、実行、監視し、データ処理ソリューションをストリーミングできます。

  • オブジェクト・ストレージ

    Oracle Cloud Infrastructure Object Storageでは、データベースのバックアップ、分析データ、イメージやビデオなどのリッチ・コンテンツなど、あらゆるコンテンツ・タイプの構造化データおよび非構造化データにすばやくアクセスできます。インターネットから直接またはクラウド・プラットフォーム内から、安全かつセキュアにデータを格納し、取得できます。パフォーマンスやサービスの信頼性を低下させることなく、ストレージを拡張できます。迅速、即時、頻繁にアクセスする必要があるホット・ストレージには、標準ストレージを使用します。長期間保持し、ほとんどまたはほとんどアクセスしないコールド・ストレージには、アーカイブ・ストレージを使用します。

  • 関数

    Oracle Cloud Infrastructure Functionsは、完全に管理された、マルチテナントのスケーラビリティが高いオンデマンドのFunctions-as-a-Service (FaaS)プラットフォームです。これは、Fn Projectのオープン・ソース・エンジンによって機能します。OCI Functionsでは、コードをデプロイし、直接コールするか、イベントに応答してトリガーできます。OCI Functionsは、Oracle Cloud Infrastructure RegistryでホストされているDockerコンテナを使用します。

  • データフロー

    Oracle Cloud Infrastructureデータ・フローは、Apache Sparkアプリケーションを実行するための完全に管理されたサービスです。これにより、開発者は、アプリケーションに重点を置くことができ、実行するための容易な実行時環境が提供されます。アプリケーションおよびワークフローとの統合のためのAPIサポートを持つ、簡単でシンプルなユーザー・インタフェースが用意されています。

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouseは、データ・ウェアハウス・ワークロード用に最適化された、自動運転、自動保護および自動修復のデータベース・サービスです。ハードウェアの構成や管理、ソフトウェアのインストールを行う必要はありません。Oracle Cloud Infrastructureは、データベースの作成、バックアップ、パッチ適用、アップグレードおよびチューニングを処理します。

  • ファイル・ストレージ

    Oracle Cloud Infrastructure File Storageでは、永続的でスケーラブルなセキュアなエンタープライズ規模のネットワーク・ファイル・システムを提供します。VCN内の任意のベア・メタル、仮想マシンまたはコンテナ・インスタンスからOCI File Storageに接続できます。また、Oracle Cloud Infrastructure FastConnectおよびIPSec VPNを使用して、VCNの外部からOCI File Storageにアクセスすることもできます。

  • Slurmスケジューラとデータベース(オープンソース)

    Slurmは、大規模および小規模Linuxクラスタ向けのオープン・ソースでフォルト・トレラントでスケーラブルなクラスタ管理およびジョブ・スケジューリング・システムです。

  • モニタリング

    Oracle Cloud Infrastructure Monitoringサービスは、メトリックを使用してクラウド・リソースをアクティブおよびパッシブに監視し、リソースおよびアラームを監視して、これらのメトリックがアラーム指定のトリガーを満たしたときに通知します。

  • ロギング
    Loggingは、クラウド内のリソースから次のタイプのログへのアクセスを提供する、高度にスケーラブルな完全管理型のサービスです:
    • 監査ログ: 監査サービスによって発行されたイベントに関連するログ。
    • サービス・ログ: APIゲートウェイ、イベント、ファンクション、ロード・バランシング、オブジェクト・ストレージ、VCNフロー・ログなどの個々のサービスによって発行されるログ。
    • カスタム・ログ: カスタム・アプリケーション、他のクラウド・プロバイダまたはオンプレミス環境からの診断情報を含むログ。
  • コンピュート

    Oracle Cloud Infrastructure Computeを使用すると、クラウド内のコンピュート・ホストをプロビジョニングおよび管理できます。CPU、メモリー、ネットワーク帯域幅およびストレージのリソース要件を満たすシェイプを使用してコンピュート・インスタンスを起動できます。コンピュート・インスタンスを作成した後は、セキュアにアクセスし、再起動、ボリュームのアタッチおよびデタッチを行い、不要になったらそれを終了します。

  • ベクトル・データベース(Oracle DB 23ai)

    ベクトル・データベースは、ベクトル埋込みをネイティブに格納および管理し、ドキュメント、イメージ、ビデオ、オーディオなど、記述した非構造化データを処理できる任意のデータベースです。

  • データ・カタログ

    Oracle Cloud Infrastructure Data Catalogは、エンタープライズ・データの完全管理のセルフサービス・データ検出およびガバナンス・ソリューションです。組織の技術、ビジネスおよび運用メタデータを管理するための単一の共同環境をデータ・エンジニア、データ・サイエンティスト、データ・スチュワードおよび最高データ責任者に提供します。

  • ラングチェーン

    LangChainは、大規模言語モデル(LLM)からアプリケーションを作成するためのオープン・ソースのモジュール・フレームワークです。LangChainを使用すると、チャットボットの構築、テキストの分析、構造化データからのQ&Aの実行、APIとの対話、生成AIを使用するアプリケーションの作成を行うことができます。

  • 統合

    Oracle Integrationは、クラウドとオンプレミスのアプリケーションの統合、ビジネス・プロセスの自動化およびビジュアル・アプリケーションの開発を可能にする、フルマネージドの事前構成済環境です。SFTP準拠のファイル・サーバーを使用してファイルを格納および取得し、数百のアダプタおよびレシピのポートフォリオを使用してOracleおよびサードパーティ・アプリケーションに接続することで、B2B取引パートナとドキュメントを交換できます。

データ収集と処理

  • Oracle Cloudは、オンプレミス、他のクラウド・プラットフォーム、インターネット上のデータを統合する包括的なハイブリッドおよびマルチクラウド・ソリューションを提供します。OCI GoldenGateおよびData Integration Platform-as-a-Serviceを使用して、ソースのタイプに応じて様々なソース・システムからデータを取り込むことができます。OCI GoldenGateを使用すると、データのレプリケート、同期の維持、修復を行い、データの整合性と一貫性を維持できます。Oracle Integrationは、様々なエンタープライズ・アプリケーションに接続してデータを取り込むことができます。バルク・データ転送は、セキュアなFTP、MLPを介したHL7v2、および標準のFast Healthcare Interoperability Resources (FHIR) Webサービスを使用して実行できます。
  • 電子健康記録(EHR)、患者情報、請求およびプロバイダ・データ、医療機器からのデータ、ゲノム情報などの医療システムからのデータは、ステージング領域としてOracleの高可用性、耐久性および低コストのオブジェクト・ストレージに移動できます。
  • OCIデータ・フローを使用すると、新しいデータがステージング領域に到着したときにOCI FunctionsによってトリガーされるRAWデータを処理できます。Oracle Cloudプラットフォームのデータ・フローは、サーバーレスでスパークベースの高速なデータ準備および処理サービスを提供し、インフラストラクチャを管理および維持することなく、好みに基づいてPySpark、SQLまたはJavaを使用してコードを記述できます。
  • 準備および処理されたデータは、ダウンストリーム処理および消費のキュレートされたステージとして、Oracle Autonomous Data WarehouseおよびOCI Object Storageに書き込むことができます。Oracle Autonomous Data Warehouseは、業界をリードするフルマネージド分析データベース・プラットフォームであり、組み込みのスケーラビリティ、セキュリティ、管理、および高可用性を備えています。医療データについては、PII情報のプライバシーと保護が最も重要です。Oracle Autonomous Data Warehouseは、保存時のデータ暗号化(AES256)を常に提供します。データは、TLS 2.0を使用して遷移時にも暗号化されます。Autonomous Databaseに含まれているOracle Data Safeは、Oracleデータベースの日々のセキュリティおよびコンプライアンス要件の管理に役立つ統合コントロール・センターを提供します。Oracle Data Safeは、データ・マスキング、データの難読化、アクティビティ監査、SQLファイアウォール管理など、ヘルスケアに必要な高度なデータ・セキュリティ機能を提供します。
  • AIレイヤーでは、このソリューションは、データ統合、AI統合、LLMトレーニングと推論のためのGPUとCPUクラスタ、AI開発ツールとライブラリ、コンテキストとカタログで構成されます。モデルの場合、OCI生成AIサービスは、CohereおよびMeta Llama 3.1モデル、専用の高パフォーマンスのGPUクラスタ、チャットAPIおよびプレイグラウンド、LangChainおよびLlamaIndexなどのオープンソース統合から業界をリードする最新AIモデルに使用できます。Oracleは、L40s、A10、A100、H100などの幅広いGPUを提供し、他のハイパースケラと比較して魅力的な価格性能の違いを提供します。
  • Oracleは、完全に自動化されたSlurmスケジューラを提供し、クラスタ・デプロイメントの自動化の一部としてデプロイできます。Slurmは、大規模および小規模Linuxクラスタ向けのオープン・ソースでフォルト・トレラントでスケーラブルなクラスタ管理およびジョブ・スケジューリング・システムです。
  • OCIは、OCI GenAI Agentを使用したマネージド・サービスとしてRetrieval-Augmented Generation (RAG)を提供しています(サービスはまだベータ版であり、ナレッジ・ベース・リポジトリとしてOpenSearchのみをサポートしています)。Oracle Database 23aiおよびOracle HeatWave MySQLは、AIベクトルの検索および格納に最適です。RAGを使用すると、組織は既存のデータに基づいて既存のナレッジ・ベースを使用して、大規模言語モデル(LLM)レスポンスを統合およびエンリッチできます。たとえば、ユーザーが質問をすると、追加のコンテキスト情報を含む情報が取得され、質問に追加された後、LLMの応答を強化し、幻覚を減らすために質問と取得されたテキストをLLMに提供します。

レコメンデーション

次の推奨事項を開始点として使用します。 お客様の要件は、ここで説明するアーキテクチャとは異なる場合があります。
  • プライベート仮想クラウド・ネットワークを使用してサービスをデプロイし、セキュリティ・リストおよびNSGを使用して意図しないアクセスを制限します。
  • OCI Identity and Access Managementを使用して、最小権限およびロールベースのアクセス制御のプリンシパルを適用します。
  • OCI APIゲートウェイでは、ネットワーク内からアクセスでき、必要に応じてパブリック・インターネットに公開できるプライベート・エンドポイントとともにAPIを公開できます。エンドポイントは、API検証、リクエストとレスポンスの変換、CORS、認証と認可およびリクエスト制限をサポートします。
  • OCIは、規制上の義務と保護に対する完全なHIPAAコンプライアンスとFedRAMPおよびその他の標準コンプライアンスを提供します。
  • オープンソース・テクノロジを使用して、LangChain、REST API、FunctionsなどのOCIでのベンダー・ロックインを回避し、抽象レイヤーを上に構築してイノベーションと変革を加速します。

確認

  • 作成者: Gautam Karmakar
  • コントリビュータ: John Sulyok