Data Lakehouseのアプリケーション

データ・レイクハウスは、診断プロセスを加速および改善し、患者の回復の可能性を向上できます。

PACSとVNAの違いは、より多様な画像フォーマットを処理する能力です。ただし、どちらかが課題を提示できます。イメージには大量のストレージ容量が必要であるため、多くの場合、ストレージ・システムは現在のケース・イメージを保持します。古いイメージは低コスト(オフライン・ストレージなど)に移行しやすく、患者のイメージ履歴へのアクセスは困難で時間のかかる作業になります。RISおよびPACS/VNAソリューションは、医療センターにオンプレミスに常駐する可能性が高いため、ITインフラストラクチャへのアクセスが必要になる場合があります。これは、データ・セキュリティを確保するために、医療センターがストレージ・スペシャリストを採用する必要があることを意味します。VNAソリューションは、医療情報交換(HIE)への参加を支援する可能性が高いため、医療提供者は、データの共有、安全なネットワークの構築、およびファスト・ヘルスケア相互運用性リソース(FHIR)および関連標準の使用に協力できます。これは、UKのHealth and Social Care Network (HSCN)など一部の国で規制対象のソリューションである可能性があります。規制により、証明コンプライアンスの追加コストが発生する可能性があります。

データ・レイクハウスは、患者の診療プロセスを大幅に高速化できます。クラウド提供のストレージ・ソリューションを採用することで、医療センターがオンプレミス・ソリューションと一致しそうもない経済規模の非常に大量のストレージ(アーカイブされたストレージも含む)にすばやくアクセスできます。また、クラウド・ソリューションにより、医療センターが、ソリューションの運用を維持するために冗長性とリカバリの問題を管理するために必要な専門的なスキルを維持する必要性が軽減されます。

イメージへのより迅速なアクセスは、臨床医がイメージを評価する時間を増やすことを意味し、患者が診断および治療を待つ時間を短縮します。また、大量のイメージを使用して、健全な胸部と異常な胸部での人工知能(AI)および機械学習(ML)機能(Oracle Cloud Infrastructure VisionおよびOracle Cloud Infrastructure Data Scienceで提供)をトレーニングすることもできます。これにより、AI/MLが主な問題(患者の現在の症状)を調査できるだけでなく、患者がまだ症状を発現していない他の問題を検出することもできます。AI/MLがx配列の評価中に問題を検出したかどうかに関係なく、最終的な発言は常に人間のものである必要があります。イメージ処理AIは、その評価に基づいて複数の方法でこれに対処できます。

  • AIは、迅速な介入が患者の予後との違いを生む可能性がある重要な問題を示すx線に優先順位を付けることができます。これは、患者が帰宅するのではなく、すぐに入院することにつながる可能性があります。
  • AIは、臨床医への異常を強調することで、2番目の目として機能できます。これは、人間が欠けている可能性のある二次的な問題のサブレットを特定するのに役立ちます。デジタル・エクスペリエンスは、Oracle Functions (またはOracle Container Engine for Kubernetes)を使用して作成することも、Oracle Visual BuilderOracle JETまたはAPEXサービスを使用してダッシュボードをレンダリングすることもできます。
  • データ・レイクハウスには様々な関連データが用意されており、患者のデータからさらなるインサイトを引き出すために医療分析と組み合わせることができます。これは、予期しないトレンドや、臨床医が認識していない可能性のあるインサイトを発見するのに役立ちます。

    たとえば、患者の医療記録のノートは、患者が喫煙者であるか、喫煙者であるか、喫煙者を含む世帯から来るか、あるいは地理的データと組み合せた患者の連絡先詳細に、複雑な要因を持つ可能性がある生活条件(e.g、湿気またはアスベストの存在)に関連する変数を追加する場合があります。

    この支援がなければ、これらの要因を評価するには、臨床医がソーシャルワーカーやリアルな人のように考える必要があり、画像の評価に焦点を当てるだけでなく、患者の医療履歴を詳細にレビューする時間を増やすことになるでしょう。

    このデータの混合を実現するために、Autonomous Databaseサービスなどのデータベースに、データ統合を使用してデータセットをまとめてリンクする半構造化データまたは完全構造化データを格納します。Oracle Cloud Infrastructure Object Storageのイメージなどの非構造化データおよび半構造化データは、イメージに関連付けられたメタデータなどの構造化データへのリンクを追加することで統合されます。イメージを検索可能なデータにリンクするプロセスは、Oracle Cloud Infrastructure Data Labeling (データ・ラベリング)サービスを使用してサポートされます。データ・ラベリングを使用して構造化データのラベル付けを行うこともできます。これにより、外れ値を表すレコードに簡単にタグ付けして、AI/MLプロセスから明示的に包含または除外できます。

  • AI/MLの所見は患者とその医療提供者に予備的(または二次臨床医の診察を受ける)として報告されるため、症状の他の原因を調べることができる。その結果、患者が診断に近づくもう一つのステップである。この通信は、Autonomous Databaseの患者のレコードから連絡先情報を取得し、SMS、電子メールなどのサービスを使用するか、前に説明したダッシュボードまたはデジタル・フロントエンドを通じて臨床スタッフに通知することで実現できます。

患者のデータは医療センターの物理的なIT制約に結びついていないため、他の場所では外部の医療専門家から参照できます。これは、1つ以上のHIEと連携するインフラストラクチャが整備される可能性が高いため、迅速かつ効率的に発生する可能性があります。そのため、単一のケア・プロバイダの機能を超えて容量を拡張します。このタイプの自動化は、Oracle Integration Cloud Service (OIC)およびAPIゲートウェイ(アウトバウンド・ポジション)を介して実現できるため、データ・エグレスを制御および監査できます。外部APIがコールごとの支払ベースで使用されている場合、アウトバウンド管理では、それらのサービスを制御して超過料金を回避できます。一括データ共有は(OICを介して提供される)FTPを介して管理されますが、非APIデータの通信は最初のインスタンスのAPIコールを介してシグナルされます。

図- OCI上のデータ・レイクハウスのない患者の体験シナリオ



図- OCI上のデータ・レイクハウスによる患者の体験シナリオ



臨床イメージプロセスへの社会経済データのリンクについて

大量のデータの取込みに使用できるデータ・レイクハウスは、他のデータ・ソースに接続して、患者を評価する臨床医の効率的な分析を促進できます。

データ・レイクハウスを使用することで、大量のデータを取り込み、さまざまなデータ・ソースを混在させて適切な臨床治療を支援する方法が明らかになりました。医療以外のデータを患者と関連付ける能力は非常に重要です。COVID-19パンデミックまたは西アフリカでエボラの発生を考えてみてください。このようなリンクされたデータは、これらのウイルスの拡散を特定し制限するのに役立ちます。感染症の発生頻度、回復速度、感染後の健康問題(うつ病や不安からの状態、耐疲労性や疲労性の運動)を改善する患者に最適な治療法は、同様の感染症や疾患とその結果をもつ他の患者に対して分析することで発見できる。

このようなリンクを実現するには、Oracle Cloud Infrastructure Data Catalogが役立つデータを理解する必要があります。これは、湖畔に格納されているデータの追跡だけでなく、APIなどのソースを介してアクセスおよび使用できるその他のデータ・ソースに格納されています。これにより、データ・レイクハウスのコンテンツを管理し、Oracle Cloud Infrastructure Data Scienceツールを使用して実行されているデータ分析を通知して、データの関係を判断できます。

混合データのより一般的な用途には、米国だけで10%の死亡率と推定20,000の症例を持つLegionnaire's Diseaseなどの流行の識別と分離が含まれます。このタイプの識別には、Autonomous Database内の関連するEMR/EHRレコードを抽出し、動きに関する患者からのデジタル化(Oracle Cloud Infrastructure Vision)ノートを抽出して、データ・サイエンス・ツールセットと、これらの製品のビジュアライゼーション機能(Oracle Analytics CloudOracle Visual BuilderOracle JETまたはAPEXサービス)を使用して地理データと組み合せます。ツールの選択は、表示するユーザー・エクスペリエンスとデータによって異なります。

疾病管理センター(CDC)や世界保健機関(WHO)などの組織は、健康への要因の発生に関するデータ・セットに接続されたAPIを提供します。たとえば、World Air Quality IndexなどのAPIサービスから空気品質データを取得できます。このデータは肺炎のような肺障害を持つ人々にとって非常に重要であり、空気の質または毒性レベルはかなりの悪化因子であり、各センサ間の距離が短くても大きな変動のために評価が困難である。データは、Oracle Integration Cloud Service、APIゲートウェイ、Oracle Functions (またはOracle Container Engine for Kubernetes)、Autonomous Database (構造化コンテンツ)およびOracle Cloud Infrastructure Object Storage (非構造化コンテンツ)の組合せを使用して評価できます。データ準備またはクレンジング・プロセスでは、Oracle Cloud Infrastructure Data ScienceOracle Cloud Infrastructure Data FlowまたはOracle Cloud Infrastructure Data Integrationを使用して、プラットフォーム内またはプラットフォーム外のデータ・フローを規制できます。Streamsは、データを一連のイベントとして処理できるため、Kafka API補完機能を提供します。つまり、外部サービスが非常に集中的なデータ・バーストのデータを提供している場合、データ・レイクハウスにロードする準備ができるまで、データをステージングできます。

これを実現するには、次のことが必要です:

  • 関連データをキャプチャしてクレンジングし、「ガベージ・イン、ゴミ・アウト」を回避します。
  • 非構造化データを半構造化データに変換することで、検索や問合せが容易になります。

HL7、FIHIR、SNOMED (臨床用語)などの標準を使用し、データを表現するためのHIEの演習を使用すると、イメージング用のDigitalとの相互運用性が向上します。これらのドメイン標準は、XML、JSON、RESTなどの業界の一般的なテクノロジに基づいて構築されています。その結果、Oracle製品では、これらのテクノロジの上にドメイン固有のソリューションを提供して、すぐに利用可能なデータを処理できます。