非構造化ドキュメントをインテリジェントに処理

非構造化ドキュメントの処理は、インテリジェントな自動化なしでは時間のかかるタスクになる可能性があります。たとえば、請求書PDFを例として考えてみましょう。会社名、日付、請求書番号、住所などの主要なヘッダー情報を抽出する必要がある場合があります。また、様々な品目番号、摘要、数量、単価および合計を含む各明細品目を抽出する必要もあります。抽出後、この情報は、データベース、Oracle E-Business Suiteなどのターゲット・アプリケーション、Oracle Fusion Cloud Financials、Oracle Fusion Cloud SCMなどのレコード・システムに転記する必要があります。最後に、エンド・ユーザーは、レポートの作成やカスタム・アプリケーションのいずれであっても、新しく投稿された情報に対してアクションを実行できます。

このシナリオは、Oracle Integration Cloud Serviceを使用して簡単に実現し、様々なOracle Cloud Infrastructure (OCI)サービスをオーケストレーションします。Oracle Integration Cloud Serviceを使用すると、OCIで実行する場合でも、他の場所で実行する場合でも、レコード・システムに簡単に接続して統合できます。OCI Document UnderstandingなどのOCIのAIサービスは、Oracle Integration Cloud Serviceと簡単に組み合わせて、さまざまなユースケースを実現できます。

このアプローチは、パスポート、運転免許証、領収書などの事前構築済みモデルを使用して非構造化文書の処理を自動化する他の多くのユースケースに簡単に適用できます。その他のドキュメント・タイプは、OCI Document Understandingサービスでカスタム・モデルをトレーニングすることで処理することもできます。

アーキテクチャ

このアーキテクチャでは、Oracle Integration Cloud Serviceを使用してOCIサービスを調整し、インテリジェントな非構造化ドキュメント処理を自動化する方法について説明します。

次の図は、このリファレンス・アーキテクチャを示しています。



oic-process-documents-arch.zip

このアーキテクチャのワークフローは次のようになります。

  1. 統合は、Oracle Integration Cloud Serviceによって開始され、事前組込みアダプタを使用してMicrosoft OutlookまたはGmailから新しい電子メール添付(PDF、PNG、JPGなど)をフェッチします。
  2. 添付は、Oracle Integration Cloud Serviceの組込みファイル・サーバーに格納することも、短期から長期の保持のためにOCI Object Storageに格納することもできます。
  3. OCI Document Understandingが起動され、新しくアップロードされたファイルが取得されて処理され、抽出されたキー・フィールドの構造化JSONがOracle Integration Cloud Serviceに戻されます。
  4. OCI Document Understandingによって返される信頼度スコアが許容されるしきい値を満たした場合、統合は、100以上の事前組込みアダプタのいずれかを使用して様々なシステムまたはアプリケーションに追加のコールを行うことで、抽出された結果を変換および検証します。それ以外の場合、統合によってOracle Integration Cloud Service Process Automation内のプロセスが開始され、中断のない例外処理が保証されます。このプロセスの一環として、開発者またはアナリストは、記入票を確認して修正してから再送信するか、または必要なキー値ペアを手動で識別して統合を続行できるようにするための電子メール通知を受信します。
  5. 抽出されたデータは、OCI FastConnectおよび接続エージェント、Oracleバックボーンを介したOracle Fusion Cloud Financials、プライベート・エンドポイントを介したOracle Autonomous Transaction Processingデータベース、またはSalesforce、SAP、Workdayなどの他のアプリケーションを使用して、オンプレミスのOracle E-Business Suiteなどのレコード・システムに挿入されます。
  6. 抽出および検証されたデータが統合フローの一部としてプライベートOracle Autonomous Transaction Processingデータベースに挿入されると、追加のOCI機能を利用して、エンド・ユーザーがデータを操作する様々な方法を提供できるようになりました。たとえば、Oracle APEX (Oracle Databaseに付属のローコード・プラットフォーム)を使用して、カスタム・ポータルを簡単に構築できます。このポータルでは、ビジネス・ユーザーがカスタムUIを使用して抽出データを問い合せおよび更新できます。
  7. オプションで、Oracle Autonomous Transaction ProcessingデータベースをOracle Analytics Cloudインスタンスに接続できます。このインスタンスでは、ビジネス・ユーザーが、処理された最も重要なドキュメントの傾向を明らかにするカスタム・レポートを作成できます。

このアーキテクチャには、次のコンポーネントがあります。

  • リージョン

    Oracle Cloud Infrastructureリージョンとは、可用性ドメインと呼ばれる1つ以上のデータ・センターを含む、ローカライズされた地理的領域です。リージョンは他のリージョンから独立し、長距離の場合は(複数の国または大陸にまたがって)分離できます。

  • 可用性ドメイン

    可用性ドメインは、リージョン内の独立したスタンドアロン・データ・センターです。各可用性ドメイン内の物理リソースは、他の可用性ドメイン内のリソースから分離されているため、フォルト・トレランスが提供されます。可用性ドメインどうしは、電力や冷却、内部可用性ドメイン・ネットワークなどのインフラを共有しません。そのため、ある可用性ドメインでの障害は、リージョン内の他の可用性ドメインには影響しません。

  • フォルト・ドメイン

    フォルト・ドメインは、可用性ドメイン内のハードウェアおよびインフラストラクチャのグループです。各アベイラビリティ・ドメインに3つのフォルト・ドメインがあり、電源とハードウェアは独立しています。複数のフォルト・ドメインにリソースを分散する場合、アプリケーションは、物理サーバーの障害、システム・メンテナンスおよびフォルト・ドメイン内の電源障害を許容できます。

  • 仮想クラウド・ネットワーク(VCN)およびサブネット

    VCNは、Oracle Cloud Infrastructureリージョンで設定する、カスタマイズ可能なソフトウェア定義のネットワークです。従来のデータ・センター・ネットワークと同様に、VCNを使用するとネットワーク環境を制御できます。VCNには重複しない複数のCIDRブロックを含めることができ、VCNの作成後にそれらを変更できます。VCNをサブネットにセグメント化して、そのスコープをリージョンまたは可用性ドメインに設定できます。各サブネットは、VCN内の他のサブネットと重複しない連続した範囲のアドレスで構成されます。サブネットのサイズは、作成後に変更できます。サブネットはパブリックにもプライベートにもできます。

  • オンプレミス・ネットワーク

    このネットワークは、組織が使用するローカルネットワークです。これはトポロジのスポークスです。

  • 動的ルーティング・ゲートウェイ(DRG)

    DRGは、VCNとリージョン外のネットワーク(別のOracle Cloud Infrastructureリージョン内のVCN、オンプレミス・ネットワーク、別のクラウド・プロバイダ内のネットワークなど)の間のプライベート・ネットワーク・トラフィックのパスを提供する仮想ルーターです。

  • サービス・ゲートウェイ

    サービス・ゲートウェイは、VCNからOracle Cloud Infrastructure Object Storageなどの他のサービスへのアクセスを提供します。The traffic from the VCN to the Oracle service travels over the Oracle network fabric and does not traverse the internet.

  • FastConnect

    Oracle Cloud Infrastructure FastConnectは、データ・センターとOracle Cloud Infrastructureの間に専用のプライベート接続を簡単に作成する方法を提供します。FastConnectは、インターネットベースの接続と比較して、高帯域幅のオプションと、より信頼性の高いネットワーキング・エクスペリエンスを提供します。

  • ルート表

    仮想ルート表には、通常ゲートウェイを介して、サブネットからVCN外部の宛先にトラフィックをルーティングするルールが含まれます。

  • セキュリティ・リスト

    サブネットごとに、サブネット内外で許可する必要があるトラフィックのソース、宛先およびタイプを指定するセキュリティ・ルールを作成できます。

  • オブジェクト・ストレージ

    オブジェクト・ストレージでは、データベースのバックアップ、分析データ、イメージやビデオなどのリッチ・コンテンツなど、任意のコンテンツ・タイプの構造化データおよび非構造化データにすばやくアクセスできます。インターネットから直接またはクラウド・プラットフォーム内から、安全かつセキュアにデータを格納し、取得できます。パフォーマンスやサービスの信頼性を低下させることなく、ストレージを拡張できます。迅速、即時、頻繁にアクセスする必要があるホット・ストレージには、標準ストレージを使用します。長期間保持し、ほとんどまたはほとんどアクセスしないコールド・ストレージには、アーカイブ・ストレージを使用します。

  • Oracle Services Network

    Oracle Services Network (OSN)は、Oracleサービス用に予約されているOracle Cloud Infrastructureの概念的なネットワークです。これらのサービスには、インターネットを介してアクセスできるパブリックIPアドレスがあります。Oracle Cloud外部のホストは、Oracle Cloud Infrastructure FastConnectまたはVPN接続を使用してOSNにプライベートにアクセスできます。VCN内のホストは、サービス・ゲートウェイを介してOSNにプライベートにアクセスできます。

  • 統合

    Oracle Integrationは、アプリケーションの統合、プロセスの自動化、ビジネス・プロセスに対するインサイトの取得およびビジュアル・アプリケーションの作成を可能にするフルマネージド・サービスです。

  • ドキュメント分析

    Oracle Cloud Infrastructure Document Understandingは、ディープラーニングベースのドキュメント分析を大規模に実行するためのAIサービスです。あらかじめ用意されたモデルを使用することで、開発者は機械学習(ML)の専門知識がなくても、アプリケーションにインテリジェントなドキュメント処理を簡単に組み込むことができます。

  • 「アナリティクス」

    Oracle Analytics Cloudは、スケーラブルでセキュアなパブリック・クラウド・サービスであり、最新のAI駆動のセルフサービス・アナリティクス機能を使用して、データ準備、ビジュアライゼーション、エンタープライズ・レポート、拡張分析および自然言語処理と生成に対応した機能を提供します。Oracle Analytics Cloudには、迅速なセットアップ、簡単なスケーリングとパッチ適用、自動ライフサイクル管理など、柔軟なサービス管理機能も用意されています。

  • APEXサービス

    Oracle APEXは、Oracle Databaseがインストールされている任意の場所にデプロイできる、スケーラブルで機能豊富なセキュアなエンタープライズ・アプリケーションを構築できるロー・コード開発プラットフォームです。高度なソリューションを提供するために、幅広いテクノロジーの専門家である必要はありません。Oracle APEXには、ユーザー・インタフェース・テーマ、ナビゲーション・コントロール、フォーム・ハンドラ、アプリケーション開発プロセスを短縮する柔軟なレポートなどの組込み機能が含まれています。

  • Autonomous Transaction Processing

    Oracle Autonomous Transaction Processingは、トランザクション処理ワークロード用に最適化された、自動運転、自己保護および自己修復が可能なデータベース・サービスです。ハードウェアの構成や管理、ソフトウェアのインストールを行う必要はありません。Oracle Cloud Infrastructureは、データベースの作成に加え、データベースのバックアップ、パッチ適用、アップグレードおよびチューニングも処理します。

  • アイデンティティおよびアクセス管理(IAM)

    Oracle Cloud Infrastructure Identity and Access Management(IAM)は、Oracle Cloud Infrastructure(OCI)およびOracle Cloud Applicationsのアクセス・コントロール・プレーンです。IAM APIおよびユーザー・インタフェースを使用すると、アイデンティティ・ドメインおよびアイデンティティ・ドメイン内のリソースを管理できます。各OCI IAMアイデンティティ・ドメインは、スタンドアロンのアイデンティティおよびアクセス管理ソリューション、または異なるユーザー集団を表します。

  • ロギング
    Loggingは、クラウド内のリソースから次のタイプのログへのアクセスを提供する、高度にスケーラブルな完全管理型のサービスです:
    • 監査ログ: 監査サービスによって発行されたイベントに関連するログ。
    • サービス・ログ: APIゲートウェイ、イベント、ファンクション、ロード・バランシング、オブジェクト・ストレージ、VCNフロー・ログなどの個々のサービスによって発行されるログ。
    • カスタム・ログ: カスタム・アプリケーション、他のクラウド・プロバイダまたはオンプレミス環境からの診断情報を含むログ。
  • 監査

    Oracle Cloud Infrastructure Auditサービスでは、ログ・イベントとして、Oracle Cloud Infrastructureのサポートされるすべてのパブリック・アプリケーション・プログラミング・インタフェース(API)エンドポイントへのコールが自動的に記録されます。現在、すべてのサービスがOracle Cloud Infrastructure Auditによるロギングをサポートしています。

レコメンデーション

Oracle Integration Cloud Serviceでインテリジェントなドキュメント処理を実装するには、次の推奨事項を開始点として使用します。お客様の要件は、ここで説明するアーキテクチャとは異なる場合があります。
  • Oracle Integration Cloud Serviceインスタンスへのアクセスの制限

    許可リスト(以前のホワイトリスト)を構成して、Oracle Integration Cloud Serviceインスタンスにアクセスできるネットワークを制限します。特定のIPアドレス、クラスレス・ドメイン間ルーティング(CIDR)ブロックおよび指定した仮想クラウド・ネットワークのユーザーのみがインスタンスにアクセスできます。

  • 接続性

    リソースをOCIにデプロイする場合、オンプレミス・ネットワークへの単一の接続で小規模から開始できます。この単一の接続は、FastConnectまたはIPSec VPNを介して行うことができます。冗長性を計画するには、オンプレミス・ネットワークとOCIの間のすべてのコンポーネント(ハードウェア・デバイス、設備、回路および電源)を考慮します。また、施設がパス間で共有されないように、多様性を考慮してください。

  • 高可用性環境での接続エージェントの使用

    Oracle Integration Cloud Serviceでは、接続エージェントを異なるホストに2回インストールすることで、高可用性環境で接続エージェントを使用できます。接続エージェントは水平方向にスケーリングできるため、1つのエージェント・グループに対して複数のエージェントを実行する利点がすべて得られます。これにより、パフォーマンスが向上し、フェイルオーバーの利点が拡張されます。

  • プライベート・エンドポイントの使用

    プライベート・エンドポイントにより、統合は仮想クラウド・ネットワーク(VCN)内のプライベート・リソースに接続できます。すべてのトラフィックは、OCI内で設定されたプライベート・チャネルを経由します。インスタンスごとに1つのプライベート・エンドポイントを構成できます。これにより、Oracle Integration Cloud Serviceインスタンスは、接続エージェントを介さずにプライベート・リソースにアクセスできます。

確認

  • 作成者: Nolan Trouvé, Jerry Mbamo
  • コントリビュータ: Daryl Eicher