カスタム・モデルについて

Document Understandingでは、カスタム・モデルを活用して、キーと値のペアを抽出し、ドキュメントを分類して、プロセスを特定のニーズにあわせて調整できます。

カスタム・キー/値抽出

この機能を使用すると、ドキュメント内のユーザー定義フィールドを識別および検索するモデルを作成できます。たとえば、HRチームは、名前、ジョブID、Eメール・アドレスなどの詳細を取得するジョブ応募フォームのモデルを構築できます。結果には、精度に対する信頼度スコアと、ページ上の検出された各フィールドの座標(境界ボックス)が含まれます。

カスタム・モデル・タイプ

Document Understandingには、クラシック・カスタム・モデルと生成カスタム・モデルによるカスタム・キーバリュー抽出のための2つの方法があります。

クラシック

カスタム・クラシック・キーバリュー・モデル(トレーニング済)
  • モデルをトレーニングする必要があります。
  • 注釈付きの例のデータセットの準備が含まれます。
  • トレーニング・データを使用できるラベルが付いた特定の文書レイアウトまたは業種に対してモデルを微調整する必要があるシナリオに最適です。
  • 設定については、データセットの作成ガイドを参照してください。

生成

[NEW]カスタム生成キー値モデル(プロンプトベース)
  • 自然言語プロンプトを使用して定義された迅速で柔軟な抽出に最適で、トレーニング・データは不要です。
  • データセットの作成とモデル・トレーニングを完全にスキップします。
  • フィールドを平易な英語で記述します。次に例を示します。

    Extract Invoice Number, Invoice Date, Supplier Name, Total Amount

  • 迅速な導入、進化する要件、さまざまな形式のドキュメントに適しています。
  • 詳細は、「カスタム生成モデルV2.0の作成(新規)」を参照してください。

カスタム・ドキュメント分類

ここでは、定義したカテゴリにドキュメントをソートするモデルを開発できます。銀行振込の例: 住宅ローン関連ファイルを与信レポート、リース契約または申請フォームとして分類します。信頼性を示すために、各カテゴリの信頼度スコアを提供します。