カスタム・モデルの作成

Document Understandingは、データ・サイエンティストを必要とせずにイメージからインサイトを抽出するカスタム・モデルを構築するオプションを提供します。

カスタム・モデルを構築する前に、次のものが必要です。

  • Oracle Cloud Infrastructureの有料テナンシ・アカウント。
  • Oracle Cloud Infrastructure Object Storageについて理解します。
  • 正しいポリシーが設定されています。

Document Understandingのカスタム・モデル・トレーニング・モードのいずれかを使用して、モデルをトレーニングします。研修モードは次のとおりです。

  • 推奨トレーニング: Document Understandingでは、最適なモデルを作成するためのトレーニング期間が自動的に選択されます。トレーニングには24時間かかる場合があります。
  • カスタム期間: このオプションを使用すると、最大トレーニング期間を設定できます。

最適なトレーニング期間は、検出問題の複雑さ、ドキュメント内のラベルの典型的な数、解像度、およびその他の要因によって異なります。これらのニーズを考慮し、トレーニングの複雑さが増すにつれて、より多くの時間を割り当てます。推奨される最小トレーニング時間は30分です。トレーニング時間が長くなると精度が向上しますが、時間の正確さが低下します。基本最適化モデルを取得するには、推奨モードを使用します。より良い結果を得るには、トレーニング時間を増やしてください。

  • モデルを作成するにはプロジェクトが必要です。ない場合は、プロジェクトの作成を参照してください。
    1. プロジェクトの詳細ページで、「モデルの作成」を選択します。プロジェクトの詳細ページの検索に関するヘルプが必要な場合は、プロジェクトの表示を参照してください。
    2. トレーニングするモデル・タイプを選択します。「ドキュメント分類」または「キー値抽出」のいずれかです。
      これらのタイプの詳細は、「カスタム・モデルについて」を参照してください。
    3. トレーニング・データを選択します。
      • 注釈付きドキュメントがない場合は、「新規データセットの作成」を選択します。Oracle Cloud Infrastructure Data Labelingに移動すると、ドキュメント・コンテンツにラベルを簡単に追加できます。データ・ラベリングでのドキュメントの注釈付けの詳細は、ドキュメントのラベル付けの項を参照してください。
      • 注釈付きドキュメントがある場合は、既存のデータセットを選択します
        • データ・ラベリングでデータセットに注釈を付けた場合は、「データ・ラベリング・サービス」を選択します。
        • サード・パーティ・ツールを使用してイメージに注釈を付けた場合は、「オブジェクト・ストレージ」を選択します。
    4. 「次」を選択します。
    5. 名前またはカスタム・モデルを入力してください。
    6. (オプション)検索に役立つ説明をモデルに提供します。
    7. トレーニング期間を選択します。
      • 推奨トレーニング: Document Understandingは、最適なモデルを作成するためのトレーニング期間を自動的に選択します。トレーニングには24時間かかる場合があります。
      • カスタム: このオプションでは、最大トレーニング期間(時間)を設定できます。
    8. 「次」を選択します。
    9. 前のステップで指定した情報を確認します。「前」を選択して、変更を加えることができます。
    10. カスタム・モデルのトレーニングを開始する場合は、「作成およびトレーニング」を選択します。
  • モデルを作成するには、createコマンドと必要なパラメータを使用します:

    oci ai-document model create [OPTIONS]

    CLIコマンドのフラグおよび変数オプションの完全なリストは、CLIコマンドライン・リファレンスを参照してください。

  • CreateProject操作を実行してプロジェクトを作成します。

    CreateModel操作を実行してモデルを作成します。