OCI Document Understandingモデルによる分析対象のドキュメントの作成
OCIオブジェクト・ストレージのバケットを使用して、分析するドキュメントを格納し、Oracle Analyticsでこれらのドキュメントにアクセスするためのデータセットを作成します。
通常、入力ドキュメントとAIモデルは同じOracle Cloudアカウント(テナンシ)に格納され、これにより、Oracle Analyticsの設定が容易になります。
入力ドキュメントとAIモデルが異なるテナンシに格納されている場合:
- 入力ドキュメントを含むストレージ・バケットの可視性がパブリックであることを確認してください。バケットの可視性の変更を参照してください。
- ドキュメントが格納されているOCIバケットの単一URLではなく、個々のドキュメントURLをデータ・フローの入力データセットに移入します。
Oracle Analyticsデータ・フローは、事前トレーニング済モデルの場合は最大10,000、カスタム・モデルの場合は最大2,000のドキュメントを1回の実行で処理できます。1回の実行で処理できる最大数を超えるドキュメントがある場合、OCIのオブジェクト・ストレージおよびアーカイブ・ストレージで、それぞれに最大数を超えないドキュメントを含む複数のバケットを作成します。次に、バケットごとに個別のデータセットおよびデータ・フローを作成し、シーケンスを使用してデータ・フローを順番に処理します。
OCIユーザーがアクセスでき、ドキュメントに関するOCIの一般的な制限事項に準拠しているプライベートまたはパブリック・バケットを使用できます。OCIのドキュメントを参照してください。