分類ジョブの構成
分類ジョブを作成して、文書の受信時に言語および文書の分類を自動的に検出できます。 分類ジョブがコミットされた後、アセット言語はOracle Content Managementで設定されます。 結果を使用して適切なカスタム・デジタル・アセットを作成し、適切な言語をソース・アセットに割り当てることができます。
ノート:
2023年2月中旬より前にOracle Content Managementインスタンスが作成された場合は、高度なContent Capture機能を使用するために必要な「OCIサービスのコンテンツ共有」デプロイメント・オプションを有効にする必要があります。 詳細は、「Oracle Content Managementの管理」の「Oracle Content Managementインスタンスの編集」を参照してください。- 左側のプロシージャ・ペインで、プロシージャを選択します。
選択したプロシージャの構成ページが右側に表示されます。
- 「処理」タブを開きます。
-
「分類ジョブ」表で
をクリックするか、既存のジョブを編集するには、
をクリックします。
また、分類ジョブを選択して
をクリックし、プロンプトが表示されたら新しい名前を入力して、分類ジョブをコピーすることもできます。 ジョブのコピーにより、すばやく複製し変更できます。
-
「ドキュメントの選択」ページで:
- 「ジョブ詳細」セクションで:
-
ジョブの名前と説明を入力します。
- 「オンライン」チェック・ボックスを選択して、処理に使用できるようにします。
- 「言語検出」および「文書分類」アクションを選択します。 「アクション」は必須フィールドです。 続行するには、2つのアクションのいずれかを選択する必要があります。 ただし、効率を上げるために、言語検出およびドキュメント分類を自動化するジョブを1つ作成することをお薦めします。
-
- 「ドキュメント処理」セクション:
- 前のステップで行った選択肢に適用可能な場合は、「プロセス文書」チェック・ボックスを選択します。
-
特定の文書プロファイルの分類ジョブを処理するには、「文書プロファイルに限定」フィールドにリストされている1つ以上の文書プロファイルを選択するか、「すべて」を選択してすべての定義済文書プロファイルの文書を処理します。 何も選択しないことは、「すべて」と同等です。
- 「ジョブ詳細」セクションのドキュメント分類アクション・チェック・ボックスを選択した場合は、「添付処理」セクションが有効になります:
- 前のステップで行った選択に適用可能であれば、「添付の処理」チェック・ボックスを選択します。 このオプションは、Content Captureクライアントから受信した添付の自動言語検出および自動分類を利用します。
- 使用可能な添付タイプにチェック・ボックスを選択して、必要な添付タイプに制限します。 これらのすべての選択することもできます。
- 「ジョブ詳細」セクションで:
- 「ドキュメントの選択」ページの「ジョブ詳細」セクションで言語検出アクションを選択した場合、「言語検出」ページが有効になります:
- プライマリ言語の選択は必須です。 「プライマリ言語」ドロップダウン・リストから必要な言語を選択します。 プライマリ言語では、ドキュメントの最大加重が使用されます。 これは、ドキュメントで最も目立つ言語でもあります。
- 「最小しきい値」バーをドラッグして、最小しきい値を設定します。 少なくともゼロになるため、しきい値の設定は必須ではありません。 最小しきい値はプライマリ言語に関連付けられます。 しきい値は、この値を超える言語がない場合、「プライマリ言語」フィールドは空白のままであることを示します。
- 「ドキュメントの言語」ドロップダウン・リストから必要な言語を選択します。 ドキュメントには複数の言語を使用できます。
- 「ドキュメントの選択」ページの「ジョブ詳細」セクションでドキュメント分類アクションを選択した場合、「文書分類」ページが有効になります。 このページで、次の操作を実行します。
- 「文書分類」セクション:
- 必要に応じて、「文書プロファイル・マッピング」セクションにドキュメント理解によってすぐに分類タイプを定義します。
- 分類タイプの信頼度スコアを示す最小しきい値を設定します。 このスコアは、すべての分類タイプに適用されます。 最小しきい値がマッピングに適用されます。 このしきい値を満たし、マップされたドキュメント・プロファイルを割り当てる必要があります。
ただし、これは、値が最も高い分類タイプにも関連します。 たとえば、文書理解によって、最も高い値を持つ請求書のタイプを指定できます。 マップ済でしきい値を超えると、文書プロファイルが割り当てられます。 一致がない場合やしきい値が満たされていない場合は、デフォルトの文書プロファイルが使用されます。
- 「添付分類」セクションで、次の操作を実行
- 必要に応じて、「添付タイプ・マッピング」セクションにドキュメント理解によってすぐに分類タイプを定義します。
- 分類タイプの信頼度スコアを示す最小しきい値を設定します。 このスコアは、すべての分類タイプに適用されます。 最小しきい値がマッピングに適用されます。 このしきい値が満たされ、マップされた添付タイプが割り当てられている必要があります。 ただし、これは、値が最も高い分類タイプにも関連します。 一致がない場合、またはしきい値が満たされていない場合は、デフォルトの添付タイプが使用されます。
- 「文書分類」セクション:
-
Post-Processingページで、分類ジョブの完了後に行われる処理に基づいて指定します:
- システム・エラーなしの状況は、前のページのすべての基準が満たされた場合です。 成功した変換はコミットに進むことができます。
- システム・エラーとは、レコードが見つからない、見つかったレコードが多すぎるなど、変換が失敗した場合のことです。 失敗した変換の場合、バッチは修復のためにコンテンツ・キャプチャ・クライアントに戻ります。
-
「サマリー」ページの設定を確認し、「送信」をクリックしてジョブを保存します。
-
バッチが分類ジョブにどのようにフローするかを構成します。 「分類ジョブへのバッチ・フローの構成」を参照してください。
-
作成した分類ジョブをテストします。
分類ジョブへのバッチ・フローの構成
分類ジョブの非アクティブ化または削除
分類ジョブを削除すると、このジョブが後処理ステップとして設定されているバッチには使用できなくなります。 後処理に指定されたジョブが使用できない場合は、バッチにエラーが発生します。 ジョブを削除する前にしばらくの間オフラインに変更して、その削除に伴う予期しない問題を解決できるようにしておくのが望ましい場合もあります。 オンライン分類ジョブは、クライアント・プロファイルまたはプロセッサ・ジョブの後処理ページで選択されている場合に実行されます。 ジョブを一時的に停止(オフラインに)したり、非アクティブ化されたジョブを再実行するように変更することができます。 バッチ処理ジョブは、別のバッチ・プロセッサで後処理ジョブとして構成されている場合は削除できません。