機械翻訳について

ナレッジ・ベース

データ・マイニング用語で一般的にモデルと呼ばれるナレッジ・ベースは、データ・セットに存在する知識またはパターンのコンパクトな表現です。

Oracle Spend Classificationは、Support Vector Machineアルゴリズムを使用して構築された標準タイプのナレッジ・ベースを作成します。 ナレッジ・ベースはタクソノミに基づいて作成され、1つのタクソノミのみを使用してナレッジ・ベースを作成できます。 ナレッジ・ベースは、特定のデータ・マイニング・アルゴリズムを使用して構築されると、検査を通じてトレーニング・データ・セットに存在するナレッジまたはパターンを理解します。 分類中、ナレッジ・ベースはスコアリング・メソッドを使用して学習を適用し、予測を行います。 様々な分類アルゴリズム、データ・マイニングの操作および用語の詳細は、『Oracle Advanced Analytics』ガイドを参照してください。

ナレッジ・ベースの作成

ナレッジ・ベースを作成するには、次のステップに従います。

  1. 「構成」ページ「ナレッジ・ベース」タブ に移動し、「ナレッジ・ベースの作成」をクリックします。

  2. 「ナレッジ・ベースの作成」ダイアログ・ボックスで、ナレッジ・ベースの名前を指定します。
  3. ナレッジ・ベースのトレーニング・データとして使用する1つ以上のデータ・セットを選択します。
  4. このデータ・セット用に作成したタクソノミを選択します。
  5. フレーズ・ベースの学習を組み込む追加の分類属性を含む属性を選択します。

    分類プロセスでは、これらの属性の値は個別のキーワードとしてではなく文字列全体として扱われ、同じ列の他の値と比較されます。 たとえば、Vision Corporationは単一のフレーズとみなされ、他のサプライヤ名のみと比較されます。 Vision Collegeなどのサプライヤ名を持つ請求書は、このトレーニングに対する一致とは見なされません。

  6. 「作成」をクリックします。 ナレッジ・ベースの作成後、ステータスは完了に設定されます。

「ナレッジ・ベース」タブで、「構成」ページで作成したナレッジ・ベースを表示できます。 ナレッジ・ベースの作成後、ステータスは「完了」に設定されます。

ナレッジ・ベースの改善

次の理由で、ナレッジ・ベースを改善できます。

  • 分類の精度を高める: ナレッジ・ベースで一部のトランザクションが適切に分類されていないことがあります。意図したように、トランザクションを分類します。 さらなる分析で、ナレッジ・ベースでキーワードが正しく選択されていないか、いくつかのキーワードに誤った重要性が指定されていることがわかる場合があります。 このことは、ナレッジ・ベースのトレーニングに使用されるトランザクションが、ナレッジ・ベースでパターンを正しく識別するのに十分ではないことを示唆している可能性があります。
  • 新しいカテゴリをサポートする: 時間が経過すると、組織は、新しいカテゴリ・コードを使用して分類される可能性のある、いくつかの新しい商品またはサービスの調達を開始する場合があります。 これらのカテゴリ・コードは、以前のトレーニング・データ・セットに含まれていないため、ナレッジ・ベースでこのようなトランザクションが正確に分類されないことは明白です。

ナレッジ・ベースの改善プロセスを開始する前に、使用するデータ・セットを準備します。 適用可能なデータ・セットをダウンロードし、要件に従ってトランザクションを手動で修正、追加または削除し、データ・セットをアップロードします。 バッチの承認後、手動訂正を使用したデータ・セットの作成オプションを使用して、バッチで実行されたすべての訂正を収集し、トレーニング・データ・セットを作成します。 このトレーニング・データ・セットと元のトレーニング・データ・セットを使用して、ナレッジ・ベースを改善できます。

改善プロセスを開始するステップは次のとおりです。

  1. 「ナレッジ・ベース」ページで、ナレッジ・ベースのメニュー・アイコンをクリックし、「ナレッジ・ベースの改善」をクリックします。
  2. 「ナレッジ・ベースの改善」ダイアログ・ボックスで、そのナレッジ・ベースの作成に使用された元のデータ・セットが事前移入されます。 ナレッジ・ベースを改善するためにデータ・セットを追加または削除し、「改善」をクリックします。
    ノート: ナレッジ・ベースの改善は増分プロセスではなく、ナレッジ・ベースの完全リフレッシュです。 ナレッジ・ベースは、改善プロセスのために選択されるデータ・セットを使用して最初から構築されます。 そのため、元のトレーニング・セットを増分トレーニング・セットとともに使用します。
  3. フレーズ・ベースの学習を組み込む追加の分類属性を含む属性を選択します。

    分類プロセスでは、これらの属性の値は個別のキーワードとしてではなく文字列全体として扱われ、同じ列の他の値と比較されます。 たとえば、Vision Corporationは単一のフレーズとみなされ、他のサプライヤ名のみと比較されます。 Vision Collegeなどのサプライヤ名を持つ請求書は、このトレーニングに対する一致とは見なされません。

  4. 改善をクリックします。 ナレッジ・ベースのメニュー・アイコンで、アクティビティ・ログの表示をクリックして、ナレッジ・ベース改善プロセスの進捗を追跡します。

通常、ナレッジ・ベースの作成からナレッジ・ベースの改善までにはタイム・ラグがあります。 改善の頻度は要件によって異なります。