属性値からのフレーズの抽出

「フレーズ抽出」変換は属性値からフレーズを抽出します。「フレーズ抽出」では、抽出するフレーズの識別方法を選択します。

属性の値からフレーズを抽出するには、次の手順を実行します。

  1. 「変換」を選択します。
  2. フレーズを抽出する属性を見つけます。
  3. 属性メニューの「拡張変換」「テキスト・エンリッチメント」「フレーズ抽出」を選択します。
  4. 構成パネルの「タイプ」ドロップダウン・リストで、実行する抽出のタイプを選択します。

    オプションは次のとおりです。

    「フレーズ抽出」変換の使用可能な抽出タイプのリスト。タイプごとに説明が表に示されます。
    抽出タイプ 説明
    キー・フレーズ抽出 このオプションでは、様々な方法を使用し、属性値に関して最も顕著なフレーズを識別して抽出します。
    キー・フレーズ抽出では、次の項目を構成できます。
    • 値から返すフレーズの最大数
    • フレーズの最小語数
    • フレーズの最大語数
    • 含めるフレーズを選択する際の必要な信頼水準
    TF/IDF抽出 このオプションは、TF/IDFを使用し、属性値の最も関連性の高いフレーズを判別して抽出します。
    TF/IDF抽出では、次の項目を構成できます。
    • 値から返すフレーズの最大数
    • フレーズの最小語数
    • フレーズの最大語数