属性から抽出するテキストのホワイトリストの指定

抽出する語やフレーズが正確にわかっている場合は、「ホワイトリストのタグ付け」変換を使用してそれらを抽出できます。ホワイトリストのタグ付けでは、検索する語のリストを指定します。

リストの各行は単一のタグ付けアクションを表しています。

使用可能なタグ付けアクションのタイプは次のとおりです。

タグ付けアクションのタイプ。タグ付けアクションごとに、使用される構文と例が表に示されます。
タグ付けアクション 構文
1つの語の抽出
sensor

sensorという語が見つかると、出力属性に追加されます。

語が含まれる単語、文または段落全体の抽出 語の後にタブを入力し、次のいずれかを指定します。
  • $: 単語全体の抽出
  • $$: 文全体の抽出
  • $$$: 段落全体の抽出
Stanford<tab>$$

Stanfordという語が見つかると、その語が検出された文が出力属性に追加されます。

選択した語(1つまたは複数)の別の語での置換。

たとえば、1つの語の変化形を、標準化した1つの値で置換することができます。

あるいは、タグ付けを使用して一般的な語を指定することができます。

複数の語を区切るにはカンマを使用します。

語のリストの後にタブを入力してから、置換する語を入力します。

A7, A7s, A7r<tab>Sony

指定された語のいずれかが検出された場合、Sonyという語が出力属性に追加されます。

指定されたホワイトリストに基づいて情報を抽出するには、次の手順を実行します。

  1. 「ホワイトリストのタグ付け」変換を選択するには、属性メニューの「拡張変換」「テキスト・エンリッチメント」「ホワイトリストのタグ付け」を選択します。
  2. リストと大/小文字表記が同じ語のみを照合するには、構成パネルで「大文字/小文字を区別した一致」チェック・ボックスを選択します。
  3. タグ付けアクションを含むファイルをアップロードするには、次の手順を実行します。
    1. 「改行区切りファイルのアップロード」ラジオ・ボタンをクリックします。
    2. ファイルを検索して選択するには、「参照」をクリックします。
  4. タグ付けアクションを手動で入力するには、次の手順を実行します。
    1. 「語の入力」ラジオ・ボタンをクリックします。
    2. テキスト領域に、タグ付けアクションを入力します。アクションは1行に1つずつ入力してください。