抽出する語やフレーズが正確にわかっている場合は、「ホワイトリストのタグ付け」変換を使用してそれらを抽出できます。ホワイトリストのタグ付けでは、検索する語のリストを指定します。
リストの各行は単一のタグ付けアクションを表しています。
使用可能なタグ付けアクションのタイプは次のとおりです。
| タグ付けアクション | 構文 | 例 |
|---|---|---|
| 1つの語の抽出 |
sensor sensorという語が見つかると、出力属性に追加されます。 |
|
| 語が含まれる単語、文または段落全体の抽出 | 語の後にタブを入力し、次のいずれかを指定します。
|
Stanford<tab>$$ Stanfordという語が見つかると、その語が検出された文が出力属性に追加されます。 |
| 選択した語(1つまたは複数)の別の語での置換。
たとえば、1つの語の変化形を、標準化した1つの値で置換することができます。 あるいは、タグ付けを使用して一般的な語を指定することができます。 |
複数の語を区切るにはカンマを使用します。
語のリストの後にタブを入力してから、置換する語を入力します。 |
A7, A7s, A7r<tab>Sony 指定された語のいずれかが検出された場合、Sonyという語が出力属性に追加されます。 |
指定されたホワイトリストに基づいて情報を抽出するには、次の手順を実行します。