エンティティ・エクストラクタは、テキスト内のアトミック要素を特定して事前定義済カテゴリに分類できます。
事前定義済カテゴリは、PERSON、ORGANIZATIONおよびLOCATIONです。つまり、入力テキストから人物、会社および場所の名前が抽出されます。
エンティティ・エクストラクタは、英語の入力テキストのみをサポートしています。
このモジュールは、データ処理ワークフローのサンプリング・フェーズ中は実行されません。
このモジュールは、データ処理ワークフロー中は実行されません。
While in New York City, Jim Davis bought 300 shares of Acme Corporation in 2012.
出力は次のようになります。
location: New York City organization: Acme Corporation person: Jim Davis