データ・エンリッチメント・モジュール
この項では、Big Data Discoveryのデータ・エンリッチメント・モジュールについて説明します。
データ・エンリッチメント・モジュールについて
データ・エンリッチメント・モジュールを使用すると、データのコンテンツ内の価値を発見することによってデータの利用性を向上させることができます。
エンティティ・エクストラクタ
エンティティ・エクストラクタ・モジュールは、人物、会社および場所の名前をソース・データのレコード内部の入力テキストから抽出します。
名詞グループ・エクストラクタ
このプラグインは、入力テキストから名詞グループを抽出します。
TF.IDF語エクストラクタ
このモジュールは、入力テキストからキーワードを抽出します。
センチメント分析(ドキュメント・レベル)
ドキュメント・レベルのセンチメント分析モジュールは、テキストの一部を分析し、テキストに正と負のどちらのセンチメントがあるかを確認します。
センチメント分析(サブドキュメント・レベル)
サブドキュメント・レベルのセンチメント分析モジュールは、正と負の2つのカテゴリのどちらかに分類されるセンチメントがある語句のリストを返します。
住所GeoTagger
住所GeoTaggerは、有効なグローバル・アドレスに関する地理情報を返します。
IPアドレスGeoTagger
IPアドレスGeoTaggerは、有効なIPアドレスに関する地理情報を返します。
リバースGeoTagger
リバースGeoTaggerは、大都市圏に解決される有効な地域コードの緯度/経度座標に関する地理情報を返します。
タグ・ストリッパ
タグ・ストリッパ・モジュールは、入力テキストからHTML、XMLおよびXHTMLマークアップを削除します。
音声ハッシュ
音声ハッシュ・モジュールは、入力文字列のハッシュ値が含まれる文字列属性を返します。
言語検出
言語検出モジュールは、入力テキストの言語を検出できます。
モデルの更新
データ・エンリッチメント・モジュールで使用される3つのモデルを更新できます。