データ・エンリッチメント・モジュール
この項では、データ・エンリッチメント・モジュールについて説明します。
データ・エンリッチメント・モジュールについて
データ・エンリッチメント・モジュールを使用すると、データのコンテンツ内の価値を発見することによってデータの利用性を向上させることができます。
エンティティ・エクストラクタ
エンティティ・エクストラクタは、テキスト内のアトミック要素を特定して事前定義済カテゴリに分類できます。
TF.IDF語エクストラクタ
このモジュールは、入力テキストからキーワードを抽出します。
センチメント分析(ドキュメント・レベル)
ドキュメント・レベルのセンチメント分析モジュールは、テキストの一部を分析し、テキストに正と負のどちらのセンチメントがあるかを確認します。
センチメント分析(サブドキュメント・レベル)
サブドキュメント・レベルのセンチメント分析モジュールは、正と負の2つのカテゴリのどちらかに分類されるセンチメントがある語句のリストを返します。
住所GeoTagger
住所GeoTaggerは、有効なグローバル・アドレスに関する地理情報を返します。
IPアドレスGeoTagger
IPアドレスGeoTaggerは、有効なIPアドレスに関する地理情報を返します。
リバースGeoTagger
リバースGeoTaggerは、大都市圏に解決される有効な地域コードの緯度/経度座標に関する地理情報を返します。
ボイラープレート削除
ボイラープレート削除モジュールは、Webページのメインのテキスト・コンテンツの周囲にある余分なもの(ボイラープレート、テンプレート)を検出して削除します。
タグ・ストリッパ
タグ・ストリッパ・モジュールは、入力テキストからHTML、XMLおよびXHTMLマークアップを削除します。
音声ハッシュ
音声ハッシュ・モジュールは、入力文字列のハッシュ値が含まれる文字列属性を返します。
言語検出
言語検出モジュールは、入力テキストの言語を検出できます。