プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Serviceデータ処理ガイド
E65369-05
目次
索引
前
次
機械翻訳について
7
データ・エンリッチメント・モジュール
この項では、Big Data Discoveryのデータ・エンリッチメント・モジュールについて説明します。
「
データ・エンリッチメント・モジュールについて
」
データ・エンリッチメント・モジュールでは、コンテンツの値を検出することでデータのユーザビリティが向上します。
「
エンティティ・エクストラクタ
」
エンティティ抽出モジュールでは、個人、会社および場所の名前をソース・データのレコード内の入力テキストから抽出します。
「
名詞グループ・エクストラクタ
」
このプラグインは、入力テキストから名詞グループを抽出します。
「
TF.IDF用語エクストラクタ
」
このモジュールは、入力テキストからキーワードを抽出します。
「
センチメント分析(ドキュメント・レベル)
」
ドキュメント・レベルのセンチメント分析モジュールでは、テキストを分析し、テキストにポジティブまたはネガティブなセンチメントがあるかどうかを判別します。
「
センチメント分析(サブ・ドキュメント・レベル)
」
サブ・ドキュメント・レベルのセンチメント分析モジュールでは、2つのカテゴリ(ポジティブまたはネガティブ)のいずれかに該当するパッチ検索語句のリストが返されます。
Address GeoTagger
Address GeoTaggerは、有効なグローバル・アドレスに関する地理的情報を返します。
「
IPアドレスGeoTagger
」
IPアドレスGeoTaggerは、有効なIPアドレスに関する地理的情報を返します。
「
GeoTaggerのリバース
」
リバースGeoTaggerは、メトロポリタン地域に解決される有効なジオコードの緯度/経度座標の地理情報を返します。
「
タグ・ストライプ数
」
タグ・ストライプ/モジュールは、HTML、XMLおよびXHTMLマークアップを入力テキストから削除します。
「
音声ハッシュ
」
音声ハッシュ・モジュールは、入力文字列のハッシュ値を含む文字列属性を返します。
「
言語の検出
」
言語検出モジュールでは、入力テキストの言語を検出できます。