データ・エンリッチメント・モデルの更新

一部のデータ・エンリッチメント・モジュールには、定期的に更新する必要があるモデルがあります。bdd-adminスクリプトをupdate-modelコマンドとともに実行することによって、これを行うことができます。

注意: このコマンドは、「bdd-adminスクリプトについて」で説明されているコンポーネント引数やオプション引数のいずれもサポートしていません。
次のコマンドを管理サーバーから実行します。
./bdd-admin.sh update-model <model_type> args
次のモデル・タイプのいずれかを指定する必要があります。
  • geonamesは、GeoTaggerデータ・エンリッチメント・モジュールのモデルを更新します。
  • tfidfは、TF.IDFデータ・エンリッチメント・モジュールのモデルを更新します。
  • sentimentは、Sentiment Analysisデータ・エンリッチメント・モジュールのモデルを更新します。
次の引数のいずれかを指定する必要もあります。
  • <input_dir>は、特定のディレクトリからのデータを持つ指定されたモデルを更新します。スクリプトでは、ディレクトリ内のファイルを使用して、新しいデータ・エンリッチメントjarファイルを生成し、そのファイルをクラスタ内のすべてのSparkノードにコピーします。
  • --resetは、モデルに行われたすべての変更を元に戻し、モデルを元の状態にリセットします。スクリプトでは、クラスタ内のすべてのSparkノード上でこれを行います。

データ・エンリッチメントの詳細情報は、データ処理ガイドで入手できます。

次のコマンドは、特定のディレクトリからのデータを持つgeonamesモデルを更新します。
./bdd-admin.sh update-model geonames <dir_name>
次のコマンドは、sentimentモデルを元の状態にリセットします。
./bdd-admin.sh update-model sentiment --reset