このトピックでは、TF.IDFモデルを新規のトレーニング・データで設定し更新する方法について説明します。
/share/models/tfidf/en_abstracts.zip
次の手順は、コーパスZIPファイルをダウンロード済で、それをen__abstracts.zipに名前変更済であることを前提としています。
TF.IDFモデルを更新するには、次の手順を実行します。
[2015/08/17 11:21:42 -0400] [web2014.example.com] Generating the tfidf model file using new model file...Success! [2015/08/17 11:24:45 -0400] [Admin Server] Publishing the tfidf model file... [2015/08/17 11:24:57 -0400] [Admin Server] Successfully published the model file.
この操作は、YARNワーカー・ノード上のTF.IDFモデルの現在のJARを新規のもので置換します。
./bdd-admin.sh update-model tfidf
これにより、TF.IDFモデルが、当初の出荷バージョンに戻されます。