このトピックでは、2つのセンチメント分析モデルを新規のトレーニング・データで設定し更新する方法について説明します。
<lang>はサポートされている国コードです(en (イギリス/アメリカ英語)、fr (フランス語)、de (ドイツ語)、it (イタリア語)またはes (スペイン語))。
テキスト・ファイルには1行につき1文を配置します。モデルを使用する際に参照するデータのタイプの例に対して、センチメント・モデルをトレーニングする必要があります。たとえば、ツイートのセンチメントを決定しようとする場合、ツイート・レビュー・エントリの例を取得する必要があります。独自のデータを指定するか、または購入することができます。適切なモデルの場合、数千ではないとしても、少なくとも数百の例が必要になります。
/<root>/models/sentiment/<language>この場合の<language>は、1つ以上の前述の名前です。
/share/models/sentiment/american /share/models/sentiment/french
americanディレクトリにはen_pos.txtおよびen_neg.txtファイルが含まれ、一方、frenchディレクトリには、fr_pos.txtおよびfr_neg.txtファイルが含まれます。
センチメント分析モデルを更新するには、次の手順を実行します。
[2015/08/14 15:35:02 -0400] [web2014.example.com] Generating the sentiment model file using new model file...Success! [2015/08/14 15:35:55 -0400] [Admin Server] Publishing the sentiment model file... [2015/08/14 15:36:07 -0400] [Admin Server] Successfully published the model file.
この操作は、YARNワーカー・ノード上のセンチメント分析モデルの現在のJARを新規のもので置換します。
./bdd-admin.sh update-model sentiment
これにより、センチメント分析モデルが、当初の出荷バージョンに戻されます。