17.1 センチメント分析の概要

センチメント分析では、トレーニングされたセンチメント分類子を使用してドキュメントまたはドキュメント内のトピックに関するセンチメント情報を提供します。

この項では、次の項目について説明します。

17.1.1 センチメント分析について

Oracle Textでは、センチメント・メタデータを識別するようトレーニングされたセンチメント分類子を使用してトピックまたはドキュメントのセンチメント分析を実行できます。

データ量の拡大に伴い、組織は単に検索問合せに応答したヒットを得るだけでなく、データに関するより多くの知見を得る必要があります。知見は、特定の基本的なタイプの問合せ(天候の問合せや最近のイベントに関する問合せなど)に回答する、ユーザー指定のトピックに関する意見を提供するなどの形式になることがあります。キーワード検索では、検索語を含む結果のリストが示されます。ただし、検索語に関連するセンチメントまたは意見を識別するには、結果を参照して必要なセンチメント情報を手動で見つけ出す必要があります。センチメント分析では、1ステップのプロセスでドキュメント・セット内のセンチメント情報を識別できます。

センチメント分析は、指定されたトピックに関連するセンチメント・メタデータまたはドキュメントのセットからエンティティを識別、抽出するプロセスです。トレーニングされたセンチメント分類子がセンチメントを識別します。検索結果に加えて、センチメント分析を使用して問合せを実行すると、センチメント・メタデータも識別および表示されます。センチメント分析では、"製品レビューは肯定的かどうか"や"顧客は満足しているかどうか"などの質問に対する回答が提供されます。たとえば、特定の製品に関する複数のレビューで構成されるドキュメント・セットから、製品の良し悪しを示す全体的なセンチメントを判断できます。

17.1.2 センチメント分類子について

センチメント分類子は、トピックまたはドキュメントに関連するセンチメント・メタデータを抽出するために使用される一種のドキュメント分類子です。

センチメント分類子を使用してセンチメント分析を実行するには、最初にセンチメント分類子プリファレンスをセンチメント分類子と関連付けた後に、センチメント分類子をトレーニングします。

ユーザー定義のセンチメント分類子をSENTIMENT_CLASSIFIER型のセンチメント分類子プリファレンスに関連付けることができます。センチメント分類子プリファレンスでは、センチメント分類子をトレーニングするために使用されるパラメータを指定します。これらのパラメータは、センチメント分類子プリファレンスの属性として定義されます。センチメント分類子プリファレンスを作成するか、デフォルトのCTXSYS.DEFAULT_SENTIMENT_CLASSIFIER.を使用できますユーザー定義のセンチメント分類子プリファレンスを作成するには、CTX_DDL.CREATE_PREFERENCEプロシージャを使用してセンチメント分類子プリファレンスを定義し、CTX_DDL.SET_ATTRIBUTEプロシージャを使用してそのパラメータを定義します。

センチメント分類子をトレーニングするには、関連付けられているセンチメント分類子プリファレンス、ドキュメントのトレーニング・セットおよびセントメント・カテゴリを提供する必要があります。分類子プリファレンスを指定しない場合、Oracle Textではトレーニング・パラメータのデフォルト値が使用されます。センチメント分類子をトレーニングするには、サンプル・ドキュメントと指定されたプリファレンスのセットを使用します。カテゴリに各サンプル・ドキュメントを割り当てます。Oracle Textでは、このセンチメント分類子を使用して、センチメント分析を実行する方法を定義する一連の分類ルールを推定します。CTX_CLS.SA_TRAINプロシージャを使用して、センチメント分類子をトレーニングします。

通常、財務、製品レビュー、音楽など、ドキュメントのカテゴリごとに個別のセンチメント分類子を定義およびトレーニングします。独自のセンチメント分類子を作成しない場合、または分類子をトレーニングする適切なトレーニング・データが使用できない場合は、Oracle Textで提供されるデフォルトのセンチメント分類子データを使用できます。デフォルトのセンチメント分類子は教師なしです。

ノート:

デフォルトのセンチメント分類子はAUTO_LEXER.でのみ機能しますAUTO_LEXERは、ユーザー定義のセンチメント分類子とともに使用しないでください。

17.1.3 センチメント分析の実行について

センチメント分析を実行するには、センチメント情報の識別に使用する必要があるセンチメント分類子を含むセンチメント問合せを実行します。分類子はデフォルトまたはユーザー定義のセンチメント分類子にすることができます。

センチメント分析は、検索操作の一部としてのみ実行できます。Oracle Textでは、指定されたキーワードが検索されて、結果セットが生成されます。次に、結果セットでセンチメント分析が実行されて、各結果のセンチメントが特定されます。問合せでセンチメント分類子を明示的に指定しない場合、デフォルトの分類子が使用されます。

ドキュメント全体に対して単一センチメントを識別するか、ドキュメント内の各トピックに対して個別のセンチメントを識別できます。最もよくあるのは、1つのドキュメントに複数のトピックが含まれ、各トピックに対する作成者のセンチメントが異なる場合です。このような場合、ドキュメント・レベルのセンチメント・スコアは、ドキュメント内の各トピックに関連付けられているセンチメントを識別できないため有用でない可能性があります。トピック・レベルでセンチメント・スコアを識別すると、必要な回答が得られます。たとえば、カメラのレビューを含むドキュメントのセットを検索すると、ドキュメント・レベルのセンチメントによってカメラがよい製品かどうかわかります。カメラの写真品質に関する一般的な意見が必要であるとします。トピックの1つに"写真品質"を使用してトピック・レベルのセンチメント分析を実行すると、必要な情報が提供されます。

ノート:

センチメント分析の関連トピックを指定しない場合、Oracle Textはドキュメント全体に対して全体的なセンチメントを返します。

17.1.4 センチメント分析インタフェース

Oracle Textは、センチメント分析を実行するための複数のインタフェースをサポートします。

次のインタフェースのいずれかを使用して、センチメントの問合せを実行します。

  • CTX_DOCパッケージのプロシージャ

  • XML問合せの結果セット・インタフェース(RSI)