類似度分析モデルの結果の解釈

データ・フローを実行して類似度分析を実行すると、Oracle Analyticsによって結果を含むデータセットが生成されます。

実行可能な操作は次のとおりです。
  • Oracle Analyticsデータ・ページで出力データセットを見つけます。データ・フローの「データの保存」ステップで指定した名前のデータセットを探します。データセットには、データ・フローの類似度分析ステップの「出力」セクションにリストされているものと同じ出力列が含まれます。

    類似度分析モデルによって生成されたデータセット列:

    • source_value - データ・フローでソース・オブジェクトとして選択された列内の単一の値を持つ列を返します。ベクトル距離は、この列内の他のすべての値に対してこの値で測定されます。
    • source_reference_column1 - 類似度分析のためにソース・レコードで選択されたレコードの参照列の選択された値(データ・フロー・ノード・プロパティで設定)を返します。この出力は、最も近いレコードまたは最も離れたレコードが検出されたソース・レコードがどれであるかを知るのに役立ちます。
    • results_reference_column1、2および3 - 類似度分析によって最も近いか最も離れていると識別されたレコードのそれぞれの参照列の値(データ・フロー・ノード・プロパティで設定)を返します。
    • distance - ソース値と結果レコードの間の計算された距離。つまり、source_reference_col1、source_reference_col2およびsource_reference_col3のデータと、result_reference1、result_reference2およびresult_reference3のデータがどの程度類似しているか、または異なるかということです。
    • profile_expression - 類似度分析モデルで使用されるすべての列を1つの文字列に連結した式。これらは、埋込みモデルによって値がベクトル化された列です。

      注:

      選択した属性列はプロファイル文字列の一部になります。一方、メトリック列のメジャーは、ベクトル内で適切に表されるよう、まず動的に低、中および高のビンに分類されます。
  • 類似度分析データ・フローによって生成された出力データセットに基づいてワークブックを作成します。
  • 結果を分析するビジュアライゼーションを作成します。次に例を示します。