データ・フローを使用してベクトル埋込みモデルをデータセットに適用し、特定のレコードに類似したレコードを識別する類似度分析を実行します。
- 「ホーム」ページで、「作成」をクリックしてから、「データ・フロー」をクリックします。
- 「データの追加」で、分析するデータを含むデータセットを選択し、「追加」をクリックします。
データセットは、Oracle DatabaseまたはOracle Autonomous Data Warehouseに基づいている必要があります。
- 右側の列のリストで、分析する列を選択します。 一意のIDを持つ列を含める必要があります。
- データ・ステップの横にある「ステップを追加」をクリックし、「類似性分析」をクリックします。
- 使用するモデルを選択し、OKをクリックします。
- 「出力」セクションを展開し、Profile_expressionを選択します。
これにより、選択したすべてのデータの連結された出力列が追加されます。
- 「パラメータ」セクションを展開します。
- パラメータを構成します。
- 「ソース」 - 「値の選択」をクリックし、データ列および値を選択して、データセット内の他のレコードと比較するレコードを一意に識別します。 たとえば、IDを指定して、IDが"100002"の患者を選択できます。
- 最上位(最も近い)または最下位(最も離れた) - 最も類似したレコードを検索する場合は「最上位」を選択し、最も類似していないレコードを検索する場合は「最下位」を選択します。
- 結果数 - 返す一致レコードの数を指定します。 たとえば、「100」を選択すると、ターゲット・レコードに最も近い一致レコードの上位100件を検索します。
- (Optional) 「参照Column1、2および3」 - 「ソース」値を比較するレコードを一意に識別する列または列の組合せを指定します。 たとえば、医療患者の場合は、「ID」、「年齢」および「薬剤」を選択できます。 参照列での選択は必須ではありません。
- 「プロファイリングの参照列を含める」 - 「参照Column1、2および3」で指定された参照列をプロファイリングから除外する場合は「いいえ」を選択し、プロファイリングに含める場合は「はい」を選択します。
- ダイアグラムの「類似性分析」ノードの横にある+をクリックし、「ステップの追加」をクリックして「データを保存」を選択します。
- 「データの保存」ステップを構成します:
- データセット - デフォルト値をよりわかりやすい名前に変更します。 たとえば、「類似度分析上位10」です。
- 表 - デフォルト値を変更しないでください。 Oracle Analyticsでは、指定されたデータセット名に基づいてデータ・フローが実行されると、新しい値が作成されます。
- (オプション)デフォルト集計 - デフォルトの集計を変更します。 たとえば、これを「平均」に変更できます。
- 「モデルの保存」をクリックし、生成された予測モデルの名前を指定します。
- 「保存」をクリックし、データ・フローの名前を指定します。
- 「実行」をクリックして、データを分析し、予測モデルを生成します。
Oracle Analyticsによって生成されるデータセットは、「データ」ページの「データセット」タブで確認できます。 「類似性分析モデルの結果の解釈」を参照してください。