3.2 クラスタリング・ユース・ケース
小売店には、顧客の行動と購入に関する情報があります。 そのデータを使用して、同様の特性を持つ顧客のグループがあるかどうかを分析および識別します。 Oracle Machine Learningを使用して、ターゲットを絞ったマーケティング・キャンペーンのサポートに使用して小売売上を増やすことができるデータ・セット内のクラスタを検索することで、顧客をセグメント化します。 このユース・ケースでは、k-Meansアルゴリズムを使用してそのようなセグメントを識別する方法を学習します。
データの理解
データを理解するには、次のタスクを実行します:
- データへのアクセス
- データの探索
- データのロード
SHスキーマからデータ・セットにアクセスし、データを探索して属性を理解します。 - データの探索
データにアクセスできるようになったら、データを探索してデータの品質を理解し、評価します。 このステージでは、データを評価してデータ内のデータ型およびノイズを識別します。 欠損値および数値外れ値を探します。 - モデルの構築
モデルのパフォーマンスを評価するには、データをトレーニング・セットとテスト・セットに分割することが一般的です。 これにより、モデルがどの程度一般化して見えないデータを評価できます。 ただし、クラスタリングなどの教師なし学習では、精度を計算したりパフォーマンスを評価するために使用できるラベルや予測子はありません。 その結果、データセット全体を使用して、モデルを分割しなくてもモデルを構築できます。 結果を比較する根拠がないので、トレーニングとテストの分割は適用されず、教師なし学習には有用でもありません。 - モデルのデプロイ
次に、OML4Rモデルをデプロイし、そのインサイトを活用するためのいくつかのアプローチを示します:
親トピック: ユースケース