3.2 分類ユース・ケース
小売店には、顧客の行動と購入に関する情報があります。 利用可能なデータでは、最も収益性の高い製品の販売量が増加し、利益が増加するであろうターゲットとする顧客のタイプを分析および特定したいと考えています。 このユース・ケースでは、ランダム・フォレスト・アルゴリズムを使用してそのような顧客を識別する方法を示します。
関連コンテンツ
トピック | リンク |
---|---|
OML4Py GitHubの例 | 分類ランダム・フォレスト |
ランダム・フォレストについて | ランダム・フォレストについて |
ランダム・フォレスト | ランダム・フォレスト・アルゴリズム |
共有設定 | 共有設定 |
OML4Pyユース・ケース・ジャーニを開始する前に、次のものがあることを確認してください:
- データ・セット
このユースケースに使用されるデータ・セットは、SHスキーマからのものです。 SHスキーマは、Oracle Autonomous Databaseで簡単にアクセスできます。 オンプレミス・データベースの場合、スキーマはインストール時にインストールされるか、スクリプトをダウンロードして手動でインストールできます。 サンプル・スキーマのインストールを参照してください。
- データベース
次のオプションからデータベースを選択または作成します:
- 無償のクラウド・アカウントを取得します。 https://cloud.oracle.com/databaseにアクセスし、「Oracle Database Cloud Service (DBCS)」または「Oracle Autonomous Database」を選択します。 アカウントを作成してインスタンスを作成します。 Autonomous Databaseクイック・スタート・ワークショップを参照してください。
- Oracle Database (オンプレミス)の最新バージョンをダウンロードします。
- 機械学習ツール
データベースの選択内容に応じて、次のいずれかを実行します。
- Oracle Autonomous Database用のOML Notebooksを使用します。
- オンプレミス・データベースまたはDBCSに接続されたOracle SQL Developerをインストールして使用します。 SQL Developerのインストールおよび起動を参照してください。
- その他の要件
データ・マイニング権限(ADWに対して自動的に設定されます)。 Oracle Machine Learning for SQLのためのシステム権限を参照してください。
- データのロード
SHスキーマからデータ・セットにアクセスし、データを探索して属性を理解します。 - データの探索
データを探索して、データの品質を理解し、評価します。 このステージでは、データを評価してデータ内のデータ型およびノイズを識別します。 欠損値および数値外れ値を探します。 - モデルの構築
トレーニング・データ・セットを使用してモデルを構築します。oml.rf
関数を使用して、モデルを構築し、モデル設定を指定します。 - 評価
新しいデータでモデルを使用して予測を行う前に、まずモデルの精度を評価する必要があります。 様々なメソッドを使用してモデルを評価できます。
関連トピック
親トピック: ユースケース