35.7 変換について
自動データ準備(ADP)および組込み変換を使用したデータの変換方法について理解します。
変換とは、1つ以上の列のデータを変更するSQL式のことです。データを使用してモデルを作成するには、通常、事前にそれらのデータに特定の変換を行う必要があります。多くのOracle Machine Learningのアルゴリズムに特定の変換要件があります。スコアリングされるデータは、トレーニング・データが変換されたのと同じ方法で事前に変換される必要があります。
Oracle Machine Learning for SQLは、アルゴリズムで必要とされる変換を自動的に実装するADPをサポートしています。変換は、モデルに組み込まれ、モデルが適用されるたびに自動的に実行されます。
追加の変換が必要な場合は、それらの変換をSQL式として指定し、モデルの作成時に入力として提供することができます。これらの変換は、ADPを使用する場合と同じようにモデルに組み込まれます。
自動の組込みデータ変換を使用すると、データ準備のほとんどの作業が自動的に処理されます。モデルの作成と複数のデータ・セットのスコアリングを、次の少ないステップで実行できます。
-
ケース表に含める列を特定します。
-
ネストした列を作成します(トランザクショナル・データを含める場合)。
-
ADPで処理されない変換のSQL式を記述します。
-
モデルを作成し、SQL式を提供し(指定する場合)、テキスト・データを含む列を特定します。
-
スコアリング・データの一部またはすべての列が、モデルのトレーニングに使用された列と同じ名前と型を持つことを確認します。
関連項目:
OMLは、アルゴリズム固有の自動データ準備と、その他のモデル構築関連機能を提供します。関連トピック