Oracle Data Mining概要ガイドのこのリリースでの変更点

Oracle Data Mining概要のこのリリースでの変更点。

Oracle Data Mining 18cでの変更点

Oracle Data Mining概要 18cでは、次の変更点について説明しています。

新機能

このリリースの新機能は次のとおりです。

新しいマイニング機能

時系列

時系列分析は、過去の履歴に基づいて将来の値の予測を提供します。たとえば、過去の一連の売上高に基づいた販売予測などです。  予測は、企業や政府の意思決定の重要な要素です。

時系列を参照してください。

新しいアルゴリズム

  • ランダム・フォレスト

    ランダム・フォレストは、強力な機械学習アルゴリズムです。特徴をランダムに選択して作成したツリーを複数個組み合せるアンサンブル法を使用します。実際には、個々のツリーはランダムなサブスペースで作成され、バギング・アンサンブル法を使用して組合せられます。

    ランダム・フォレストは、ごく一般的なアルゴリズムであり、多くのベンチマークで優れたパフォーマンスを発揮します。Oracle R Enterprise(ORE)の一部ではありますが、実装はRの公開パッケージに基づいています。カーネル・コードとして実装することで、パフォーマンスとスケーラビリティに大きなメリットをもたらします。

    ランダム・フォレストを参照してください。

  • 分類をサポートする明示的セマンティック分析機械学習アルゴリズムの拡張

    明示的セマンティック分析(ESA)は、FEATURE_EXTRACTION下に限ったトピック・モデルとして、Oracle Database 12cリリース2で公開されています。これは通常、何十万もの明示的機能を使用します。このアルゴリズムは、何十万ものクラスを持つユースケースの処理に簡単に適応させることができます。現在のOracle Advanced Analytics(OAA)アルゴリズムでは、分類についての困難な課題があるために、この処理が適切に行われません。

    ビッグ・データの観点では、大規模なテキスト分類というタスクは非常に重要です。ESAを分類に拡張することで、テキスト分類分野のオファリングが大幅に強化され、現在OAAでは対処できないユースケースもOAAで対処できるようになります。

    明示的セマンティック分析を参照してください。

  • ニューラル・ネットワーク

    ニューラル・ネットワーク・アルゴリズムは生物学にヒントを得た手法であり、相互接続されたユニット(ニューロン)の集合が関数を近似することを学習します。ニューラル・ネットワークは、分類および回帰の両問題での非線形近似に適しています。

    ニューラル・ネットワークは、任意の非線形関数を学習できる強力なアルゴリズムです。非線形回帰や時系列、コンピュータ・ビジョン、音声認識など、数々の難問でうまく使用されています。

    ニューラル・ネットワークを参照してください。

  • 属性および行の評価のためのCUR分解ベースのアルゴリズム

    CURアルゴリズムを使用すると、ユーザーは自分のデータについて最もよく説明している列や特徴を見つけることができます。このアルゴリズムは、ユーザーが理解しやすい用語を使用してデータの洞察を得ることができるため、人気を得ています。対照的に、特異値分解(SVD)のような分解法は、解釈の難しい暗黙的な特徴を導出します。CURは、SVDから導出された洞察を、元の行と列の用語に変換して使用しようとします。

    CURベースの属性および行の評価を使用すると、データの洞察を得ることができる他、さらなる分析処理を行うためのデータ・フィルタも提供されます。これは、重要な列だけでなく重要な行も選び出す、Oracle Advanced Analytics(OAA)の最初のアルゴリズムとなります。

    CUR行列分解を参照してください。

  • 指数平滑法

    指数平滑法(ESM)を使用すると、ユーザーが時系列データから予測を作成できるようになります。指数平滑法(ESM)は、時系列データからの予測に幅広く使用されています。ESMは当初、ARIMAなどの競合する手法と比べて柔軟性や精度が低いと考えられていましたが、最近では、より広範な種類のモデルを取り扱うことがわかっており、記述的リアリズムと記述的精度の両方を向上するよう拡張されています。Oracle ESMには、このような多数の最新拡張機能、よく使用されるHolt(傾向)モデルやHolt-Winters(傾向と季節性)モデルなど合計14個のモデル、および不規則な時系列間隔を処理する機能が含まれています。

    指数平滑法を参照してください。

アルゴリズムの拡張

  • アルゴリズムのメタデータの登録

    アルゴリズムのメタデータの登録は、R拡張性フレームワークでの新しいアルゴリズムの統合を簡略化および合理化します。この機能により、新しいアルゴリズム関数とその設定を、統一性と一貫性のある方法で登録できるようになります。

    拡張フレームワークでの新しいアルゴリズムの統合が簡略化されます。そのような新しいアルゴリズムをGUIでシームレスに取得し、サポートできるようになります。

    アルゴリズムのメタデータの登録についてを参照してください。

  • 交互方向乗数法(ADMM)

    一般化線形モデル(GLM)の新しい分散ソルバーである交互方向乗数法(ADMM)が導入されました。

    GLMソルバーを参照してください。

  • 相関ルールのサンプリング

    相関ルール用に新しい特別なサンプリング方法が導入されました。

    サンプリングの向上を参照してください。

新しい管理タスク

シリアル化されたモデルのIMPORTおよびEXPORT

シリアル化された機械学習モデルは、シリアル化されたオブジェクト形式でエクスポートできます。シリアル化されたモデルは、スコアリングのために別のプラットフォームに移動できます。

Oracle Data Miningユーザーズ・ガイドおよびOracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンスを参照してください。

非推奨となった機能

次の機能は今回のリリースで非推奨となり、今後のリリースではサポートされない可能性があります。このリリースの非推奨となった機能の完全なリストは、『Oracle Databaseアップグレード・ガイド』を参照してください。

サポートが終了した機能

このリリースでサポート対象外となった機能の詳細は、『Oracle Databaseアップグレード・ガイド』を参照してください。

その他の変更

Oracle Data Mining概要 18cの追加の変更点は、次のとおりです。

  • 「Oracle Data MiningとR拡張性」のトピックは、Oracle Data Miningの紹介の章から、新しいR拡張性の章に移動されました。

  • ドキュメント全体で、マイニング方法とAPIまたはSQL関数を区別するために、「マイニング機能」は「マイニング手法」に置き換えられました。