2.2 Oracle Machine Learning for Rの利点
OML4Rを使用したOracle Databaseインスタンスのデータの準備および分析では、Rユーザーにとって多くの利点があります。
OML4Rを使用して、次のことを実行できます。
-
SQLを使用せずにデータベース常駐データを操作。OML4Rは、多くの標準R関数をSQLに透過的に変換します。OML4Rを使用すると、データベースに常駐するデータを分析および操作できるRプロキシ・オブジェクトを作成できます。データベースでは、列索引、問合せの最適化、表のパーティション化およびデータベースの並列性を利用して、SQLを自動的に最適化できます。
OML4Rでオーバーロードされた関数は、インデータベース実行のためのRデータ・フレームに対するものを含め、一般的に使用される多くのR関数に使用できます。
-
データの移動を最小化。可能なかぎり常にデータをデータベースに保持することによって、クライアントのRエンジンへのデータの転送にかかる時間およびデータをローカルに格納する必要性をなくします。また、ローカルに格納したデータの管理(データ・ファイルの適切な場所への配布、本番データベースで行われた変更とのデータの同期などのタスクが含まれます)を必要なくします。
-
データをセキュアに保持。データをデータベースに保持することによって、データ管理用のOracle Databaseのセキュリティ、スケーラビリティ、信頼性およびバックアップの各機能を利用できます。
-
データベースの能力を使用。データベース内のデータを直接操作することによって、データベース環境のメモリーおよび処理能力を使用でき、クライアントのRエンジンのメモリーの制約を回避できます。
-
最新のデータを使用。データはデータベースでリフレッシュされるため、最新のデータにただちにアクセスできます。
-
データベースでデータを準備。透過層関数を使用して、順序付け、集計、フィルタ処理、記録などの操作を介した予測分析用、およびSQLコードを記述することなく総括的サンプリング手法を使用するための、大規模なデータベース常駐データ・セットを準備します。
-
データベースにRオブジェクトを保存。Rセッション全体で使用し、他のユーザーと共有するために、ネイティブRオブジェクトおよびOML4Rプロキシ・オブジェクトをOML4Rデータストアに保存できます。RオブジェクトおよびOML4RオブジェクトをOracle Databaseインスタンスが管理するOML4Rデータストアに格納できます。
-
データベースにモデルを構築。OML4SQLのインデータベースのパラレル化および分散型機械学習アルゴリズムを使用して、より多くのデータに基づいてより多くのモデルを構築し、大量のデータをより迅速にスコアリングします。十分に統合されたR APIを介してOML4SQLからのインデータベース・アルゴリズムを使用します(これには現在、ニューラル・ネットワーク、ランダム・フォレスト、指数平滑化およびXGBoost用のインデータベース・アルゴリズムが含まれます)。インデータベース・アルゴリズムの自動データ準備、パーティション化されたモデル、統合テキスト・マイニング機能により、生産性が向上します。
CRAN (包括的なRアーカイブ・ネットワーク)からダウンロードするパッケージ内の関数を使用して、アンサンブル・モデリングなどの手法を使用するモデルを構築できます。
-
埋込みRエンジンでユーザー定義R関数を実行。OML4R Embedded R Execution機能を使用すると、ユーザー定義R関数をOML4Rスクリプト・リポジトリに格納し、データベース環境によって生成されたRエンジンでそれらの関数を実行できます。ユーザー定義R関数が実行されると、パラレルに実行できる1つ以上のRエンジンがデータベースによって生成および管理されます。Embedded R Execution機能を使用すると、次のことを実行できます。
-
Embedded Rエンジンで実行されるユーザー定義関数で、選択したRパッケージのセットを使用する。
-
本番アプリケーションで使用するためにユーザー定義R関数を操作できるようにし、他の言語へのRコードおよびモデルの移植を回避する。Rの結果を既存のアプリケーションに統合するためにコードを作成しなおさなくても済みます。
-
Oracleデータベース・インスタンスをユーザー定義R関数の高パフォーマンス・コンピューティング環境としてシームレスに利用し、データ・パラレル処理とリソース管理を実現する。
-
システムでサポートされているタスク・パラレル化を使用して、モンテカルロ分析などのシミュレーションを実行する。
-
ユーザー定義R関数のコール: オンプレミスOracle DatabaseおよびOracle Database Cloud Serviceでは、ユーザー定義R関数はRおよびSQLからコールされ、Oracle Autonomous Databaseでは、ユーザー定義R関数はR、SQLおよびREST APIからコールされます。
-
構造化data.frame結果およびPNGイメージをユーザー定義R関数から表として返す他、構造化コンテンツとイメージ・コンテンツの両方が含まれるXMLも返す。
-
-
Oracleテクノロジ・スタックと統合。Oracleテクノロジ・スタックのあらゆる側面を利用して、ビジネス・インテリジェンスや科学調査といった、より大規模なフレームワーク内に、独自のデータ分析を統合できます。たとえば、OML4R分析の結果をOracle Analytics CloudおよびOracle APEXに統合するには、SQLを使用してR機能をコールします。