Oracle R Enterpriseの各リリースには、多くの場合、新しい機能が含まれています。次の各トピックでは、現在のリリースおよび以前の一部のリリースの機能について説明します。
Oracle R Enterprise 1.5では、Oracle R EnterpriseのデータストアとOracle Databaseのスクリプト・リポジトリ内のスクリプトを管理するための関数が導入されました。また、OREmodelパッケージの新しい関数、statsパッケージの一部の関数での新しい透過層メソッド、およびその他の機能拡張が含まれています。
Oracle R Enterprise 1.5では、新しいR関数およびSQLプロシージャや新しい透過層メソッドが追加されているとともに、一部の関数の機能が拡張されています。
Oracle R Enterprise 1.5には、Oracle R EnterpriseのデータストアとOracle R EnterpriseのRスクリプト・リポジトリを管理するための新しいR関数およびSQLプロシージャが備えられています。ユーザーは、データストアおよび登録されているRスクリプトへのアクセス権を他のユーザーと共有できるようになりました。このリリースには、新しいモデリング関数ore.randomForestや、ore.frameオブジェクトを取り、パラレル処理を使用できる新しいsvdおよびprcomp統計関数メソッド、およびその他の機能拡張が含まれています。
次の各トピックでは、新しい機能について簡単に説明します。
Oracle R Enterprise 1.5には、Oracle R EnterpriseのデータストアとRスクリプト・リポジトリを管理するための新しいR関数が備えられています。
データストアまたは登録されているRスクリプトの所有者は、データストアまたはスクリプトへの読取りアクセス権を他のユーザーと共有できるようになりました。また、このリリースには、データストアおよびスクリプトを作成する関数やそれらに関する情報を提供する関数の新しい引数も備えられています。このデータストアおよびスクリプト管理の機能には、RとSQLの両方のインタフェースがあります。
データストアを管理するためのR関数は次のとおりです。
ore.delete (データストアを削除します)は変更されていません。
ore.grantは、データストアまたはスクリプトへの読取りアクセス権を付与する新しい関数です。
データストアからR環境にオブジェクトをロードするore.loadには、データストアの所有者を指定する新しい引数ownerがあります。
ore.revokeは、データストアまたはスクリプトへの読取りアクセス権を取り消す新しい関数です。
データストアを作成するore.saveには、データストアへの読取りアクセス権を付与できるかどうかを指定する新しい引数grantableがあります。
データストアに関する情報をリストするore.datastoreには、データストアのタイプを指定する新しい引数typeがあります。typeの値は、文字列user (デフォルト)、grant、grantedおよびallです。
データストアに関する詳細情報を提供するore.datastoreSummaryには、データストアの所有者を指定する新しい引数ownerがあります。
スクリプトを管理するためのR関数は次のとおりです。
ore.grantは、データストアまたはスクリプトへの読取りアクセス権を付与する新しい関数です。
ore.revokeは、データストアまたはスクリプトへの読取りアクセス権を取り消す新しい関数です。
R関数をスクリプト・リポジトリに追加するore.scriptCreateには、globalおよびoverwriteという新しい引数があります。引数globalでは、スクリプトがグローバルであるか、プライベートであるかを指定します。グローバル・スクリプトは、すべてのユーザーが使用できるパブリック・スクリプトです。global = FALSEの場合、スクリプトへのアクセス権は、所有者が他のユーザーに付与する必要があります。引数overwriteでは、スクリプトの内容を置き換えることができるかどうかを指定します。
スクリプトを削除するore.scriptDropには、削除するスクリプトがグローバルであるかどうかを指定するglobalと、スクリプトを削除できない場合にエラーをレポートするかどうかを指定するsilentという新しい引数があります。
スクリプトに関する情報をリストするore.scriptListには、スクリプトのタイプを指定する新しい引数typeがあります。typeの値は、文字列user (デフォルト)、global、grant、grantedおよびallです。
ore.scriptLoadは、スクリプトをR環境にロードする新しい関数です。
Oracle R Enterprise 1.5には、Oracle R EnterpriseのデータストアとRスクリプト・リポジトリを管理するための新しいPL/SQLプロシージャが備えられています。
データストアまたは登録されているRスクリプトの所有者は、データストアまたはスクリプトへの読取りアクセス権を他のユーザーと共有できるようになりました。また、このリリースには、データストアおよびスクリプトを作成するプロシージャやそれらに関する情報を提供するプロシージャの新しい引数も備えられています。この機能には、RとSQLの両方のインタフェースがあります。Oracle Databaseのデータ・ディクショナリ・ビューは、データストアおよびスクリプトに関する情報を提供します。
Oracle R Enterpriseのデータストアおよび登録されているRスクリプトへのアクセスを制御するSQLプロシージャについては、次の各項で説明します。
データストアを管理するためのPL/SQLプロシージャ
データストアを管理するためのPL/SQLプロシージャは次のとおりです。
rqDropDataStore (データストアを削除します)は変更されていません。
rqGrantは、データストアまたはスクリプトへの読取りアクセス権を付与する新しいプロシージャです。
rqRevokeは、データストアまたはスクリプトへの読取りアクセス権を取り消す新しいプロシージャです。
スクリプトを管理するためのPL/SQLプロシージャ
スクリプトを管理するためのPL/SQLプロシージャは次のとおりです。
rqGrantは、データストアまたはスクリプトへの読取りアクセス権を付与する新しいプロシージャです。
rqRevokeは、データストアまたはスクリプトへの読取りアクセス権を取り消す新しいプロシージャです。
rqScriptCreateには、globalおよびoverwriteという新しい引数があります。引数globalでは、スクリプトがグローバルであるか、プライベートであるかを指定します。グローバル・スクリプトは、すべてのユーザーが使用できるパブリック・スクリプトです。global = FALSEの場合、スクリプトへのアクセス権は、所有者が他のユーザーに付与する必要があります。引数overwriteでは、スクリプトの内容を置き換えることができるかどうかを指定します。
rqScriptDropには、削除するスクリプトがグローバルであるかどうかを指定するglobalと、スクリプトを削除できない場合にエラーをレポートするかどうかを指定するsilentという新しい引数があります。
データストアのデータ・ディクショナリ・ビュー
データストアに関連するOracle Databaseのディクショナリ・ビューは次のとおりです。
ALL_RQ_DATASTORES
RQUSER_DATASTORECONTENTS
USER_RQ_DATASTORES
USER_RQ_DATASTORE_PRIVS
スクリプトのデータ・ディクショナリ・ビュー
スクリプトに関連するOracle Databaseのディクショナリ・ビューは次のとおりです。
ALL_RQ_SCRIPTS
USER_RQ_SCRIPTS
USER_RQ_SCRIPT_PRIVS
関数ore.groupApplyは、複数列のパーティショニングをサポートするようになりました。
INDEX引数は、ore.factorオブジェクトか列を含むore.vectorオブジェクト、またはore.frameオブジェクトを取ることができるようになりました。それぞれの長さは引数Xと同じです。関数ore.groupApplyは、INDEXオブジェクトを使用してX内のデータをパーティショニングした後で、関数FUNに送信します。
INDEXオブジェクトを使用してデータをパーティショニングする例は、「複数列のパーティショニング」を参照してください。
ore.randomforest関数は、ore.frameオブジェクト内のデータに基づいてランダム・フォレスト・モデルを構築します。
これは、埋込みRの実行を使用して、データベース・サーバー上のRセッションでランダム・フォレスト・ツリーを並行して成長させます。これはore.randomforestオブジェクトを返します。Oracle R Enterprise 1.5では、関数ore.randomForestは分類をサポートしますが、回帰はサポートしません。
ore.randomforest関数は、CRAN R randomForestパッケージで採用されているものと同じアルゴリズムを使用しますが、実行時のメモリーの使用量とアンサンブル・ツリー・サイズが改善されています。
ore.randomforestモデルに対するスコアリング・メソッドpredictも並行して実行されます。使用可能なメモリーが十分ある場合は、cache.model引数をTRUEに設定することをお薦めします。そうでない場合は、メモリーの過度な使用を避けるために、cache.modelをFALSEに設定する必要があります。
ore.randomforestを使用するには、Oracle R Distribution (ORD) 3.2またはCRAN R randomForestパッケージのいずれかをインストールする必要があります。CRAN R randomForestよりもパフォーマンスおよびスケーラビリティに優れたORD 3.2の関数ore.randomforestを使用することをお薦めします。R randomForestパッケージのみをインストールしている場合、ore.randomForestは実行時に警告メッセージを発行します。CRAN R randomForestパッケージは、Oracle R Enterprise 1.5のSupporting Packagesの1つです。
グローバル・オプションore.parallelは、Oracle R Enterpriseサーバーで使用する並列度を決定します。引数groupsは、ore.randomForestモデルの粒度を制御します。
ore.randomForestの使用例は、「ランダム・フォレスト・モデルの構築」を参照してください。
関数ore.summaryのパフォーマンスが向上しました。また、異なるシグネチャを持ち、一部の引数のデータ型が変更されています。
関数の構文は次のようになりました。
ore.summary(data, var, stats = c("n", "mean", "min", "max"),
class = NULL, types = NULL, ways = NULL, weight = NULL,
order = NULL, maxid = NULL, minid = NULL, mu = 0,
no.type = FALSE, no.freq = FALSE)
Oracle R Enterpriseリリース1.5と以前のリリースのore.summaryの違いは次のとおりです。
ore.summaryのパフォーマンスが向上し、結果を返す速度が1桁以上向上しました。
引数var、statsおよびclassは、文字列のベクターを取るようになりました。以前は、セパレータとしてカンマを使用する連結文字列を取っていました。
引数typesは、class引数内の列の組合せを指定する、文字列のベクターのリストになりました。
引数maxidおよびminidは、文字列の名前付きベクターです。
引数group.byおよびno.levelは、サポートされていません。
以前のリリースでは、引数muはmu0という名前でした。
ore.summaryの使用例は、「ore.summaryによるデータの集計」を参照してください。
Oracle R Enterprise 1.5では、statsパッケージの関数prcompおよびsvdについて透過層メソッドが用意されています。
prcomp関数は主要コンポーネント分析を実行し、svd関数は特異値分解を実行します。これらの関数はore.frameオブジェクトを受け入れるようになり、データベースでパラレル実行を使用できるため、スケーラビリティとパフォーマンスを向上させることができます。
Oracle R Enterpriseの一部の関数では、Oracle Databaseのデータ型、BLOBおよびCLOBがサポートされるようになりました。
関数ore.pushおよびore.pullでは、データベースのデータ型、BLOBおよびCLOBがサポートされるようになりました。
埋込みRの実行のR関数では、入力オブジェクトおよび出力オブジェクトについて、データベースのデータ型、BLOBおよびCLOBがサポートされるようになりました。
BLOBおよびCLOBデータ型の使用例は、例6-11を参照してください。
次のトピックでは、Oracle R Enterprise 1.4での変更内容について説明します。
Oracle R Enterprise 1.4.1での変更内容は次のとおりです。
ore.glm関数はモデル式のオフセット項を受け入れるようになり、この関数を使用して、一般化線形モデルの負の二項分布およびTweedie分布を適合できるようになりました。
ore.sync関数にオプションの引数queryが追加され、データベース内にビューを作成せずに、最適化されたSQL SELECT文からore.frameオブジェクトを作成できるようになりました。この引数を使用すると、現行スキーマに対するCREATE VIEWシステム権限を持っていなくても問合せを作成できます。
関連項目:
シリアライズ用の新しいグローバル・オプションore.envAsEmptyenvによって、Oracle Databaseへのシリアライズ中にオブジェクト内の参照される環境を空の環境で置き換えるかどうかを指定できます。このオプションは、次の各関数で使用されます。
ore.push: listオブジェクトの場合、オプションの引数としてenvAsEmptyenvを受け入れます。
ore.save: 名前付き引数としてenvAsEmptyenvを取ります。
ore.doEvalおよびその他の埋込みRの実行関数: 制御引数としてore.envAsEmptyenvを受け入れます。
前述の引数のデフォルト値は、グローバル・オプションore.envAsEmptyenvによって制御されますが、引数を使用して関数のグローバル・オプション値をオーバーライドできます。
関連項目:
ore.push関数およびore.save関数のオンライン・ヘルプ
次のトピックでは、Oracle R Enterprise 1.4での変更内容について説明します。
Oracle R Enterprise 1.4での変更内容は次のとおりです。
データ・プレゼンテーション関数で追加および改善された点は次のとおりです。
新しいfactanal関数は、数値列を含むformulaオブジェクトまたはore.frameオブジェクトでファクタ分析を実行します。
princomp関数のどちらの署名も、scores、subsetおよびna.actionの引数をサポートします。
新しいgetXlevels関数は、ore.frameオブジェクトに関連するmodel.matrixコールのxlev引数で使用可能なファクタ・レベルのリストを作成します。
新しい探索的データ分析関数であるore.esmは、時系列データの指数平滑法モデルを構築します。この関数は、単純指数平滑法または二重指数平滑法のいずれかを使用してモデルを構築します。この関数は、集計や欠損値の処理などの操作を使用して時系列データを事前処理できます。「時系列データでの指数平滑法モデルの構築」を参照してください。
Oracle R Enterpriseの回帰関数およびニューラル・ネットワーク・モデル関数で追加および改善された点は次のとおりです。
新しいore.glm関数は、ロジスティック回帰、プロビット回帰およびポアソン回帰を含む、一般化線形モデルを適合するための方法を提供します。「一般化線形モデルの構築」を参照してください。
ore.lm関数およびore.stepwise関数でモデル式で列を導出する際の、1,000列までの制限がなくなりました。
ore.lm関数は、加重最小二乗回帰を実行するためのweights引数をサポートするようになりました。
anova関数は、ore.lmオブジェクトの分散分析を実行できるようになりました。
ore.stepwise関数では、direction引数の値が変更されました。値bothでは、追加より削除が優先されるようになりました。新しいdirection引数の値alternateは、以前のboth値の意味を持ちます。
ore.neural関数にいくつかの新しい引数が追加されました。
Oracle Data Miningモデルのアルゴリズム関数で追加および改善された点は次のとおりです。
新しいore.odmAssocRules関数は、Aprioriアルゴリズムを使用してOracle Data Miningの相関モデルを構築します。「相関ルール・モデルの構築」を参照してください。
新しいore.odmNMF関数は、特徴抽出にNon-Negative Matrix Factorization(NMF)アルゴリズムを使用してOracle Data Miningモデルを構築します。「Non-Negative Matrix Factorizationモデルの構築」を参照してください。
新しいore.odmOC関数は、クラスタ化に直交パーティショニング・クラスタ(O-Cluster)アルゴリズムを使用してOracle Data Miningモデルを構築します。「直交パーティショニング・クラスタ・モデルの構築」を参照してください。
Oracle R Enterpriseの追加のグローバル・オプションであるore.parallel。「Oracle R Enterpriseのグローバル・オプション」を参照してください。
次の各トピックでは、Oracle R Enterprise 1.3での変更内容について説明します。
Oracle R Enterprise 1.3での新機能は次のとおりです。
OREpredictパッケージでのインデータベース・データを使用するRモデルでの予測
row.names<-を使用した順序付けおよび索引付け
OREodmパッケージを使用したOracle Data Miningモデルでの予測
データベースでのRオブジェクトの保存および管理
日時データ型
サンプリングおよびパーティショニング
列の詳細名
埋込みRスクリプトでのOracle Databaseインスタンスへの自動接続
ore.neural関数を使用したインデータベース・データを使用するRニューラル・ネットワークの構築
Oracle R Enterprise 1.1での新機能は次のとおりです。
追加のオペレーティング・システムのサポート:
Oracle R DistributionおよびOracle R Enterpriseは、IBM AIX 5.3以上および64-bit SPARCおよび64-bit x386(Intel)の両方のプロセッサの10以上でサポートされるようになりました。
Oracle R Enterpriseサーバーは、64-bitおよび32-bitのWindowsオペレーティング・システムで稼働するようになりました。
Rの数学ライブラリの向上
Oracle R EnterpriseでIntel Math Kernel Library (MKL)とAMD Core Math Library (ACML)のいずれかを動的に選択するためのサポートによって向上したOracle R Distributionを使用できるようになりました。
Solarisでは、BLASおよびLAPACKの高速な操作のために、Oracle R DistributionがOracle SUNパフォーマンス・ライブラリと動的にリンクされます。
Oracle Walletのサポートでは、Rスクリプトでクリア・テキストのデータベース認証資格証明を使用する必要がなくなりました。そのために、Oracle R EnterpriseがOracleウォレットと統合されています。
改善されたインストール・スクリプトでは、より多くの前提条件チェックおよび詳細なエラー・メッセージが提供されます。エラー・メッセージが、解決するためのアクションに関する具体的な説明を提供します。