Rは、オープン・ソースの統計プログラミング言語および環境です。Rの詳細は、http://www.r-project.org
の「R Project for Statistical Computing」を参照してください。
Rは、次のような統計コンピューティング用の環境を提供します。
使いやすい言語
視覚化のための高性能なグラフィカル環境
そのままで使用できる多数の統計手法
Rパッケージ(Rパッケージは、関連する関数、ヘルプ・ファイルおよびデータ・ファイルのセットであり、この執筆時点で4000個を超えるRパッケージがありますが、その数は常に増加しています。)
データをインタラクティブに分析するためのR Consoleグラフィカル・ユーザー・インタフェース
Rは、その採用が急速に拡大し、新しい統計ソフトウェアの標準としての評価を獲得しました。
Oracle R Enterpriseは、Oracle Database Enterprise EditionのOracle Advanced Analyticsオプションのコンポーネントの1つです。
ソフトウェア・ダウンロードのリンクなど、Oracle R Enterpriseの詳細は、「Oracle R Enterprise」(http://www.oracle.com/technetwork/database/options/advanced-analytics/r-enterprise/index.html
)を参照してください。このサイトには、ダウンロード、ブログ、ディスカッション・フォーラムおよび最新のドキュメントへのリンクが掲載されています。ブログおよびフォーラムの詳細は、「Oracle R Enterpriseの役立つリンク」を参照してください。
Oracle R Enterpriseによって、ユーザーは、Oracle Databaseに格納されているデータに対して統計分析を実行できます。Oracle R Enterpriseには3つのコンポーネントがあります。
Oracle R Enterprise R透過層。透過層は、Oracle DatabaseオブジェクトへのRデータ型のマッピングをサポートし、マッピングされたデータ型に対してR式に応じてSQLを透過的に生成するパッケージの集まりです。透過層によって、Rユーザーは、R言語構文を使用してデータベースに格納されているデータと直接対話できます。データベースに格納されているデータとやり取りする利点の1つは、Rユーザーがユーザーのデスクトップ・システムのメモリーに格納するには大きすぎるデータを処理できることです。
Oracle R Enterprise統計エンジン。よく使用される統計ライブラリに対応する統計関数とプロシージャの集まり。統計エンジンのパッケージはOracle Databaseで実行されます。
埋込みRの実行。これを行うと、データベース・サーバーはサーバー側のRエンジンを生成することによって、Rスクリプトの実行を管理および制御できるようになります。埋込みRの実行により、Rスクリプトの操作化、つまりRスクリプトをアプリケーションの一部として完全に自動実行されるようにできます。埋込みRの実行では、Oracle Databaseからデータを移動する必要はありません。埋込みRの実行では、データおよびタスクのパラレル実行、SQL APIを介したリッチXML出力およびpng
イメージ・ストリームの生成が可能であり、パラレル・シミュレーション機能が提供されます。
Oracle R Enterpriseには多数のパッケージが含まれており、そのリストについては「Oracle R EnterpriseおよびOracle R Distributionのパッケージ」を参照してください。
この章の残りの部分では、Oracle R Enterpriseのアーキテクチャと、Oracle R Enterpriseでサポートされる構成について説明します。
Oracle R Enterpriseのトレーニングは、Oracle Learning Libraryから無償で利用できます。
「Oracle R Enterpriseの役立つリンク」では、ブログおよびフォーラムについて説明します。
Oracle R Enterpriseには、Connector for Hadoopなど次の3つのコンポーネントがあります。
クライアントRエンジン(クライアント内のRエンジン)は、Oracle Databaseへの接続と、そのデータベース内のデータとの対話を可能にするRパッケージの集まりです。
どのRコマンドもクライアントから使用できます。さらに、クライアントは、次の関数を提供します。
R SQL透過層は、R関数をインターセプトし、データベース内の実行をスケーラブルにします
関数によって、データ変換、統計関数およびOracle R Enterprise固有関数がインターセプトされます
オープン・ソースRと同様のインタラクティブなグラフィカル結果表示およびフロー制御
Oracle Database内で実行するためのR閉包(関数)の送信。
サーバー(Oracle Database内)は、Oracle DatabaseをOracle R Enterpriseクライアントをサポートするために必要な機能で強化するPL/SQLプロシージャおよびライブラリの集まりです。Rエンジンは、埋込みRの実行をサポートするためにOracle Databaseにもインストールされます。Oracle Databaseは、Rエンジンを生成し、それによってデータの並列性を提供できます。
Oracle R Enterpriseのデータベース・エンジンは、次の機能を提供します。
大きなデータセットに対するスケーラビリティ
データベース内の表、ビュー、外部表、およびデータベース・リンクを介してアクセス可能なものへのアクセス。
SQL問合せのパラレル実行の使用
データベース内の統計およびデータ・マイニング機能の使用
Oracle Databaseによって生成されるRエンジンは、データベースによって管理される並列性をサポートし、Rスクリプトのスケジュールされた完全自動実行、つまり、PL/SQLまたはSQL問合せ内にパッケージ化されたRスクリプトのスケジューリングまたは起動を提供します。Oracle R Enterpriseは、生成されたエンジンとの間の効率的な転送を提供します。埋込みRの実行を使用すると、MapReduceスタイルのプログラミングをエミュレートできます。
Oracle R Enterprise固有のデータ型がいくつかあります。詳細は、「サポートされるデータ型」を参照してください。
Oracle R Enterpriseは、クライアントとサーバーで構成されています。クライアントとサーバーはOracle Linux、Red Hat Linuxで動作します。クライアントはMicrosoft Windows 64ビットで動作します。サーバーは、Oracle Databaseにインストールされ、それにクライアントが接続します。クライアントとサーバーは、同じオペレーティング・システム上で動作している必要はありません。たとえば、サーバーがOracle Linuxにインストールされている状態で、クライアントをMicrosoft Windowsで実行することができます。
Oracle R Enterpriseは、LinuxおよびSolarisオペレーティング・システムが実行されているOracle Exadataマシンでも稼働します。詳細は、『Oracle R Enterpriseインストレーションおよび管理ガイド』を参照してください。
オープン・ソースのRは、Comprehensive R Archive Network (CRAN)から配布されています。ダウンロードできますが、出荷はされていません。
CRANディストリビューションには、Windows用のグラフィカル・ユーザー・インタフェースが含まれています。すべてのオペレーティング・システムのR用にオープン・ソースのGUIが存在していますが、別のサイトからのダウンロードおよび個別のインストールが必要です。
Rの統合開発環境(IDE)が必要な場合は、RStudio IDEを使用できます。RStudio IDEインストールの概要は、『Oracle R Enterpriseインストレーションおよび管理ガイド』を参照してください。
Oracle Learning Libraryで利用可能な「Oracle R Enterprise Tutorial Series」(https://apex.oracle.com/pls/apex/f?p=44785:24:17534844732288::NO::P24_CONTENT_ID,P24_PREV_PAGE:6528,1
)では、オープン・ソースのRの基本およびOracle R Enterpriseの機能を説明するレッスンが用意されています。Rの基本、Rでのグラフ作成、透過層、Rスクリプト、SQLスクリプトなどのトピックがあります。また、Oracle R Connector for Hadoopに関するレッスンもあります。(Oracle Connector for Hadoopは別の製品です。)
Oracle Learning Libraryのレッスンは無償です。
関連項目: Oracle Technology Network (http://www.oracle.com/technetwork/database/options/advanced-analytics/r-enterprise/index.html )のOracle R Enterpriseのページでは、「Learning R Series」プレゼンテーションを参照できます。 |
次のWebサイトでは、Oracle R Enterpriseのユーザー向けに役立つ情報が提供されています。
Oracle R Enterpriseのディスカッション・フォーラム(https://forums.oracle.com/forums/forum.jspa?forumID=1397
)では、OracleのR関連の製品として、Oracle R Enterprise、Oracle R Connector for Hadoop (Big Data Connectorsの一部)およびOracle R Distributionなどのすべての側面についてサポートしています。このフォーラムを利用して、このソフトウェアに関する質問やコメントを投稿してください。
Oracle R Enterpriseのブログ(https://blogs.oracle.com/R/
)では、従来の、および新しいBig Data環境の両方でOracle R EnterpriseおよびOracle R Connector for Hadoopを適用するためのベスト・プラクティス、ヒント、およびコツについて意見を交わします。