ここでは、『Oracle Big Data Connectorsユーザーズ・ガイド』の変更点を示します。
Oracle Big Data Connectorsリリース2 (2.3)の『Oracle Big Data Connectorsユーザーズ・ガイド』の変更点は次のとおりです。
Oracle R Connector for Hadoopの名称は、Oracle R Advanced Analytics for Hadoopに変更されました。
このリリースの新機能は次のとおりです。
Oracle XQuery for Hadoop
Oracle XQuery for Hadoopは、Apache Hadoopに格納されている半構造化されたデータの変換エンジンです。XQuery言語で表された変換を一連のMapReduceジョブに解釈して実行します(これらのジョブはHadoopクラスタ上で並列で実行されます)。
第III部「Oracle XQuery for Hadoop」を参照してください。
Oracle SQL Connector for HDFS
様々な構成プロパティを設定することによって、デフォルトのデータ型マッピングをオーバーライドできるようになりました。
「構成可能な列マッピングの概要」を参照してください。
Oracle SQL Connector for HDFSは、Apache Hiveおよびテキスト・データソースに対して拡張データ型(VARCHAR2
、NVARCHAR
およびCLOB
)をサポートします。
「oracle.hadoop.exttab.colMap.columnLength」および「oracle.hadoop.exttab.colMap.columnType」を参照してください。
hadoop
コマンドで--output
オプションを使用すると、生成したDDLがファイルに書き込まれます。
「ExternalTableコマンドライン・ツールの使用」を参照してください。
Oracle Loader for Hadoop
ローダー・マップは構成パラメータに置き換えられています。ローダー・マップ・ファイルを構成ファイルに変換するユーティリティが用意されています。
「ローダー・マップ・ファイルの変換」を参照してください。
Oracle Big Data Connectorsリリース2 (2.2)の『Oracle Big Data Connectorsユーザーズ・ガイド』の変更点は次のとおりです。
このリリースの新機能は次のとおりです。
Oracle SQL Connector for Hadoop Distributed File System
Apache Hiveの小数データ型をサポートします。
Oracle Loader for Hadoop
Hive 0.10.0のサポート
Oracle Big Data Connectorsリリース2 (2.0)の『Oracle Big Data Connectorsユーザーズ・ガイド』の変更点は次のとおりです。
Oracle Big Data Connectorsは、Apache Hadoopバージョン4 (CDH4)を含むClouderaのディストリビューションをサポートしています。他のサポート対象プラットフォームについては、第1章のそれぞれのコネクタを参照してください。
Oracle Direct Connector for Hadoop Distributed File Systemの名称は、Oracle SQL Connector for Hadoop Distributed File Systemに変更されました。
Oracle SQL Connector for Hadoop Distributed File System
Hive表、データ・ポンプ・ファイルまたはデリミタ付きテキスト・ファイルからのOracle Database外部表の自動作成
場所ファイルの管理
第2章を参照してください。
Oracle Loader for Hadoop
ダイレクト・パス・ロードに関するSockets Direct Protocol (SDP)のサポート
ユーザー指定の列に対する2番目のソートのサポート
正規表現およびOracle NoSQL Databaseの新しい入力形式。AvroレコードInputFormatは、サンプル・コードのかわりにサポートされるコードです。
簡略化された日付形式の指定
拒否制限の新しいしきい値
ジョブのレポート作成および診断の改良
第3章を参照してください。
Oracle R Advanced Analytics for Hadoop
いくつかの分析アルゴリズムを使用できるようになりました。具体的には、線形回帰、予測用ニューラル・ネットワーク、低ランクの行列因数分解を使用した行列補完、クラスタリング、非負行列因子分解を使用できます。
Oracle R Advanced Analytics for Hadoopは、HDFSファイルに加えてHiveデータソースをサポートします。
Oracle R Advanced Analytics for Hadoopは、HDFSとOracle Database間でデータを移動します。Oracle R Enterpriseは、データのこの基本転送には必要ありません。
このリリースの新機能は次のとおりです。
as.ore.* hadoop.jobs hdfs.head hdfs.tail is.ore.* orch.connected orch.dbg.lasterr orch.evaluate orch.export.fit orch.lm orch.lmf orch.neural orch.nmf orch.nmf.NMFalgo orch.temp.path ore.* predict.orch.lm print.summary.orch.lm summary.orch.lm
第8章を参照してください。
次の機能はこのリリースで非推奨になったため、今後のリリースでサポートされません。
Oracle SQL Connector for Hadoop Distributed File System
場所ファイル形式(バージョン1): Oracle Direct Connector for HDFSバージョン1を使用して内容が公開される既存の外部表は、場所ファイル形式の変更に互換性がないため、Oracle SQL Connector for HDFSバージョン2を使用して公開する必要があります。
Oracle SQL Connector for HDFSで新しい場所ファイルが作成される場合、古い場所ファイルは削除されません。
第2章を参照してください。
oracle.hadoop.hdfs.exttab
ネームスペース(バージョン1): Oracle SQL Connector for HDFSでは、すべての構成プロパティに対して次の新しいネームスペースが使用されます。
oracle.hadoop.connection
: Oracle Database接続およびWalletのプロパティ
oracle.hadoop.exttab
: その他すべてのプロパティ
第2章を参照してください。
HDFS_BIN_PATHディレクトリ: プリプロセッサのディレクトリ名はOSCH_BIN_PATHになりました。
「Oracle SQL Connector for Hadoop Distributed File Systemの設定」を参照してください。
Oracle R Advanced Analytics for Hadoop
keyval
: キーと値のペアの生成にorch.keyval
を使用します。
orch.reconnect
: orch.dbcon
によって返される接続オブジェクトを使用する再接続にorch.connect
を使用します。
次の機能はOracleでサポート対象外になりました。
Oracle Loader for Hadoop
oracle.hadoop.loader.configuredCounters
第3章を参照してください。
このリリースでは、次の変更が追加されています。
Oracle Loader for Hadoop
インストール用のzipアーカイブには、次の2つのキットが含まれています。
Apache Hadoop 0.20.2およびCDH3向けoraloader-2.0.0-1.x86_64.zip
CDH4向けoraloader-2.0.0-2.x86_64.zip
「Oracle Loader for Hadoopの設定」を参照してください。