ヘッダーをスキップ
Oracle® Big Data Connectorsユーザーズ・ガイド
リリース4 (4.3)
E70118-01
索引
次
目次
タイトルおよび著作権情報
はじめに
対象読者
関連ドキュメント
テキストの表記規則
構文の表記規則
Oracle Big Data Connectorsユーザーズ・ガイドのこのリリースでの変更点
Oracle Big Data Connectorsリリース4 (4.3)の変更点
Oracle Big Data Connectorsリリース4 (4.2)の変更点
Oracle Big Data Connectorsリリース4 (4.1)の変更点
Oracle Big Data Connectorsリリース4 (4.0)の変更点
第I部 設定
1
Oracle Big Data Connectorsを使用する前に
1.1
Oracle Big Data Connectorsについて
1.2
ビッグ・データの概念とテクノロジ
1.2.1
MapReduceとは
1.2.2
Apache Hadoopとは
1.3
Oracle Big Data Connectorsソフトウェアのダウンロード
1.4
Oracle SQL Connector for Hadoop Distributed File Systemの設定
1.4.1
ソフトウェア要件
1.4.2
Oracle DatabaseシステムへのHadoopクライアントのインストールと構成
1.4.3
Oracle SQL Connector for HDFSのインストール
1.4.4
Oracle Databaseに対するユーザー・アクセス権の付与
1.4.5
Oracle Databaseシステムへのユーザー・アカウントの設定
1.4.6
セキュアなHadoopクラスタでのOracle SQL Connector for HDFSの使用
1.5
Oracle Loader for Hadoopの設定
1.5.1
ソフトウェア要件
1.5.2
Oracle Loader for Hadoopのインストール
1.5.3
オフライン・データベース・モードのサポート
1.5.4
セキュアなHadoopクラスタでのOracle Loader for Hadoopの使用
1.6
Oracle XQuery for Hadoopの設定
1.6.1
ソフトウェア要件
1.6.2
Oracle XQuery for Hadoopのインストール
1.6.3
ファイル・パスのトラブルシューティング
1.6.4
Oracle XQuery for HadoopアクションのOozieの構成
1.7
Oracle R Advanced Analytics for Hadoopの設定
1.7.1
Hadoopへのソフトウェアのインストール
1.7.2
追加のRパッケージのインストール
1.7.3
Rユーザーへのリモート・クライアント・アクセスの提供
1.8
Oracle Data Integrator
第II部 Oracle Databaseのコネクタ
2
Oracle SQL Connector for Hadoop Distributed File System
2.1
Oracle SQL Connector for HDFSについて
2.2
Oracle SQL Connector for HDFSを使用する前に
2.3
システムへのOracle SQL Connector for HDFSの構成
2.4
Oracle Big Data ApplianceおよびOracle ExadataとのOracle SQL Connector for HDFSの使用
2.5
ExternalTableコマンドライン・ツールの使用方法
2.5.1
ExternalTableの概要
2.5.2
ExternalTableコマンドライン・ツールの構文
2.6
外部表の作成
2.6.1
ExternalTableツールによる外部表の作成
2.6.2
データ・ポンプ形式ファイルからの外部表の作成
2.6.3
Hive表からの外部表の作成
2.6.4
デリミタ付きテキスト・ファイルからの外部表の作成
2.6.5
SQLでの外部表の作成
2.7
HDFSデータ・パスの公開
2.7.1
公開用のExternalTable構文
2.7.2
公開用のExternalTableの例
2.8
外部表および場所ファイルの調査
2.8.1
情報表示のためのExternalTable構文
2.8.2
情報表示のためのExternalTableの例
2.9
Oracle SQL Connector for HDFSで作成されたデータベース・オブジェクトの削除
2.9.1
削除のためのExternalTable構文
2.9.2
削除のためのExternalTableの例
2.10
ExternalTableツールで生成された外部表の詳細
2.10.1
構成可能な列マッピングの概要
2.10.2
場所ファイルとは
2.10.3
並列処理の有効化
2.10.4
場所ファイルの管理
2.10.5
場所ファイルの名前
2.11
Oracle SQL Connector for HDFSの構成
2.11.1
構成ファイルの作成
2.11.2
Oracle SQL Connector for HDFS構成プロパティ・リファレンス
2.12
HDFS内のデータの問合せのパフォーマンスに関するヒント
3
Oracle Loader for Hadoop
3.1
Oracle Loader for Hadoopとは
3.2
操作モードの概要
3.2.1
オンライン・データベース・モード
3.2.2
オフライン・データベース・モード
3.3
Oracle Loader for Hadoopを使用する前に
3.4
ターゲット表の作成
3.4.1
ターゲット表でサポートされるデータ型
3.4.2
ターゲット表でサポートされるパーティション化方式
3.4.3
圧縮
3.5
ジョブ構成ファイルの作成
3.6
ターゲット表のメタデータの概要
3.6.1
オンライン・データベース・モードの接続詳細の指定
3.6.2
ターゲット表メタデータの生成(オフライン・データベース・モードの場合)
3.7
入力形式の概要
3.7.1
デリミタ付きテキスト入力形式
3.7.2
複合テキスト入力形式
3.7.3
Hive表入力形式
3.7.4
Avro入力形式
3.7.5
Oracle NoSQL Database入力形式
3.7.6
カスタム入力形式
3.8
ターゲット表列への入力フィールドのマッピング
3.8.1
自動マッピング
3.8.2
手動マッピング
3.8.3
ローダー・マップ・ファイルの変換
3.9
出力形式の概要
3.9.1
JDBC出力形式
3.9.2
Oracle OCIダイレクト・パス出力形式
3.9.3
デリミタ付きテキスト出力形式
3.9.4
Oracle Data Pump出力形式
3.10
ローダー・ジョブの実行
3.10.1
Hive入力形式のJARファイルの指定
3.10.2
Oracle NoSQL Database入力形式のJARファイルの指定
3.10.3
ジョブのレポート作成
3.11
拒否されたレコードの処理
3.11.1
拒否されたレコードの不正なファイルへのロギング
3.11.2
ジョブの拒否制限の設定
3.12
パーティション化表にデータをロードする場合のロード・バランシング
3.12.1
サンプリング機能の使用方法
3.12.2
ロード・バランシングのチューニング
3.12.3
サンプリング動作のチューニング
3.12.4
Oracle Loader for Hadoopがサンプラのパーティション化スキームを使用するのはどのような場合か
3.12.5
メモリーの問題の解決
3.12.6
サンプリング機能のプロパティの値が無効な場合
3.13
Oracleエンジニアド・システム間の通信の最適化
3.14
Oracle Loader for Hadoop構成プロパティ・リファレンス
3.15
同梱されているソフトウェアのサードパーティ・ライセンス
第III部 Oracle XQuery for Hadoop
4
Oracle XQuery for Hadoopの使用
4.1
Oracle XQuery for Hadoopとは
4.2
Oracle XQuery for Hadoopを使用する前に
4.2.1
基本的な手順
4.2.2
例: Hello World!
4.3
Oracle XQuery for Hadoopの関数について
4.3.1
アダプタについて
4.3.2
Oracle XQuery for Hadoopで使用する他のモジュールについて
4.4
XQuery変換の作成
4.4.1
XQuery変換の要件
4.4.2
XQuery言語のサポートについて
4.4.3
Hadoop分散キャッシュのデータへのアクセス
4.4.4
XQueryからのカスタムJava関数の呼出し
4.4.5
ユーザー定義のXQueryライブラリ・モジュールおよびXMLスキーマのアクセス
4.4.6
XQuery変換の例
4.5
問合せの実行
4.5.1
Oracle XQuery for Hadoopのオプション
4.5.2
汎用オプション
4.5.3
ローカルでの問合せの実行について
4.6
Apache Oozieからの問合せの実行
4.6.1
Oracle XQuery for HadoopのOozieアクションの使用に関する概要
4.6.2
サポートされているXML要素
4.6.3
例: Hello World
4.7
Oracle XQuery for Hadoopの構成プロパティ
4.8
同梱されているソフトウェアのサードパーティ・ライセンス
5
Oracle XQuery for Hadoopリファレンス
5.1.1
Avroファイル・アダプタ
5.1.1.1
Avroファイルを読み取る組込み関数
5.1.1.2
Avroコンテナ・ファイルを読み取るカスタム関数
5.1.1.3
Avroファイルを書き込むカスタム関数
5.1.1.4
Avroファイル・アダプタの関数の例
5.1.1.5
AvroとXML間の値の変換について
5.1.2
JSONファイル・アダプタ
5.1.2.1
JSONを読み取る組込み関数
5.1.2.2
JSONファイルを読み取るカスタム関数
5.1.2.3
JSON関数の例
5.1.2.4
JSONファイル・アダプタの構成プロパティ
5.1.2.5
XMLへのJSONデータ形式の変換について
5.1.3
Oracle Databaseアダプタ
5.1.3.1
Oracle Databaseに書き込むカスタム関数
5.1.3.2
Oracle Databaseアダプタの関数の例
5.1.3.3
Oracle Loader for Hadoop構成プロパティおよび対応する%oracle-property注釈
5.1.4
Oracle NoSQL Databaseアダプタ
5.1.4.1
Oracle NoSQL Databaseアダプタを使用するための前提条件
5.1.4.2
Oracle NoSQL Databaseに対して読取りおよび書込みを実行する組込み関数
5.1.4.3
表APIを使用してOracle NoSQL Databaseに対して読取りおよび書込みを実行する組込み関数
5.1.4.4
ラージ・オブジェクトAPIを使用してOracle NoSQL Databaseに対して読取りおよび書込みを実行する組込み関数
5.1.4.5
Oracle NoSQL Databaseから値を読み取るカスタム関数
5.1.4.6
Oracle NoSQL Databaseから単一値を取得するためのカスタム関数
5.1.4.7
表APIを使用してOracle NoSQL Databaseから値を読み取るカスタム関数
5.1.4.8
表APIを使用してOracle NoSQL Databaseから単一列を読み取るカスタム関数
5.1.4.9
ラージ・オブジェクトAPIを使用してOracle NoSQL Databaseから単一値を取得するためのカスタム関数
5.1.4.10
Oracle NoSQL Databaseに書き込むカスタム関数
5.1.4.11
表APIを使用してOracle NoSQL Databaseに値を書き込むカスタム関数
5.1.4.12
ラージ・オブジェクトAPIを使用してOracle NoSQL Databaseに値を書き込むカスタム関数
5.1.4.13
Oracle NoSQL Databaseアダプタの関数の例
5.1.4.14
Oracle NoSQL Databaseアダプタの構成プロパティ
5.1.5
順序ファイル・アダプタ
5.1.5.1
順序ファイルの読取りおよび書込みを実行する組込み関数
5.1.5.2
順序ファイルを読み取るカスタム関数
5.1.5.3
順序ファイルを書き込むカスタム関数
5.1.5.4
順序ファイル・アダプタの関数の例
5.1.6
Solrアダプタ
5.1.6.1
Solrアダプタを使用するための前提条件
5.1.6.2
データをSolrサーバーにロードするための組込み関数
5.1.6.3
データをSolrサーバーにロードするためのカスタム関数
5.1.6.4
Solrアダプタの関数の例
5.1.6.5
Solrアダプタ構成プロパティ
5.1.7
テキスト・ファイル・アダプタ
5.1.7.1
テキスト・ファイルの読取りおよび書込みを実行する組込み関数
5.1.7.2
テキスト・ファイルを読み取るカスタム関数
5.1.7.3
テキスト・ファイルを書き込むカスタム関数
5.1.7.4
テキスト・ファイル・アダプタの関数の例
5.1.8
Tikaファイル・アダプタ
5.1.8.1
Tikaを使用してファイルを解析するための組込みライブラリ関数
5.1.8.2
Tikaを使用してファイルを解析するためのカスタム関数
5.1.8.3
Tikaパーサーの出力形式
5.1.8.4
Tikaアダプタの構成プロパティ
5.1.8.5
Tikaファイル・アダプタの関数の例
5.1.9
XMLファイル・アダプタ
5.1.9.1
XMLファイルを読み取る組込み関数
5.1.9.2
XMLファイルを読み取るカスタム関数
5.1.9.3
XMLファイル・アダプタの関数の例
5.1.10
ユーティリティ・モジュール
5.1.10.1
期間、日付および時間の関数
5.1.10.2
文字列関数
5.1.11
Hadoopモジュール
5.1.11.1
Hadoopを使用するための組込み関数
5.1.12
シリアライズ注釈
6
Oracle XML Extensions for Hive
6.1
XML Extensions for Hiveとは
6.2
Hive拡張の使用
6.3
Hive関数について
6.4
XML表の作成
6.4.1
XML表に対するHiveのCREATE TABLE構文
6.4.2
CREATE TABLE構成プロパティ
6.4.3
CREATE TABLEの例
6.5.1
Hive用のOracle XML関数のリファレンス
6.5.1.1
データ型変換
6.5.1.2
外部ファイルへのHiveアクセス
6.5.2
関数のオンライン・マニュアル
6.5.3
xml_exists
6.5.4
xml_query
6.5.5
xml_query_as_primitive
6.5.6
xml_table
第IV部 Oracle R Advanced Analytics for Hadoop
7
Oracle R Advanced Analytics for Hadoopの使用
7.1
Oracle R Advanced Analytics for Hadoopについて
7.1.1
Oracle R Advanced Analytics for Hadoopアーキテクチャ
7.1.2
Oracle R Advanced Analytics for Hadoopパッケージおよび関数
7.1.3
Oracle R Advanced Analytics for HadoopのAPI
7.1.4
Oracle R Advanced Analytics for Hadoopへの入力
7.2
HDFSファイルへのアクセス
7.3
Apache Hiveへのアクセス
7.3.1
HiveのORCH関数
7.3.2
HiveのORE関数
7.3.3
Hiveでサポートされる一般的なR関数
7.3.4
Hiveデータ型のサポート
7.3.5
Hiveアクセスの使用上の注意
7.3.6
例: Oracle R Advanced Analytics for HadoopへのHive表のロード
7.4
Oracle Databaseへのアクセス
7.4.1
Oracle Databaseアクセスの使用上の注意
7.4.2
Oracle R EnterpriseでOracle R Advanced Analytics for Hadoopを使用する場合のシナリオ
7.5
Oracle R Advanced Analytics for Hadoop関数
7.5.1
ネイティブ分析関数
7.5.2
Hadoop Distributed File System (HDFS)の使用
7.5.3
Apache Hiveの使用
7.5.4
Hiveでの集計関数の使用
7.5.5
データベース接続の確立
7.5.6
データのコピーおよびHDFSファイルの操作
7.5.7
Rデータ型への変換
7.5.8
MapReduceの使用
7.5.9
スクリプトのデバッグ
7.6
Oracle R Advanced Analytics for Hadoop関数のデモ
7.7
Oracle R Advanced Analytics for Hadoopのセキュリティ上の注意
索引