ヘッダーをスキップ
Oracle® Big Data Applianceソフトウェア・ユーザーズ・ガイド
リリース2 (2.3)
E48217-03
索引
次
目次
タイトルおよび著作権情報
はじめに
対象読者
ドキュメントのアクセシビリティについて
関連ドキュメント
表記規則
1
Oracle Big Data Applianceの概要
1.1
ビッグ・データとは
1.1.1
多様性
1.1.2
高い複雑性
1.1.3
大量
1.1.4
高速度
1.2
Oracleのビッグ・データ・ソリューション
1.3
ビッグ・データ用のソフトウェア
1.3.1
ソフトウェア・コンポーネントの概要
1.4
分析用データの取得
1.4.1
Hadoop Distributed File System
1.4.2
Hive
1.4.3
Oracle NoSQL Database
1.5
ビッグ・データの体系化
1.5.1
MapReduce
1.5.2
ビッグ・データに対するRのサポート
1.5.3
Oracle Big Data Connectors
1.5.3.1
Oracle SQL Connector for Hadoop Distributed File System
1.5.3.2
Oracle Loader for Hadoop
1.5.3.3
Oracle XQuery for Hadoop
1.5.3.4
Oracle R Advanced Analytics for Hadoop
1.5.3.5
Oracle Data Integrator Application Adapter for Hadoop
1.6
ビッグ・データの分析と視覚化
2
Oracle Big Data Applianceの管理
2.1
Oracle Enterprise Managerを使用したクラスタの監視
2.1.1
Enterprise Manager Webインタフェースの使用
2.1.2
Enterprise Managerコマンドライン・インタフェースの使用
2.2
Cloudera Managerを使用したCDH操作の管理
2.2.1
Oracle Big Data Applianceのステータスの監視
2.2.2
管理タスクの実行
2.2.3
Cloudera Managerを使用したサービスの管理
2.3
Hadoop監視ユーティリティの使用方法
2.3.1
JobTrackerの監視
2.3.2
TaskTrackerの監視
2.4
Cloudera Hueを使用したHadoopの操作
2.5
Oracle Big Data Applianceソフトウェアについて
2.5.1
ソフトウェア・コンポーネント
2.5.2
論理ディスク・レイアウト
2.6
CDHソフトウェア・サービスについて
2.6.1
CDHサービスの監視
2.6.2
CDHサービスの実行場所
2.6.2.1
シングル・ラックでのサービス・ロケーション
2.6.2.2
マルチラック・クラスタでのサービス・ロケーション
2.6.3
NameNodeの自動フェイルオーバー
2.6.4
JobTrackerの自動フェイルオーバー
2.6.5
未構成のソフトウェア
2.6.6
MapとReduceのリソース構成
2.7
ソフトウェアの可用性に与えるハードウェアの影響
2.7.1
クリティカル・ノードと非クリティカル・ノード
2.7.2
第1 Namenode
2.7.3
第2 NameNode
2.7.4
第1 JobTracker
2.7.5
第2 JobTracker
2.7.6
非クリティカル・ノード
2.8
Oracle Big Data Applianceのセキュリティ
2.8.1
事前定義済のユーザーおよびグループについて
2.8.2
ユーザー認証について
2.8.3
Oracle Big Data Applianceで使用されるポート番号
2.8.4
Puppetのセキュリティについて
2.9
Oracle Big Data Applianceの監査
2.9.1
Oracle Audit Vault and Database Firewallについて
2.9.2
Oracle Big Data Applianceプラグインの設定
2.9.3
Oracle Big Data Applianceの監視
2.10
オラクル社カスタマ・サポートに提供する診断情報の収集
3
Oracle Big Data Applianceへのユーザー・アクセスのサポート
3.1
Kerberosで保護されたクラスタへのアクセスについて
3.2
CDHへのリモート・クライアント・アクセスの提供
3.2.1
前提条件
3.2.2
Oracle Exadata Database MachineでのCDHのインストール
3.2.3
サポートされているすべてのオペレーティング・システムにCDHクライアントをインストールする
3.2.4
保護されていないクラスタ用のCDHクライアントの構成
3.2.5
Kerberosで保護されたクラスタ用のCDHクライアントの構成
3.2.6
CDHクライアントからクラスタへのアクセス権の確認
3.3
Hiveへのリモート・クライアント・アクセスの提供
3.4
ユーザー・アカウントの管理
3.4.1
Hadoopクラスタ・ユーザーの作成
3.4.1.1
保護されていないクラスタでのユーザーの作成
3.4.1.2
保護されたクラスタでのユーザーの作成
3.4.2
ユーザー・ログイン権限の付与(オプション)
3.5
削除されたファイルのリカバリ
3.5.1
ごみ箱からのファイルのリストア
3.5.2
ごみ箱を空にする間隔の変更
3.5.3
ごみ箱機能の無効化
3.5.3.1
ごみ箱機能の完全な無効化
3.5.3.2
ローカルのHDFSクライアントのごみ箱機能の無効化
3.5.3.3
リモートのHDFSクライアントのごみ箱機能の無効化
4
Perfect Balanceを使用したMapReduceジョブの最適化
4.1
Perfect Balanceとは
4.1.1
マップおよびリデュース・タスク間でのジョブの均衡化について
4.1.2
Perfect Balance機能の使用方法
4.1.3
Perfect Balanceのコンポーネント
4.2
アプリケーション要件
4.3
Perfect Balanceの概要
4.4
Perfect Balanceの例について
4.4.1
この章の例について
4.4.2
例データ・セットの抽出
4.5
不均衡なリデューサ・ロードに対するジョブの分析
4.5.1
Job Analyzerについて
4.5.1.1
Job Analyzerの実行方法
4.5.2
Job Analyzerをスタンドアロン・ユーティリティとして実行する
4.5.2.1
Job Analyzerユーティリティの例
4.5.2.2
Job Analyzerユーティリティの構文
4.5.3
Perfect Balanceを使用したJob Analyzerの実行
4.5.3.1
Perfect Balance Automatic InvocationによるJob Analyzerの実行
4.5.3.2
Perfect Balance APIを使用したJob Analyzerの実行
4.5.3.3
追加メトリックの収集
4.5.4
Job Analyzerレポートの分析
4.6
均衡のとれたMapReduceジョブの実行
4.6.1
Perfect Balance Automatic Invocationの使用
4.6.2
Perfect Balance APIの使用
4.6.2.1
Perfect Balanceを使用するためのJavaコードの変更
4.6.2.2
変更したJavaコードとPerfect Balanceの実行
4.7
Perfect Balanceレポートについて
4.8
Perfect Balanceで実行されているジョブのトラブルシューティング
4.8.1
Javaの「GC Overhead Limit Exceeded」エラー
4.8.2
Javaの「Out of Heap Space」エラー
4.9
Perfect Balanceの構成について
4.10
Perfect Balance構成プロパティ・リファレンス
5
Oracle Big Data Applianceと併用するためのOracle Exadata Database Machineの構成
5.1
通信の最適化について
5.1.1
Oracle Exadata Database Machineにデータをプルするアプリケーションについて
5.1.2
Oracle Exadata Database Machineにデータをプッシュするアプリケーションについて
5.2
前提条件
5.3
Oracle Big Data Applianceへのインフィニバンド接続の指定
5.4
Oracle Exadata Database Machineへのインフィニバンド接続の指定
5.5
Exadata DatabaseノードでのSDPの有効化
5.6
SDPを使用するためのJDBCクライアントの構成
5.7
インフィニバンド・ネットワーク上でのSDPリスナーの作成
用語集
索引