ヘッダーをスキップ
Oracle® Big Data Applianceソフトウェア・ユーザーズ・ガイド
リリース2 (2.2.1)
E48217-02
索引
次
目次
タイトルおよび著作権情報
はじめに
対象読者
ドキュメントのアクセシビリティについて
関連ドキュメント
表記規則
1
Oracle Big Data Applianceの概要
1.1
ビッグ・データとは
1.1.1
多様性
1.1.2
高い複雑性
1.1.3
大量
1.1.4
高速度
1.2
Oracleのビッグ・データ・ソリューション
1.3
ビッグ・データ用のソフトウェア
1.3.1
ソフトウェア・コンポーネントの概要
1.4
分析用データの取得
1.4.1
Hadoop Distributed File System
1.4.2
Hive
1.4.3
Oracle NoSQL Database
1.5
ビッグ・データの体系化
1.5.1
MapReduce
1.5.2
ビッグ・データに対するRのサポート
1.5.3
Oracle Big Data Connectors
1.5.3.1
Oracle SQL Connector for Hadoop Distributed File System
1.5.3.2
Oracle Loader for Hadoop
1.5.3.3
Oracle R Connector for Hadoop
1.5.3.4
Oracle Data Integrator Application Adapter for Hadoop
1.6
ビッグ・データの分析と視覚化
2
Oracle Big Data Applianceの管理
2.1
Oracle Enterprise Managerを使用したクラスタの監視
2.1.1
Enterprise Manager Webインタフェースの使用
2.1.2
Enterprise Managerコマンドライン・インタフェースの使用
2.2
Cloudera Managerを使用したCDH操作の管理
2.2.1
Oracle Big Data Applianceのステータスの監視
2.2.2
管理タスクの実行
2.2.3
Cloudera Managerを使用したサービスの管理
2.3
Hadoop監視ユーティリティの使用方法
2.3.1
JobTrackerの監視
2.3.2
TaskTrackerの監視
2.4
Hueを使用したHadoopの操作
2.5
Oracle Big Data Applianceソフトウェアについて
2.5.1
ソフトウェア・コンポーネント
2.5.2
論理ディスク・レイアウト
2.6
CDHソフトウェア・サービスについて
2.6.1
CDHサービスの監視
2.6.2
CDHサービスの実行場所
2.6.2.1
シングル・ラックでのサービス・ロケーション
2.6.2.2
マルチラック・クラスタでのサービス・ロケーション
2.6.3
NameNodeの自動フェイルオーバー
2.6.4
JobTrackerの自動フェイルオーバー
2.6.5
未構成のソフトウェア
2.6.6
MapとReduceのリソース構成
2.7
HBaseの構成
2.8
ソフトウェアの可用性に与えるハードウェアの影響
2.8.1
クリティカル・ノードと非クリティカル・ノード
2.8.2
第1 Namenode
2.8.3
第2 NameNode
2.8.4
第1 JobTracker
2.8.5
第2 JobTracker
2.8.6
非クリティカル・ノード
2.9
オラクル社カスタマ・サポートに提供する診断情報の収集
2.10
Oracle Big Data Applianceのセキュリティ
2.10.1
事前定義済のユーザーおよびグループについて
2.10.2
Oracle Big Data Applianceで使用されるポート番号
2.10.3
Kerberosを使用したCDHセキュリティについて
2.10.4
Puppetのセキュリティについて
3
Oracle Big Data Applianceへのユーザー・アクセスのサポート
3.1
CDHへのリモート・クライアント・アクセスの提供
3.1.1
前提条件
3.1.2
Oracle Exadata Database MachineでのCDHのインストール
3.1.3
サポートされているすべてのオペレーティング・システムにCDHクライアントをインストールする
3.1.4
CDHの構成
3.2
ユーザー・アカウントの管理
3.2.1
Hadoopクラスタ・ユーザーの作成
3.2.2
ユーザー・ログイン権限の付与(オプション)
3.3
削除されたファイルのリカバリ
3.3.1
ごみ箱からのファイルのリストア
3.3.2
ごみ箱を空にする間隔の変更
3.3.3
ごみ箱機能の無効化
3.3.3.1
ごみ箱機能の完全な無効化
3.3.3.2
ローカルのHDFSクライアントのごみ箱機能の無効化
3.3.3.3
リモートのHDFSクライアントのごみ箱機能の無効化
4
Perfect Balanceを使用したMapReduceジョブの最適化
4.1
Perfect Balanceとは
4.1.1
マップおよびリデュース・タスク間でのジョブの均衡化について
4.1.2
Perfect Balanceの実行方法
4.1.3
Perfect Balanceのコンポーネント
4.2
Perfect Balanceの概要
4.3
Perfect Balanceの例について
4.3.1
この章の例について
4.3.2
例データ・セットの抽出
4.4
不均衡なリデューサ・ロードに対するジョブの分析
4.4.1
Job Analyzerについて
4.4.1.1
Job Analyzerの実行方法
4.4.2
Job Analyzerをスタンドアロン・ユーティリティとして実行する
4.4.2.1
Job Analyzerユーティリティの例
4.4.2.2
Job Analyzerユーティリティの構文
4.4.3
Job AnalyzerをPerfect Balance Driverとともに実行する
4.4.3.1
Job Analyzerの例
4.4.3.2
追加メトリックの収集
4.4.4
Job Analyzerレポートの分析
4.5
均衡のとれたMapReduceジョブの実行
4.5.1
Perfect Balanceドライバの使用
4.5.2
Perfect Balance APIの使用
4.5.2.1
Perfect Balanceを使用するためのJavaコードの変更
4.5.2.2
変更したJavaコードとPerfect Balanceの実行
4.6
Perfect Balanceレポートについて
4.7
Perfect Balanceの構成について
4.8
Perfect Balance構成プロパティ・リファレンス
5
Oracle Big Data Applianceと併用するためのOracle Exadata Database Machineの構成
5.1
通信の最適化について
5.1.1
Oracle Exadata Database Machineにデータをプルするアプリケーションについて
5.1.2
Oracle Exadata Database Machineにデータをプッシュするアプリケーションについて
5.2
前提条件
5.3
Oracle Big Data Applianceへのインフィニバンド接続の指定
5.4
Exadata DatabaseノードでのSDPの有効化
5.5
SDPを使用するためのJDBCクライアントの構成
5.6
インフィニバンド・ネットワーク上でのSDPリスナーの作成
用語集
索引