1 Oracle Big Data Managerの概要
Oracle Big Data Managerを使用すると、データ・ソース間でのデータのコピーが簡単になります。
Oracle Big Data Managerとは
Oracle Big Data Managerは、企業全体のデータを管理するための広範な機能を提供するブラウザベースのツールです。これを使用すると、Oracle Database、Oracle Object Store、MySQLに加えてHadoop、S3、GitHubなど広範なサポート対象のOracleおよびOracle以外のデータ記憶域プロバイダへの接続および相互接続が可能になります。Big Data Managerに記憶域プロバイダを登録すると、データのプレビューが可能になります。また、記憶域プロバイダごとのアクセシビリティに応じて、それらのデータの比較、コピーおよび移動も可能になります。Hadoop記憶域プロバイダを使用すると、HDFS内での内部的なデータの移動や、Apache Zeppelinによるデータのインポート/エクスポートおよび分析の実行、Hive表へのデータのインポートも実行できます。さらに、選択した記憶域プロバイダにローカル・コンピュータからデータをアップロードすることもできます。
Oracle Big Data Managerには、データ転送のための複数の方法が用意されています。コンソールを使用できます(ドラッグ・アンド・ドロップによるデータの選択もできます)。データ管理のスクリプトとアプリケーションの作成に、PythonとJava SDKを使用できます。さらに、データ管理ジョブの作成および管理のためのCLIと、ジョブ・ステータスのモニタリング用のツールもあります。
Oracle Big Data Manager管理者は、別のユーザー・アカウントを作成して、そのアカウントにロールを割り当てることができます。
機能のサマリー
Oracle Big Data Manager機能の完全なリストは、次のとおりです。
-
Oracle Big Data Managerコンソール(ブラウザベースのGUIからアクセスできます)。
-
次の用途のグラフィカル・ツール:
-
記憶域プロバイダ間での比較、コピーおよび移動。
-
ファイルのアップロード、ZIPアーカイブからのデータの抽出、Oracle DatabaseおよびMySQLデータベース内のデータの参照。
-
ジョブのスケジュール設定、管理、モニタリング、コピー、移動および比較。
-
Apache Hiveへのデータのインポート。
-
Apache Zeppelinノートのインポートとエクスポートおよびノートの作成と実行。
-
記憶域プロバイダ、ユーザーおよびロールの管理。
-
クラスタの正常性とそのクラスタで実行中のサービスのモニタリング。
-
Apache Zeppelinノートを介したデータの処理および分析。
-
-
bdm-cli
ユーティリティ(コマンドラインからのデータのコピーおよびコピー・ジョブの管理に使用)。 -
PythonおよびJava SDK (Oracle Big Data Managerの操作をアプリケーションに統合するために使用)。
サポートされている記憶域プロバイダ
Oracle Big Data Managerは次の記憶域プロバイダをサポートしています。ただし、プロバイダによってはサポートされていないタスクもあります。
-
Hadoop Distributed File System (HDFS)
-
Oracle Cloud Infrastructure Object Storage Classic
-
Amazon Simple Storage Service (S3)
-
Github
-
Oracle Database
-
Apache Hive
-
MySQL database
Oracle Big Data Managerのインストールと構成の方法
Oracle Big Data Managerは、Oracle Big Data Applianceソフトウェア・リリースのMammothインストールによって自動的にインストールされます。デフォルトでは、Cloudera Configuration Managerが稼働するノードと同じノードにインストールされます(通常はノード3)。記憶域プロバイダの登録以外に、手動による構成は必要ありません。
デフォルト・ポートは8890です。管理アカウントのデフォルト・パスワードは、Configuration Managerのパスワードと同じです。これらは、<cluster name>-config.json
ファイル内のBDP_PWD
パラメータとBDM_PORT
パラメータで指定されています。このファイルは、Oracle Big Data Appliance構成生成ユーティリティを使用してクラスタとラックの構成を定義したときに生成される出力の1つです。
関連項目:
『Oracle Big Data Applianceオーナーズ・ガイド』のOracle Big Data Appliance構成ユーティリティの使用方法に関する章に、Mammothインストール・パラメータが含まれている<cluster name>-config.json
の説明が記載されています。
ノート:
Oracle Big Data Managerでは、AD Kerberosがサポートされるようになりました。また、クラスタ内または外にKDCがあるMIT Kerberosもサポートされます。