Big Data Discoveryのバックアップ戦略

データの安全を確保するために、システムをバックアップすることをお薦めします。

手動でコールド・バックアップを実行する必要があります。コールド・バックアップは、プロジェクト・データ・セット、Studioデータベースおよびサンプル・ファイルの同期を維持していることを保証します。これには、少なくとも、DgraphおよびHDFSエージェントがバックアップ・プロシージャで収集を実行しなくて済むようにするためにこれらを停止することが含まれます。

バックアップする必要があるリソースと、その場所について、次で説明します。

この表では、バックアップする必要があるリソースと、その場所について説明します。
リソース 場所 説明/注意

dateFormats.txt

edp_classpath.txt

logging.properties

sparkContext.properties

spark_worker_files.txt

data_processing_CLIファイルのhdfsEdpLibPathプロパティで定義されているHDFS上の場所。デフォルトでは、これは/user/bdd/edp/libです。 これらのファイルには、システムに固有の構成設定が含まれています。
/dataSwamp data_processing_CLIファイルのedpDataDirプロパティで定義されているHDFS上の場所。デフォルトでは、これは/user/bdd/edp/dataです。 このディレクトリには、サンプル・データ・セットのAvroファイルが含まれています。
データ処理ログ・ファイル(edpLog*.log) data_processing-CLIファイルのedpJarDirプロパティで定義されている各ノード上の場所。デフォルトでは、これは/opt/bdd/edp/dataです。 データ処理ログ・ファイルは、データ処理ジョブに関与する各ノード上にあります。これらには、ジョブを起動したクライアント(CLI、Hive表ディテクタまたはStudioを実行しているノードになります)、Oozieワーカー・ノードまたはSparkワーカー・ノードが含まれます。
Studioデータベース バックアップ手順は、データベースのドキュメントを参照してください。
$MW_HOME bdd.confORACLE_HOMEプロパティで定義されている場所。デフォルトでは、これは/localdisk/Oracle/Middlewareです。 クラスタ内の管理サーバー・ノードおよび各管理対象サーバー・ノード上で、この場所をバックアップします。
$DOMAIN_HOME StudioおよびWebLogicドメインのルート・ディレクトリ。デフォルトでは、これは$MW_HOME/user_projects/domains/bdd_domainです。 クラスタ内の管理サーバー・ノードおよび各管理対象サーバー・ノード上で、この場所をバックアップします。
Dgraph索引 bdd.confファイルのDGRAPH_INDEX_DIRおよびDGRAPH_INDEX_NAMEプロパティで定義されているNFS上の場所。 この場所には、すべてのデータ・セットの索引が含まれています。
/endeca-cluster znode ZooKeeper バックアップ手順は、Clouderaのドキュメントを参照してください。
HDFSおよび他のHadoopリソース バックアップ手順は、Clouderaのドキュメントを参照してください。