データの安全を確保するために、システムをバックアップすることをお薦めします。
手動でコールド・バックアップを実行する必要があります。コールド・バックアップは、プロジェクト・データ・セット、Studioデータベースおよびサンプル・ファイルの同期を維持していることを保証します。これには、少なくとも、DgraphおよびHDFSエージェントがバックアップ・プロシージャで収集を実行しなくて済むようにするためにこれらを停止することが含まれます。
バックアップする必要があるリソースと、その場所について、次で説明します。
| リソース | 場所 | 説明/注意 |
|---|---|---|
|
dateFormats.txt edp_classpath.txt logging.properties sparkContext.properties spark_worker_files.txt |
data_processing_CLIファイルのhdfsEdpLibPathプロパティで定義されているHDFS上の場所。デフォルトでは、これは/user/bdd/edp/libです。 | これらのファイルには、システムに固有の構成設定が含まれています。 |
| /dataSwamp | data_processing_CLIファイルのedpDataDirプロパティで定義されているHDFS上の場所。デフォルトでは、これは/user/bdd/edp/dataです。 | このディレクトリには、サンプル・データ・セットのAvroファイルが含まれています。 |
| データ処理ログ・ファイル(edpLog*.log) | data_processing-CLIファイルのedpJarDirプロパティで定義されている各ノード上の場所。デフォルトでは、これは/opt/bdd/edp/dataです。 | データ処理ログ・ファイルは、データ処理ジョブに関与する各ノード上にあります。これらには、ジョブを起動したクライアント(CLI、Hive表ディテクタまたはStudioを実行しているノードになります)、Oozieワーカー・ノードまたはSparkワーカー・ノードが含まれます。 |
| Studioデータベース | バックアップ手順は、データベースのドキュメントを参照してください。 | |
| $MW_HOME | bdd.confのORACLE_HOMEプロパティで定義されている場所。デフォルトでは、これは/localdisk/Oracle/Middlewareです。 | クラスタ内の管理サーバー・ノードおよび各管理対象サーバー・ノード上で、この場所をバックアップします。 |
| $DOMAIN_HOME | StudioおよびWebLogicドメインのルート・ディレクトリ。デフォルトでは、これは$MW_HOME/user_projects/domains/bdd_domainです。 | クラスタ内の管理サーバー・ノードおよび各管理対象サーバー・ノード上で、この場所をバックアップします。 |
| Dgraph索引 | bdd.confファイルのDGRAPH_INDEX_DIRおよびDGRAPH_INDEX_NAMEプロパティで定義されているNFS上の場所。 | この場所には、すべてのデータ・セットの索引が含まれています。 |
| /endeca-cluster znode | ZooKeeper | バックアップ手順は、Clouderaのドキュメントを参照してください。 |
| HDFSおよび他のHadoopリソース | バックアップ手順は、Clouderaのドキュメントを参照してください。 |