サービス・インスタンスの検証

すべてのBDDCSコンポーネントが正常に実行されていることを確認するには、Studioにログインし、CSVファイルをアップロードしてデータ・セットを追加します。 Studioカタログおよび「探索」のページで監視します。

BDDCSの次の2つのユーザー・インタフェースを区別するために役立ちます:

BDDCSコンソールでは、インスタンスを起動および停止したり、バックアップの構成や実行など、他のライフ・サイクル操作を実行できます。ここからStudioにもログインします。
Studioでは、データをロード、探索、変換およびビジュアル化します。 (データのロードを自動化するには、BDDCSのデータ処理CLIを使用します)。

ファイルから個人データをアップロードすることによって、Studioで新しいデータ・セットを作成できます。 Studioでは、Microsoft Excelファイル、CSV、TSV、TXTなどの区切りファイル、およびZIP、GZ、GZIPなどの圧縮ファイルがサポートされます。圧縮ファイルには、区切りファイルが1つしか含まれていない場合があります。アップロード後、データはStudioカタログでデータ・セットとして使用できます。

BDDCSインスタンスを確認するには:

BDDCSコンソールで、インスタンスのステータスがUPであることを確認します。これは、すべてのBDDCSコンポーネントが実行中であることを示します。
相対的に使用可能なCSVファイルを検索します。数MBのサイズのファイルは十分に機能します。
ファイルを任意のBDCSノードのローカル・ストレージにコピーし、HDFS putコマンドを使用してHDFSにコピーします。
Studioにログインします。「BDDCS Studioを開く」をクリックし、Studio管理ユーザーの電子メールとパスワードを入力します。「Studioへのアクセス」を参照してください。
Studioで、CSVファイルをロードします:
1. Studioカタログに移動し、「データ・セットの追加」をクリックします。
2. 「ファイルからのデータ・セットの作成」、「参照」の順にクリックします。
3. ファイルを見つけて「開く」をクリックし、「次」をクリックします。
4. 「プレビュー」ページで、必要に応じて変更します。たとえば、データ・セットから属性を除外し、属性の名前を変更し、ヘッダー行を指定し、オプションでアップロード済ファイル(データを制限する)から行を省略し、デリミタ、引用符、言語およびエンコード設定も指定できます。
5. 「次へ」をクリックします。「データ・セットの作成」が開いたら、その詳細を指定して「作成」をクリックします。 Studioは、アップロードしたファイルに基づいて新しいデータ・セットを作成します。 Studioでは、データ・セット名は、BDDによって作成される一意のHive表名にマップされます。データ・セットがカタログに表示されます。

その結果、データ・セットはBDDCS Studioに追加されました。ファイルが正常にアップロードされた場合、これにより、Big Data Discoveryのデータ処理コンポーネントが正常に実行されていることが確認されます。 DgraphおよびHDFSエージェント・コンポーネントも正常に実行されています。

Studioを使用して最初のデータをBDDCSにロードしたので、Studioを使用してデータを探索および分析する方法や、より多くのデータをロードして更新する方法について理解します。