すべてのBDDCSコンポーネントが正常に実行されていることを確認するには、Studioにログインし、CSVファイルをアップロードしてデータ・セットを追加します。 Studioカタログおよび「探索」のページで監視します。
BDDCSの次の2つのユーザー・インタフェースを区別するために役立ちます:
- BDDCSコンソールでは、インスタンスを起動および停止したり、バックアップの構成や実行など、他のライフ・サイクル操作を実行できます。 ここからStudioにもログインします。
- Studioでは、データをロード、探索、変換およびビジュアル化します。 (データのロードを自動化するには、BDDCSのデータ処理CLIを使用します)。
ファイルから個人データをアップロードすることによって、Studioで新しいデータ・セットを作成できます。 Studioでは、Microsoft Excelファイル、CSV、TSV、TXTなどの区切りファイル、およびZIP、GZ、GZIPなどの圧縮ファイルがサポートされます。 圧縮ファイルには、区切りファイルが1つしか含まれていない場合があります。 アップロード後、データはStudioカタログでデータ・セットとして使用できます。
- BDDCSコンソールで、インスタンスのステータスがUPであることを確認します。 これは、すべてのBDDCSコンポーネントが実行中であることを示します。
- 相対的に使用可能なCSVファイルを検索します。 数MBのサイズのファイルは十分に機能します。
- ファイルを任意のBDCSノードのローカル・ストレージにコピーし、HDFS
put
コマンドを使用してHDFSにコピーします。
- Studioにログインします。 「BDDCS Studioを開く」をクリックし、Studio管理ユーザーの電子メールとパスワードを入力します。 「Studioへのアクセス」を参照してください。
- Studioで、CSVファイルをロードします:
- Studioカタログに移動し、「データ・セットの追加」をクリックします。
- 「ファイルからのデータ・セットの作成」、「参照」の順にクリックします。
- ファイルを見つけて「開く」をクリックし、「次」をクリックします。
- 「プレビュー」ページで、必要に応じて変更します。 たとえば、データ・セットから属性を除外し、属性の名前を変更し、ヘッダー行を指定し、オプションでアップロード済ファイル(データを制限する)から行を省略し、デリミタ、引用符、言語およびエンコード設定も指定できます。
- 「次へ」をクリックします。 「データ・セットの作成」が開いたら、その詳細を指定して「作成」をクリックします。 Studioは、アップロードしたファイルに基づいて新しいデータ・セットを作成します。 Studioでは、データ・セット名は、BDDによって作成される一意のHive表名にマップされます。 データ・セットがカタログに表示されます。
その結果、データ・セットはBDDCS Studioに追加されました。 ファイルが正常にアップロードされた場合、これにより、Big Data Discoveryのデータ処理コンポーネントが正常に実行されていることが確認されます。 DgraphおよびHDFSエージェント・コンポーネントも正常に実行されています。
Studioを使用して最初のデータをBDDCSにロードしたので、Studioを使用してデータを探索および分析する方法や、より多くのデータをロードして更新する方法について理解します。