データベースのデータ・ソースへの接続

データベース接続の作成、編集および削除や、接続の使用によるデータベースからのデータ・セットの作成ができます。

データベース接続の作成

データベースへの接続を作成し、その接続を使用してデータにアクセスできます。

  1. 「ホーム」ページで、「作成」「接続」の順にクリックします。
  2. 「接続の作成」ダイアログで、接続を作成する接続タイプのアイコンをクリックします(「Oracle Database」など)。
  3. 新しい接続の名前を入力し、ホスト、ポート、ユーザー名、パスワード、サービス名などの必要な接続情報を入力します。
     

    Oracle DatabaseへのSSL接続を作成する場合は、「クライアント・ウォレット」フィールドで「選択」をクリックし、cwallet.ssoファイルを参照します。cwallet.ssoファイルの場所については、管理者に問い合せてください。

  4. (オプション)一部のデータベース・タイプ(たとえば、Oracle Talent Acquisition Cloud)に接続する場合は、「接続の作成」および「検査」ダイアログで、次の認証オプションを指定する必要があります。
    • 「常にこれらの資格証明を使用」を選択すると、接続のため指定したログイン名とパスワードが常に使用され、ユーザーがログインするよう求められることはありません。
    • データ・ソースに対する自分のユーザー名とパスワードを入力するようユーザーに求めるには、「ユーザーは自分の資格証明の入力が必要」を選択します。ログインが必要なユーザーには、表示のための権限およびロールが割り当てられているデータのみが表示されます。
  5. 「保存」をクリックします。
    これで、接続からのデータ・セットの作成を開始できるようになりました。

    データ・フローのデータ・セットの保存にリモート接続を使用することはできません。

Kerberos認証のあるデータベース接続に必要なZIPファイルの作成

Kerberos認証を使用するSSL接続を作成するには、特定の構成ファイルを含むZIPファイルが必要です。

zipファイルには、次のファイルが含まれるkerberosという名前のディレクトリが必要です。
  • kerberos/krb5conf
  • kerberos/oac.keytab
  • kerberos/service_details.json
  1. データベース管理者からKerberos構成ファイルを取得します(Apache Hiveへの接続用など)。

    状況に応じてファイルを作成または変更する必要があります。

  2. Kerberos構成ファイルを格納するkerberosという名前のフォルダを作成します。
  3. 作成したkerberosフォルダにkrb5confファイルをコピーします。
  4. .keytabファイルの名前がoac.keytabであることを確認して(必要であれば名前を変更します)、作成したフォルダにそのファイルをコピーします。
  5. service_details.jsonファイルを取得または作成して、作成したフォルダに保存します。
    service_details.jsonファイルには、次のようにHost、PortおよびServicePrincipalNameの値が含まれる必要があります:
    {
     "Host" : "myHost.com",
     "Port" : "10000",
     "ServicePrincipalName" : "hive/myHostDB.com@BDA.COM",
    }

    すべてのパラメータ値を引用符で囲む必要があります("value")。

  6. フォルダに追加した3つのファイルを含むZIPファイルを作成し、適切な名前を付けます(SSLKerberos.ZIPなど)。

    これで、Kerberos認証のあるデータベース接続を作成できます。

Kerberos認証のあるデータベース接続の作成

Kerberosネットワーク認証プロトコルを使用するように、選択したデータベース接続を構成できます。

次のデータベース接続タイプでKerberos認証がサポートされます:

  • Apache Hive
  • Hortonworks Hive
  • IBM BigInsights Hive
  • MapR Hive
  • Pivotal HD Hive
  1. 「ホーム」ページで、「作成」をクリックしてから「接続」をクリックします。
  2. 「接続の作成」ダイアログで、「Apache Hive」などの接続タイプのアイコンをクリックします。
  3. 「認証タイプ」をクリックし、「Kerberosの使用」を選択します。
  4. 「クライアント資格証明」フィールドで、準備したZIPまたはCONFファイルをドラッグ・アンド・ドロップするか、「選択」をクリックして参照します。
    次のいずれかを実行して、SSLまたは非SSL接続用の適切な構成ファイルを取得します:
  5. ZIPファイルを追加した場合、ZIPパスワード・フィールドにZIPパスワードを入力します。
  6. krb5confファイルを追加した場合、「Keytab」フィールドで、oac.keytabファイルをドラッグ・アンド・ドロップするか、「選択」をクリックして参照します。
    「ホスト」「ポート」および「サービス・プリンシパル」フィールドには、service_details.jsonファイルから取得された値が自動的に表示されます。
  7. SSL接続を作成する場合、「SSLの有効化」をクリックしてSSLを使用する接続を有効化します。
  8. 「保存」をクリックします。

データベースからのデータ・セットの作成

データベース接続を作成した後は、これらの接続を使用してデータ・セットを作成できます。

データベース接続のデータ・セットを作成する前に、データベース接続を作成する必要があります。
  1. 「ホーム」ページで、「作成」「データ・セット」の順にクリックします。「データ・セットの作成」ダイアログで、「接続の作成」を選択してデータ・セットの接続の詳細を指定します。
  2. データ・セット・エディタで、スキーマを参照または検索してダブルクリックしてから、データ・セット内で使用する表を選択します。表をダブルクリックして選択すると、列のリストが表示されます。
    ブレッドクラムを使用して、表またはスキーマ・リストにすばやく移動できます。
  3. 列のリストで、データ・セットに含める列を参照または検索します。[Shift]キーまたは[Ctrl]キーを押しながらクリックすると、複数の列を選択できます。
    あるいは、「SQLの入力」オプションを選択して、データ・ソースのSQL文を参照または変更するか、SQL文を記述できます。
  4. 「追加」をクリックします。データ・ソースの表示ページが表示されます。
  5. オプションで、データ・ソースの表示ページで列のプロパティを表示し、その書式設定を指定できます。列のタイプによって、使用可能な書式設定オプションが決まります。

データベース接続の編集

データベース接続の詳細を編集できます。

  1. 「データ」ページで、「接続」をクリックします。
  2. 編集する接続を選択し、「アクション・メニュー」をクリックするか、右クリックし、「検査」を選択します。
  3. 「検査」ダイアログで、接続の詳細を編集します。
  4. 「保存」をクリックします。

Oracle DatabaseへのSSL接続を編集しており、新しいcwallet.ssoファイルを使用する必要がある場合は、「クライアント・ウォレット」フィールドで「選択」をクリックし、cwallet.ssoファイルを参照します。cwallet.ssoファイルの場所については、管理者に問い合せてください。

一意の「接続名」を入力する必要があります。同じ名前の接続がシステムにすでに存在する場合、エラー・メッセージが表示されます。接続の現在のパスワードを表示または編集することはできません。変更する必要がある場合は、同じパスワードを使用する接続を作成する必要があります。

データベース接続の削除

データベース接続を削除できます。たとえば、データベースのパスワードが変更された場合は、データベース接続を削除し、新しい接続を作成する必要があります。

接続にデータ・セットが含まれている場合は、接続を削除する前にそれらのデータ・セットを削除する必要があります。

  1. 「データ」ページに移動し、「接続」を選択します。
  2. 削除する接続を選択し、「アクション・メニュー」メニューをクリックするか、右クリックし、「削除」をクリックします。
  3. 「はい」をクリックします。

データベースへの接続の指定について

「接続の作成」/「接続の編集」ダイアログを使用して接続の詳細を指定する場合、一部のデータベース・タイプには追加のオプションがあります。

  • Oracle Databaseへの接続を作成する場合は、「接続タイプ」オプションを使用して、2つの方法で接続できます。
    • 基本 - データベースの「ホスト」「ポート」および「サービス名」を指定します。
    • 拡張 - 「接続文字列」フィールドで、RACクラスタで実行されているデータベースの単一クライアント・アクセス名(SCAN) IDを指定します。次に例を示します。

      sales.example.com =(DESCRIPTION= (ADDRESS_LIST= (LOAD_BALANCE=on)(FAILOVER=ON) (ADDRESS=(PROTOCOL=tcp)(HOST=123.45.67.111)(PORT=1521)) (ADDRESS=(PROTOCOL=tcp)(HOST=123.45.67.222)(PORT=1521)) (ADDRESS=(PROTOCOL=tcp)(HOST=123.45.67.333)(PORT=1521))) (CONNECT_DATA=(SERVICE_NAME= salesservice.example.com)))

  • 一括レプリケーションの有効化 - プロジェクトのデータ・セットをロードする場合は、このオプションをオフにして一括レプリケーションを無視します。このオプションは、あるデータベースから別のデータベースにデータをレプリケーションするデータ・アナリストと上級ユーザーのために予約されています。

  • 認証

    • 「常にこれらの資格証明を使用」を選択すると、接続のため指定したログイン名とパスワードが常に使用され、ユーザーがログインするよう求められることはありません。

    • データ・ソースに対する自分のユーザー名とパスワードを入力するようユーザーに求めるには、「ユーザーは自分の資格証明の入力が必要」を選択します。ログインが必要なユーザーには、表示のための権限およびロールが割り当てられているデータのみが表示されます。