データ・ソースについて
クラウド・データベース、オンプレミス・データベースなどの多くのタイプのデータ・ソースと、Dropbox、Google Drive、Amazon Hiveなどのよく使用されている多くのアプリケーションに接続できます。
Oracle Analyticsでアクセスするデータ・ソースごとに接続を作成します。接続したら、データをビジュアル化して、インサイトを作成できます。
データ・ソースは任意の表構造です。ファイルをロードする、または結果を返すサービスに問合せを送信すると、データ・ソース値を確認できます。
データ・ソースには次の列を含めることができます。
- 一致列 - 別のソースの一致列で見つかった値が含まれています。これは、このソースともう1つのソース(顧客IDや製品IDなど)を関連付けます。
- 属性列 - 個別に必要であり集計されないテキスト、日付または数字が含まれています(年、カテゴリ国、タイプ、名前など)。
- メジャー列 - 集計する必要がある値が含まれています(収益や運転距離など)。
1つのデータ・ソースのみを分析するか、データ・ソースに含まれている内容に応じて、複数のデータ・ソースを一緒に分析できます。複数のソースを一緒に使用する場合は、少なくとも1つの一致列が各ソースに存在する必要があります。一致の要件は次のとおりです。
- ソースに共通の値(顧客IDや製品IDなど)が含まれています。
- 一致は同じデータ型(たとえば、数値と数値、日付と日付、またはテキストとテキスト)である必要があります。
ワークブックを保存する場合、そのワークブックと使用される外部ソースの間で権限が同期されます。他のユーザーとワークブックを共有する場合、外部ソースもその同じユーザーと共有されます。
データ・ソースとサブジェクト領域
データ・ソースとサブジェクト領域を組み合せて、データを調査および分析できます。
サブジェクト領域は、属性を追加することでディメンションを拡張するか、またはメジャーおよびオプション属性を追加することでファクトを拡張します。データ・ソースに階層を定義することはできません。
サブジェクト領域は、属性を(多くの場合階層を使用して)ディメンションに編成し、一連のメジャーを(多くの場合複雑な計算を使用して)、ディメンション属性に対して分析できるように編成します。たとえば、現在の四半期と1年前の同じ四半期の顧客セグメント別の正味売上メジャーです。
Excelファイルなどのソースからのデータを使用する場合、ファイルはサブジェクト領域に新しい情報を追加します。たとえば、顧客の郵便番号区域または信用リスク情報に関する人口統計情報を購入し、そのデータをデータ・ウェアハウスまたは既存のサブジェクト領域に追加する前に、分析に使用する場合があります。
ソースをスタンドアロンとして使用することは、ソースからのデータがサブジェクト領域から独立して使用されることを意味します。単一のファイルのみの場合、または複数のファイルが一緒に使用される場合があり、どちらの場合もサブジェクト領域は関係しません。
データ・ソースからサブジェクト領域に属性を追加することで、ディメンションを拡張できます。
-
照合できるのは1つのディメンションに対してのみです。
-
一致した列の値のセットは、データソース内で一意です。たとえば、データ・ソースの郵便番号が一致する場合、ソース内の郵便番号は一意です。
-
1つまたは複合列の間で照合します。1列の一致の例は、製品キーと製品キーの一致です。複合列の場合の例は、会社と会社、ビジネス・ユニットとビジネス・ユニットの一致です。
-
その他の列はすべて、属性である必要があります。
データ・ソースからサブジェクト領域にメジャーを追加できます。
-
1つ以上のディメンションに対して照合します。
-
一致した列の値のセットは、データソース内で必ずしも一意であるとはかぎりません。たとえば、データ・ソースが、日付、顧客および製品が一致する売上のセットの場合、同じ日に1人の顧客に対して複数の製品の売上を設定できます。
-
1つまたは複合列の間で照合します。1列の一致の例は、製品キーと製品キーの一致です。複合列の例は、別々の列の市と州によって、顧客住所の複合City_Stateが作成される場合です。
メジャーを追加するデータ・ソースには属性を含めることができます。これらの属性は外部メジャーとともに使用可能であり、ビジュアライゼーション内のキュレートされたメジャーとともに使用することはできません。たとえば、新規事業の売上高を含むソースを追加する場合、これらの新規事業の売上は既存の時間ディメンションと一致させることのみ可能です。データには、この新規事業で販売された製品に関する情報が含まれている場合があります。既存事業の売上と新規事業の売上を時間ごとに表示できますが、古い事業の収益を新規事業の製品で表示する、または新規事業の収益を古い事業の製品で表示することはできません。新規事業の売上を時間別および新規事業の製品別に表示することはできます。
データ・ソースとメジャー列
メジャー列があるデータ・ソースとメジャー列がないデータ・ソースのいずれかを操作できます。
-
メジャーがある表を、メジャー、ディメンションまたはその両方がある他の表と照合できます。
-
表をメジャーがある他の表と照合する場合、同じ粒度である必要はありません。たとえば、日次売上表の表を四半期別売上表と照合できます。
メジャーがない表はディメンションとして処理されます。
-
照合は、単一列または複合列の間で実行できます。単一列の一致は、別の表の製品キーと一致する表の製品キーの場合である可能性があります。複合列の一致は、一方の表の会社およびビジネス・ユニットが他方の表の会社およびビジネス・ユニットと一致する場合である可能性があります。
-
その他の列はすべて、属性である必要があります。
ディメンション表は、他のディメンションと照合するか、メジャーを持つ表と照合できます。たとえば、顧客の属性を持つ表は、人口統計の属性を持つ表と照合できます(両方のディメンションに一意の顧客キー列および人口統計キー列がある場合)。
データベース接続のオプション
「接続の作成」ダイアログまたは「検査」ダイアログを使用して接続詳細を指定する際、一部のデータベース・タイプには追加のオプションがあります。
一般オプション
- Oracle Databaseへの接続を作成する場合は、「接続タイプ」オプションを使用して、2つの方法で接続できます。
- 基本 - データベースの「ホスト」、「ポート」および「サービス名」を指定します。
- 拡張 - 「接続文字列」フィールドで、RACクラスタで実行されているデータベースの単一クライアント・アクセス名(SCAN) IDを指定します。次に例を示します。
sales.example.com =(DESCRIPTION= (ADDRESS_LIST= (LOAD_BALANCE=on)(FAILOVER=ON) (ADDRESS=(PROTOCOL=tcp)(HOST=123.45.67.111)(PORT=1521)) (ADDRESS=(PROTOCOL=tcp)(HOST=123.45.67.222)(PORT=1521)) (ADDRESS=(PROTOCOL=tcp)(HOST=123.45.67.333)(PORT=1521))) (CONNECT_DATA=(SERVICE_NAME= salesservice.example.com)))
-
一括レプリケーションの有効化 - ワークブックのデータセットをロードする場合は、このオプションをオフにして一括レプリケーションを無視します。このオプションは、あるデータベースから別のデータベースにデータをレプリケーションするデータ・アナリストと上級ユーザーのために予約されています。
認証オプション
- 常にこれらの資格証明を使用 - Oracle Analyticsでは、接続に指定したログイン名とパスワードが常に使用されます。ユーザーはログインを求められません。
- ユーザーは自分の資格証明の入力が必要 - Oracle Analyticsでは、データ・ソースに対する自分のユーザー名とパスワードを入力するようユーザーに求めます。ユーザーは、権限およびロールが割り当てられているデータにのみアクセスできます。
- (Oracle Analyticsでこのデータベース・タイプに対して偽装がサポートされている場合に表示)アクティブなユーザーの資格証明を使用 - Oracle Analyticsでは、ユーザーは、データにアクセスするためにサインインするよう求められません。Oracle Analyticsへのサインインに使用したものと同じ資格証明が、このデータ・ソースへのアクセスにも使用されます。
データベース接続の制限
データベース接続を作成する前に、データベース接続要件を理解します。
Oracle Analyticsに表示されるデータベース表の最大数は10,000です。追加の表が必要な場合、分析対象の特定のオブジェクトへのアクセス権を持つデータベース・ユーザーの作成をデータベース管理者に依頼し、データベース接続の作成時にそのユーザーの資格証明を指定することをお薦めします。