プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Service Studioユーザー・ガイド

E65365-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

完全なURLである属性値の推奨

データのロード時に収集される完全なURL (プロトコル、ホスト、ポート、パスを含む)がソース・データに含まれる可能性があります。 たとえば、会社のデータには、会社のwebサイト上のページへのリンクを含めることができます。

値を全面的に格納し、値をハイパーリンクURLとして挿入すると、エンコードできなくなります。 Big Data Discoveryでは属性値が絶対URLの一部として解析されないため、エンコードによってURLが破損し、リンクが機能しません。

たとえば、http://www.mycompany.com/page1http%3A%2F%2Fwww.mycompany.com%2Fpage1になります。

このため、データに完全なURLを格納することはお薦めできません。

これらのタイプの属性については、データ収集プロセスで次のいずれかのアプローチを使用することをお薦めします:
  1. 各レコードURLのパラメータ値のみを格納するには、1つ以上の属性を使用します。

    コンポーネントのURLを構成する場合は、URLの標準部分をコンポーネント構成に手動で入力し、問合せ文字列パラメータにエンコード済属性を使用します。 次に例を示します。

    http://server.mycompany.com/path/to?file={0}

    0:選択したパラメータのリストからの数値です。

    この方法はすべてのURLが同じ構造の場合にのみ使用できます。 そうでない場合は、その他の方法のいずれかを使用する必要があります。

  2. URLの構造部分を、パラメータ値とは別の属性に格納します。

    この方法では、URLの構造的な部分(プロトコル、ホスト名、ポート、コンテキスト・パス/デリミタなど)は、1つ以上の属性に格納されます。 識別子を表すURLのパラメータ部分は、前述の方法1のように別個の属性に格納されます。

    コンポーネントにURLを入力する場合、構造属性はエンコードしませんが、パラメータはエンコードします。 次に例を示します。

    {{0}}/path/to/{1}?file={2}

    0、1および2は、選択したパラメータのリストからの数値です。

  3. 完全なURLには単一の属性を使用しますが、データ収集プロセスでは、URLの(問合せ文字列パラメータなど)以外の部分をエンコードしています。

    これにより、スクリプトのインジェクションが回避され、許可されていない文字が処理されます。 URLを入力すると、さらにエンコーディングしなくても属性値を使用できるようになります。 次に例を示します。

    {{0}}

    0:選択したパラメータのリストからの数値です。