ヘッダーをスキップ
Oracle® Real User Experience Insightユーザーズ・ガイド
12c リリース6 (12.1.0.7) for Linux x86-64
E61771-02
  目次へ移動
目次
索引へ移動
索引

前
 
次
 

G 各国語サポートの使用

この付録では、ネットワーク・トラフィックを監視する際にRUEIによりサポートされるキャラクタ・エンコーディング標準について詳しく説明します。ドメイン名、カスタム・ヘッダーおよび関数エラーなどの識別に対する制限を取り上げます。各国語のキャラクタ・セットを使用するときのデータのマスキングやユーザーIDのマッチングの操作についても説明します。

G.1 概要

コレクタでは、様々なエンコーディング標準のデータを含むネットワーク・トラフィックを監視できます。RUEIで現在サポートされているすべてのエンコーディング標準を表G-1に示します。

表G-1 サポートされているエンコーディング

標準名 MIME名脚注1 説明

Big5

Big5

繁体字中国語。

EUC-JP

EUC-JP

EUCエンコーディングの日本語。

GB_2312-80

GB_2312-80、gb2312、chinese

中国語。

GBK

GBK、CP936、MS936、windows-936

簡体字中国語。

ISO-8859-1

ISO-8859-1、ISO_8859-1、latin1

ラテン・アルファベットNo.1。

ISO-8859-10

ISO-8859-10、latin6

ラテン・アルファベットNo.6(スカンジナビア)。

ISO-8859-13

ISO-8859-13

ラテン・アルファベットNo.7(バルト海沿岸諸国)。

ISO-8859-14

ISO-8859-14、latin8

ラテン・アルファベットNo.8(ケルト)。

ISO-8859-15

ISO-8859-15、latin9

ラテン・アルファベットNo.9。

ISO-8859-16

ISO-8859-16、latin10

ラテン・アルファベットNo.10(東南ヨーロッパ)。

ISO-8859-2

ISO-8859-2、ISO_8859-2、latin2

ラテン・アルファベットNo.2(中央および東ヨーロッパ)。

ISO-8859-3

ISO-8859-3、latin3

ラテン・アルファベットNo.3(南ヨーロッパ)。

ISO-8859-4

ISO-8859-4、latin4

ラテン・アルファベットNo.4(北欧)。

ISO-8859-5

ISO-8859-5、cyrillic

キリル語。

ISO-8859-6

ISO-8859-6、arabic

アラビア語。

ISO-8859-7

ISO-8859-7、greek

ギリシャ語。

ISO-8859-8

ISO-8859-8、hebrew

ヘブライ語。

ISO-8859-9

ISO-8859-9、latin5

ラテン・アルファベットNo.5(トルコ語)。

KOI8-R

KOI8-R

ロシア語。

Shift_JIS

Shift_JIS、shift-JIS

日本語。

US-ASCII

US-ASCII、ascii

米国の情報交換標準コード(ASCII)。

UTF-32

UTF-32

32ビットUCS変換形式。UCS-4とも呼ばれます。

UTF-16

UTF-16

16ビットUCS変換形式。バイト・オーダーはオプションのバイト・オーダー・マークで指定されます。

UTF-16BE

UTF16BE

16ビットUnicode変換形式。ビッグエンディアンのバイト・オーダー。

UTF-16LE

UTF16LE

16ビットUnicode変換形式。リトルエンディアンのバイト・オーダー。

UTF-32BE

UTF32BE

32ビットUnicode変換形式。ビッグエンディアンのバイト・オーダー。

UTF-32LE

UTF32LE

32ビットUnicode変換形式。リトルエンディアンのバイト・オーダー。

UTF-8

UTF-8

8ビットUCS変換形式。

windows-1250

windows-1250

Microsoft Windows東ヨーロッパ。

windows-1251

windows-1251

Microsoft Windowsキリル語(ロシア語)。

windows-1252

windows-1252

Microsoft Windowsラテン語。

windows-1253

windows-1253

Microsoft Windowsギリシャ語。

windows-1254

windows-1254

Microsoft Windowsトルコ語。

windows-1255

windows-1255

Microsoft Windowsヘブライ語。

windows-1256

windows-1256

Microsoft Windowsアラビア語。

windows-1257

windows-1257

Microsoft Windowsバルト言語。

windows-1258

windows-1258

Microsoft Windowsベトナム語。


脚注1 HTTPエンコーディング宣言によって認識されている名前(およびサポートされている別名)。

ベンダー固有のWebサイト・エンコーディングはサポートされない場合があります。サポートされていないエンコーディングを含むネットワーク・トラフィックは、記録はされますが、マッチングできない場合があります。たとえば、ページのコンテンツはReplay Viewerで表示できますが、定義されたページ名をそのコンテンツに正しく関連付けることができない場合があります。

Webサイト構成

各国のテキストを使用するWebサイトを正しく監視するには、Webサイトを適切に構成しておく必要があります。たとえば、WebサーバーがUTF-8を通知しているが実際のページがUTF-8でエンコードされていない場合、一部のWebブラウザではサポートされていないコンテンツを自動検出して修正できたとしても、RUEIではそのページを正しく監視できません。したがって、関数エラー・チェックやコンテンツ・チェックなどはこれらのページでは正しく動作しません。

G.2 実装に関する考慮事項

データ・マスキング

コレクタは機密情報をログに記録しないように構成できます。この詳細は、13.6項「ユーザー情報のマスキング」に記載されています。サポートされるのはASCIIの引数名のみです。引数の内容に使用されるエンコーディングは何でもかまいません。どのエンコーディングも置き換えられます。

ドル($)文字を含む特定の変数名には注意する必要があります。たとえば、監視対象トラフィックに含まれるfoo$barは、foo%24barとして転送される場合があります(ブラウザによって異なります)。この場合、この変数を正しくマスキングするには、パーセントをエンコードした変数名を指定する必要があります。

マスキングする変数はASCII形式で指定する必要があります。また、セッション診断でレポートされたとおりに正確に指定する必要があります。たとえば、変数名user nameは、セッション診断ではuser%20nameとしてレポートされますが、user+nameとして表示される場合もあります。したがって、マスキングの対象としてはこれら両方の変数名を指定する必要があります。

引数名に非ASCII文字が含まれる場合、セッション診断(第4章「セッション診断機能の使用」を参照)を使用してその文字がどのようにレポートされるかを確認し、そのレポートされた名前を、マスキング対象の変数として指定する必要があります。また、ログ・ファイルを定期的にチェックして、データが正しくマスキングされていることを確認する必要があります。

前述のURL引数のマスキングに関する制限事項と要件は、URL引数への直接アクセスが必要なあらゆる状況にもあてはまります。たとえば、カスタム・ディメンションやアプリケーション定義などです。


注意:

HTMLフォームのフィールド名(値ではない)を正しくマスキングするためには、ASCII形式であることが必要です。

カスタム・ヘッダーとCookie

ヘッダー名はHTTPプロトコルで必要とされるため、すべてのヘッダー名はASCIIでエンコードする必要があります。ヘッダーの内容に含まれるすべての非ASCII文字は、プレースホルダに置き換えられます。

ユーザーIDのマッチング

RUEIでは、ユーザー識別は最初にHTTP認可フィールドから取得されます。ユーザー識別が見つからない場合は、アプリケーションのユーザー識別スキームが使用されます。ユーザー識別スキームでは、URL、Cookie、リクエスト・ヘッダーまたはレスポンス・ヘッダーあるいはXPath式によってユーザーを指定できます。この詳細は、8.3.14項「ユーザー識別の定義」に記載されています。

name=valueのペアで1つのURL引数となるため、nameの部分をユーザーIDの読取り元となるソース引数として指定します。valueの部分は抽出され、ユーザーIDとしてレポートされます。指定するソース引数には、データのマスキングですでに説明した要件が必要となります。ただし、ペアになるvalue部分は、サポートされている任意のエンコーディングで指定できます。RUEIは、valueを本来のエンコーディング(Shift-JISなど)からUTF-8に変換して、ユーザー・インタフェース内で本来の言語(日本語など)でレンダリングできるようにします。

ただし、valueの本来のエンコーディングが不明な場合は、ユーザーIDがユーザー・インタフェース内で正しくレンダリングできず、レポートされる値が文字化けします。HTTPプロトコルの制限のため、一部のWebサイトでは、ユーザーIDが要求どおりにレンダリングされない場合があります。この場合、コレクタ・エンコーディングを指定して使用することをお薦めします。この詳細は、G.4項「URL引数およびコレクタ・エンコーディングの指定」に記載されています。この設定に指定したエンコーディングは、URLおよびPOST引数のみに適用されます。コンテンツベースのレポート(関数エラーなど)はこの設定による影響を受けません。これは、すべての値が正しくレンダリングされることを保証するものではありません。したがって、Webサイトの定義を確認したり、すべてのユーザーIDがASCIIのみであることを確認する必要があります。

G.3 コンテンツ・チェックの指定

ページ・コンテンツ・チェックを指定する場合、クライアント・ブラウザ内でレンダリング(およびエンドユーザーに表示)されるコンテンツは、基となるHTMLページ・ソースとは異なる場合があります。これは、基となるフォント、書式設定、リンクの各タグ、およびエンティティ定義などに原因があります。したがって、クライアント・ブラウザ内でレンダリングされたページからテキストの一部を単にコピーして貼り付けるのみでは、必ずしも要求どおりに機能しない場合があります。

通常、この問題を解決するには、クライアント・ブラウザのソース表示機能でコピーと貼付けを行います。ただし、UTF-8以外のエンコーディングを使用するページの場合、ブラウザがInternet Explorer 6または7であると、この方法は機能しません。これは、IEでは、UTF-8のみをサポートするメモ帳がソース・ビューアとして使用されるためです。その結果、ソースが文字化けして表示される場合があり、RUEIにコピーおよび貼り付けることの意味がなくなります。

Mozilla Firefoxでは内部のHTMLソース・レンダリング・ツールが使用されるため、UTF-8以外のエンコーディングでもHTMLソースは常に正確にレンダリングされます。このため、このブラウザをコンテンツベース・チェックのベースとして使用することをお薦めします。また、HTMLソースの正確なレンダリングが必要な場合もこのブラウザを使用することをお薦めします。

G.4 URL引数およびコレクタ・エンコーディングの指定

RUEIが監視しているネットワーク・トラフィックに関して正確にレポートするには、そのトラフィック内で使用されているエンコーディングを認識している必要があります。RUEIでは、様々なキャラクタ・エンコーディング標準のデータを含むネットワーク・トラフィックを監視できます。RUEIでサポートされているすべてのエンコーディング標準は、表G-1を参照してください。

一般的に、RUEIは最初に、対応するHTMLドキュメントについて指定されているドキュメントのエンコーディングを使用しようとします。これは自動検出です。このエンコーディングで満足できる結果が得られなかった場合には、URL引数およびポストされたフォーム引数をデコードするために、コレクタ・エンコーディング(指定されている場合)が使用されます。

コレクタ・エンコーディングは、ドキュメント・エンコーディングを手動で上書きするものではありません。むしろ、ドキュメントのエンコーディングがURL引数を満足できる形でデコードできなかったときに、RUEIによって自動的に使用されるエンコーディングを指定するものです。コレクタ・エンコーディングでも満足できる結果が得られなかった場合、引数は元の(デコードされていない)形式でレポートされます。

URL引数およびコレクタ・エンコーディング

URL引数とコレクタ・エンコーディングを指定する手順は、次のとおりです。

  1. 「構成」「セキュリティ」「コレクタ・エンコーディング」の順に選択します。図G-1に示すパネルが表示されます。

    図G-1 コレクタ・エンコーディング

    図G-1の説明は次にあります。
    「図G-1 コレクタ・エンコーディング」の説明

  2. 目的のコレクタ・プロファイルに現在定義されているコレクタ・エンコーディングをクリックします。デフォルトでは、コレクタ・エンコーディングは定義されていません。図G-2に示すダイアログが表示されます。

    図G-2 コレクタ・エンコーディングの編集ダイアログ

    図G-2の説明は次にあります。
    「図G-2 コレクタ・エンコーディングの編集ダイアログ」の説明

  3. 「コレクタ・エンコーディング」メニューを使用して、自動検出が失敗したときに、選択したコレクタ・プロファイルのコレクタによってアプリケーション・フィルタのURL引数のために使用されるエンコーディングを指定します。使用可能なエンコーディングのリストは、表G-1に示すリストと等価です。

    次に、「保存」をクリックします。この設定は、変更すると、ほぼ即座に有効になります。

重要:

この機能を使用する場合には、次の点に特に注意する必要があります。

  • この設定が適用されるのは、アプリケーション定義内のURL引数のデコードのみです(8.3項「アプリケーションの定義」を参照)。コンテンツベースのレポート(関数エラーなど)はこの設定による影響を受けません。また、選択したコレクタ・エンコーディングは、選択したプロファイルのコレクタによって監視されているアプリケーション、ページ、ドメインのすべてに適用されます。

  • Webサイト内で各国語のキャラクタ・セットを使用する場合には、Webサイトのコンテンツとそこで使用されているエンコーディングを注意して確認することをお薦めします。また、すべてのURL引数のレポートを定期的に調べて、それらの引数が正しいことを確認する必要があります。