Oracle® Real User Experience Insightユーザーズ・ガイド 12c リリース6 (12.1.0.7) for Linux x86-64 E61771-02 |
|
前 |
次 |
この付録では、ネットワーク・トラフィックを監視する際にRUEIによりサポートされるキャラクタ・エンコーディング標準について詳しく説明します。ドメイン名、カスタム・ヘッダーおよび関数エラーなどの識別に対する制限を取り上げます。各国語のキャラクタ・セットを使用するときのデータのマスキングやユーザーIDのマッチングの操作についても説明します。
コレクタでは、様々なエンコーディング標準のデータを含むネットワーク・トラフィックを監視できます。RUEIで現在サポートされているすべてのエンコーディング標準を表G-1に示します。
表G-1 サポートされているエンコーディング
標準名 | MIME名脚注1 | 説明 |
---|---|---|
Big5 |
Big5 |
繁体字中国語。 |
EUC-JP |
EUC-JP |
EUCエンコーディングの日本語。 |
GB_2312-80 |
GB_2312-80、gb2312、chinese |
中国語。 |
GBK |
GBK、CP936、MS936、windows-936 |
簡体字中国語。 |
ISO-8859-1 |
ISO-8859-1、ISO_8859-1、latin1 |
ラテン・アルファベットNo.1。 |
ISO-8859-10 |
ISO-8859-10、latin6 |
ラテン・アルファベットNo.6(スカンジナビア)。 |
ISO-8859-13 |
ISO-8859-13 |
ラテン・アルファベットNo.7(バルト海沿岸諸国)。 |
ISO-8859-14 |
ISO-8859-14、latin8 |
ラテン・アルファベットNo.8(ケルト)。 |
ISO-8859-15 |
ISO-8859-15、latin9 |
ラテン・アルファベットNo.9。 |
ISO-8859-16 |
ISO-8859-16、latin10 |
ラテン・アルファベットNo.10(東南ヨーロッパ)。 |
ISO-8859-2 |
ISO-8859-2、ISO_8859-2、latin2 |
ラテン・アルファベットNo.2(中央および東ヨーロッパ)。 |
ISO-8859-3 |
ISO-8859-3、latin3 |
ラテン・アルファベットNo.3(南ヨーロッパ)。 |
ISO-8859-4 |
ISO-8859-4、latin4 |
ラテン・アルファベットNo.4(北欧)。 |
ISO-8859-5 |
ISO-8859-5、cyrillic |
キリル語。 |
ISO-8859-6 |
ISO-8859-6、arabic |
アラビア語。 |
ISO-8859-7 |
ISO-8859-7、greek |
ギリシャ語。 |
ISO-8859-8 |
ISO-8859-8、hebrew |
ヘブライ語。 |
ISO-8859-9 |
ISO-8859-9、latin5 |
ラテン・アルファベットNo.5(トルコ語)。 |
KOI8-R |
KOI8-R |
ロシア語。 |
Shift_JIS |
Shift_JIS、shift-JIS |
日本語。 |
US-ASCII |
US-ASCII、ascii |
米国の情報交換標準コード(ASCII)。 |
UTF-32 |
UTF-32 |
32ビットUCS変換形式。UCS-4とも呼ばれます。 |
UTF-16 |
UTF-16 |
16ビットUCS変換形式。バイト・オーダーはオプションのバイト・オーダー・マークで指定されます。 |
UTF-16BE |
UTF16BE |
16ビットUnicode変換形式。ビッグエンディアンのバイト・オーダー。 |
UTF-16LE |
UTF16LE |
16ビットUnicode変換形式。リトルエンディアンのバイト・オーダー。 |
UTF-32BE |
UTF32BE |
32ビットUnicode変換形式。ビッグエンディアンのバイト・オーダー。 |
UTF-32LE |
UTF32LE |
32ビットUnicode変換形式。リトルエンディアンのバイト・オーダー。 |
UTF-8 |
UTF-8 |
8ビットUCS変換形式。 |
windows-1250 |
windows-1250 |
Microsoft Windows東ヨーロッパ。 |
windows-1251 |
windows-1251 |
Microsoft Windowsキリル語(ロシア語)。 |
windows-1252 |
windows-1252 |
Microsoft Windowsラテン語。 |
windows-1253 |
windows-1253 |
Microsoft Windowsギリシャ語。 |
windows-1254 |
windows-1254 |
Microsoft Windowsトルコ語。 |
windows-1255 |
windows-1255 |
Microsoft Windowsヘブライ語。 |
windows-1256 |
windows-1256 |
Microsoft Windowsアラビア語。 |
windows-1257 |
windows-1257 |
Microsoft Windowsバルト言語。 |
windows-1258 |
windows-1258 |
Microsoft Windowsベトナム語。 |
脚注1 HTTPエンコーディング宣言によって認識されている名前(およびサポートされている別名)。
ベンダー固有のWebサイト・エンコーディングはサポートされない場合があります。サポートされていないエンコーディングを含むネットワーク・トラフィックは、記録はされますが、マッチングできない場合があります。たとえば、ページのコンテンツはReplay Viewerで表示できますが、定義されたページ名をそのコンテンツに正しく関連付けることができない場合があります。
Webサイト構成
各国のテキストを使用するWebサイトを正しく監視するには、Webサイトを適切に構成しておく必要があります。たとえば、WebサーバーがUTF-8を通知しているが実際のページがUTF-8でエンコードされていない場合、一部のWebブラウザではサポートされていないコンテンツを自動検出して修正できたとしても、RUEIではそのページを正しく監視できません。したがって、関数エラー・チェックやコンテンツ・チェックなどはこれらのページでは正しく動作しません。
データ・マスキング
コレクタは機密情報をログに記録しないように構成できます。この詳細は、13.6項「ユーザー情報のマスキング」に記載されています。サポートされるのはASCIIの引数名のみです。引数の内容に使用されるエンコーディングは何でもかまいません。どのエンコーディングも置き換えられます。
ドル($)文字を含む特定の変数名には注意する必要があります。たとえば、監視対象トラフィックに含まれるfoo$bar
は、foo%24bar
として転送される場合があります(ブラウザによって異なります)。この場合、この変数を正しくマスキングするには、パーセントをエンコードした変数名を指定する必要があります。
マスキングする変数はASCII形式で指定する必要があります。また、セッション診断でレポートされたとおりに正確に指定する必要があります。たとえば、変数名user name
は、セッション診断ではuser%20name
としてレポートされますが、user+name
として表示される場合もあります。したがって、マスキングの対象としてはこれら両方の変数名を指定する必要があります。
引数名に非ASCII文字が含まれる場合、セッション診断(第4章「セッション診断機能の使用」を参照)を使用してその文字がどのようにレポートされるかを確認し、そのレポートされた名前を、マスキング対象の変数として指定する必要があります。また、ログ・ファイルを定期的にチェックして、データが正しくマスキングされていることを確認する必要があります。
前述のURL引数のマスキングに関する制限事項と要件は、URL引数への直接アクセスが必要なあらゆる状況にもあてはまります。たとえば、カスタム・ディメンションやアプリケーション定義などです。
注意: HTMLフォームのフィールド名(値ではない)を正しくマスキングするためには、ASCII形式であることが必要です。 |
カスタム・ヘッダーとCookie
ヘッダー名はHTTPプロトコルで必要とされるため、すべてのヘッダー名はASCIIでエンコードする必要があります。ヘッダーの内容に含まれるすべての非ASCII文字は、プレースホルダに置き換えられます。
ユーザーIDのマッチング
RUEIでは、ユーザー識別は最初にHTTP認可フィールドから取得されます。ユーザー識別が見つからない場合は、アプリケーションのユーザー識別スキームが使用されます。ユーザー識別スキームでは、URL、Cookie、リクエスト・ヘッダーまたはレスポンス・ヘッダーあるいはXPath式によってユーザーを指定できます。この詳細は、8.3.14項「ユーザー識別の定義」に記載されています。
name=valueのペアで1つのURL引数となるため、nameの部分をユーザーIDの読取り元となるソース引数として指定します。valueの部分は抽出され、ユーザーIDとしてレポートされます。指定するソース引数には、データのマスキングですでに説明した要件が必要となります。ただし、ペアになるvalue部分は、サポートされている任意のエンコーディングで指定できます。RUEIは、valueを本来のエンコーディング(Shift-JISなど)からUTF-8に変換して、ユーザー・インタフェース内で本来の言語(日本語など)でレンダリングできるようにします。
ただし、valueの本来のエンコーディングが不明な場合は、ユーザーIDがユーザー・インタフェース内で正しくレンダリングできず、レポートされる値が文字化けします。HTTPプロトコルの制限のため、一部のWebサイトでは、ユーザーIDが要求どおりにレンダリングされない場合があります。この場合、コレクタ・エンコーディングを指定して使用することをお薦めします。この詳細は、G.4項「URL引数およびコレクタ・エンコーディングの指定」に記載されています。この設定に指定したエンコーディングは、URLおよびPOST引数のみに適用されます。コンテンツベースのレポート(関数エラーなど)はこの設定による影響を受けません。これは、すべての値が正しくレンダリングされることを保証するものではありません。したがって、Webサイトの定義を確認したり、すべてのユーザーIDがASCIIのみであることを確認する必要があります。
ページ・コンテンツ・チェックを指定する場合、クライアント・ブラウザ内でレンダリング(およびエンドユーザーに表示)されるコンテンツは、基となるHTMLページ・ソースとは異なる場合があります。これは、基となるフォント、書式設定、リンクの各タグ、およびエンティティ定義などに原因があります。したがって、クライアント・ブラウザ内でレンダリングされたページからテキストの一部を単にコピーして貼り付けるのみでは、必ずしも要求どおりに機能しない場合があります。
通常、この問題を解決するには、クライアント・ブラウザのソース表示機能でコピーと貼付けを行います。ただし、UTF-8以外のエンコーディングを使用するページの場合、ブラウザがInternet Explorer 6または7であると、この方法は機能しません。これは、IEでは、UTF-8のみをサポートするメモ帳がソース・ビューアとして使用されるためです。その結果、ソースが文字化けして表示される場合があり、RUEIにコピーおよび貼り付けることの意味がなくなります。
Mozilla Firefoxでは内部のHTMLソース・レンダリング・ツールが使用されるため、UTF-8以外のエンコーディングでもHTMLソースは常に正確にレンダリングされます。このため、このブラウザをコンテンツベース・チェックのベースとして使用することをお薦めします。また、HTMLソースの正確なレンダリングが必要な場合もこのブラウザを使用することをお薦めします。
RUEIが監視しているネットワーク・トラフィックに関して正確にレポートするには、そのトラフィック内で使用されているエンコーディングを認識している必要があります。RUEIでは、様々なキャラクタ・エンコーディング標準のデータを含むネットワーク・トラフィックを監視できます。RUEIでサポートされているすべてのエンコーディング標準は、表G-1を参照してください。
一般的に、RUEIは最初に、対応するHTMLドキュメントについて指定されているドキュメントのエンコーディングを使用しようとします。これは自動検出です。このエンコーディングで満足できる結果が得られなかった場合には、URL引数およびポストされたフォーム引数をデコードするために、コレクタ・エンコーディング(指定されている場合)が使用されます。
コレクタ・エンコーディングは、ドキュメント・エンコーディングを手動で上書きするものではありません。むしろ、ドキュメントのエンコーディングがURL引数を満足できる形でデコードできなかったときに、RUEIによって自動的に使用されるエンコーディングを指定するものです。コレクタ・エンコーディングでも満足できる結果が得られなかった場合、引数は元の(デコードされていない)形式でレポートされます。
URL引数およびコレクタ・エンコーディング
URL引数とコレクタ・エンコーディングを指定する手順は、次のとおりです。
「構成」→「セキュリティ」→「コレクタ・エンコーディング」の順に選択します。図G-1に示すパネルが表示されます。
目的のコレクタ・プロファイルに現在定義されているコレクタ・エンコーディングをクリックします。デフォルトでは、コレクタ・エンコーディングは定義されていません。図G-2に示すダイアログが表示されます。
「コレクタ・エンコーディング」メニューを使用して、自動検出が失敗したときに、選択したコレクタ・プロファイルのコレクタによってアプリケーション・フィルタのURL引数のために使用されるエンコーディングを指定します。使用可能なエンコーディングのリストは、表G-1に示すリストと等価です。
次に、「保存」をクリックします。この設定は、変更すると、ほぼ即座に有効になります。
重要:
この機能を使用する場合には、次の点に特に注意する必要があります。
この設定が適用されるのは、アプリケーション定義内のURL引数のデコードのみです(8.3項「アプリケーションの定義」を参照)。コンテンツベースのレポート(関数エラーなど)はこの設定による影響を受けません。また、選択したコレクタ・エンコーディングは、選択したプロファイルのコレクタによって監視されているアプリケーション、ページ、ドメインのすべてに適用されます。
Webサイト内で各国語のキャラクタ・セットを使用する場合には、Webサイトのコンテンツとそこで使用されているエンコーディングを注意して確認することをお薦めします。また、すべてのURL引数のレポートを定期的に調べて、それらの引数が正しいことを確認する必要があります。