コレクタでは、様々なエンコーディング標準のデータを含むネットワーク・トラフィックを監視できます。 RUEIで現在サポートされているすべてのエンコーディング標準を表G-1に示します。
表G-1 サポートされているエンコーディング
標準名 | MIME Name(1) | 説明 |
---|---|---|
Big5 |
Big5 |
繁体字中国語 |
EUC-JP |
EUC-JP |
EUCエンコーディングの日本語。 |
GB_2312-80 |
GB_2312-80、gb2312、chinese |
中国語 |
GBK |
GBK、CP936、MS936、windows-936 |
簡体字中国語 |
ISO-8859-1 |
ISO-8859-1、ISO_8859-1、latin1 |
ラテン・アルファベットNo.1。 |
ISO-8859-10 |
ISO-8859-10、latin6 |
ラテン・アルファベットNo.6(スカンジナビア)。 |
ISO-8859-13 |
ISO-8859-13 |
ラテン・アルファベットNo.7(バルト海沿岸諸国)。 |
ISO-8859-14 |
ISO-8859-14、latin8 |
ラテン・アルファベットNo.8(ケルト)。 |
ISO-8859-15 |
ISO-8859-15、latin9 |
ラテン・アルファベットNo.9。 |
ISO-8859-16 |
ISO-8859-16、latin10 |
ラテン・アルファベットNo.10(東南ヨーロッパ)。 |
ISO-8859-2 |
ISO-8859-2、ISO_8859-2、latin2 |
ラテン・アルファベットNo.2(中央および東ヨーロッパ)。 |
ISO-8859-3 |
ISO-8859-3、latin3 |
ラテン・アルファベットNo.3(南ヨーロッパ)。 |
ISO-8859-4 |
ISO-8859-4、latin4 |
ラテン・アルファベットNo.4(北欧)。 |
ISO-8859-5 |
ISO-8859-5、cyrillic |
キリル語 |
ISO-8859-6 |
ISO-8859-6、arabic |
アラビア語 |
ISO-8859-7 |
ISO-8859-7、greek |
ギリシャ語 |
ISO-8859-8 |
ISO-8859-8、hebrew |
ヘブライ語 |
ISO-8859-9 |
ISO-8859-9、latin5 |
ラテン・アルファベットNo.5(トルコ語)。 |
KOI8-R |
KOI8-R |
ロシア語 |
Shift_JIS |
Shift_JIS、shift-JIS |
日本語 |
US-ASCII |
US-ASCII、ascii |
米国の情報交換標準コード(ASCII)。 |
UTF-32 |
UTF-32 |
32ビットUCS変換形式。 UCS-4とも呼ばれます。 |
UTF-16 |
UTF-16 |
16ビットUCS変換形式。バイト・オーダーはオプションのバイト・オーダー・マークで指定されます。 |
UTF-16BE |
UTF16BE |
16ビットUnicode変換形式。ビッグエンディアンのバイト・オーダー。 |
UTF-16LE |
UTF16LE |
16ビットUnicode変換形式。リトルエンディアンのバイト・オーダー。 |
UTF-32BE |
UTF32BE |
32ビットUnicode変換形式。ビッグエンディアンのバイト・オーダー。 |
UTF-32LE |
UTF32LE |
32ビットUnicode変換形式。リトルエンディアンのバイト・オーダー。 |
UTF-8 |
UTF-8 |
8ビットUCS変換形式。 |
windows-1250 |
windows-1250 |
Microsoft Windows東ヨーロッパ。 |
windows-1251 |
windows-1251 |
Microsoft Windowsキリル語(ロシア語)。 |
windows-1252 |
windows-1252 |
Microsoft Windowsラテン語。 |
windows-1253 |
windows-1253 |
Microsoft Windowsギリシャ語。 |
windows-1254 |
windows-1254 |
Microsoft Windowsトルコ語。 |
windows-1255 |
windows-1255 |
Microsoft Windowsヘブライ語。 |
windows-1256 |
windows-1256 |
Microsoft Windowsアラビア語。 |
windows-1257 |
windows-1257 |
Microsoft Windowsバルト言語。 |
windows-1258 |
windows-1258 |
Microsoft Windowsベトナム語。 |
脚注1 HTTPエンコーディング宣言によって認識されている名前(およびサポートされている別名)。
ベンダー固有のWebサイト・エンコーディングはサポートされていない場合があることに注意してください。 サポートされていないエンコーディングを含むネットワーク・トラフィックは、記録はされますが、マッチングできない場合があります。 たとえば、ページのコンテンツはReplay Viewerで表示できますが、定義されたページ名をそのコンテンツに正しく関連付けることができない場合があります。
Webサイトの構成
国際テキストを使用するWebサイトを正しく監視するには、Webサイトが適切に構成されていることが必要です。 たとえば、WebサーバーがUTF-8を通知しているが実際のページがUTF-8でエンコードされていない場合、一部のWebブラウザではサポートされていないコンテンツを自動検出して修正できたとしても、RUEIではそのページを正しく監視できません。 したがって、関数エラー・チェックやコンテンツ・チェックなどはこれらのページでは正しく動作しません。
データ・マスキング
コレクタは機密情報をログに記録しないように構成できます。 これについては、「ユーザー情報のマスキング」で説明しています。 サポートされるのはASCIIの引数名のみです。 引数の内容に使用されるエンコーディングは何でもかまいません。どのエンコーディングも置き換えられます。
ドル($)文字を含む特定の変数名には注意する必要があります。 たとえば、監視対象トラフィックに含まれるfoo$bar
は、foo%24bar
として転送される場合があります(ブラウザによって異なります)。 この場合、この変数を正しくマスキングするには、パーセントをエンコードした変数名を指定する必要があります。
マスキングする変数はASCII形式で指定する必要があります。また、セッション診断でレポートされたとおりに正確に指定する必要があります。 たとえば、変数名user name
は、セッション診断ではuser%20name
としてレポートされますが、user+name
として表示される場合もあります。 したがって、マスキングの対象としてはこれら両方の変数名を指定する必要があります。
引数名にASCII以外の文字が含まれている場合は、セッション診断(「セッション診断機能の使用」で説明)を使用してレポート方法を確認し、このレポートされる名前をマスク対象の変数として指定します。 また、ログ・ファイルを定期的にチェックして、データが正しくマスキングされていることを確認する必要があります。
前述のURL引数のマスキングに関する制限事項と要件は、URL引数への直接アクセスが必要なあらゆる状況にもあてはまります。 たとえば、カスタム・ディメンションやアプリケーション定義などです。
注意:
HTMLフォームのフィールド名(値ではない)を正しくマスキングするためには、ASCII形式であることが必要です。
カスタム・ヘッダーとCookie
ヘッダー名はHTTPプロトコルで必要とされるため、すべてのヘッダー名はASCIIでエンコードする必要があります。 ヘッダーの内容に含まれるすべての非ASCII文字は、プレースホルダに置き換えられます。
ユーザーIDのマッチング
RUEIでは、ユーザー識別は最初にHTTP認可フィールドから取得されます。 ユーザー識別が見つからない場合は、アプリケーションのユーザー識別スキームが使用されます。 ユーザー識別スキームでは、URL、Cookie、リクエスト・ヘッダーまたはレスポンス・ヘッダーあるいはXPath式によってユーザーを指定できます。 これについては、「ユーザー識別の定義」で説明しています。
name=valueのペアで1つのURL引数となるため、nameの部分をユーザーIDの読取り元となるソース引数として指定します。 valueの部分は抽出され、ユーザーIDとしてレポートされます。 指定するソース引数には、データのマスキングですでに説明した要件が必要となります。 ただし、ペアになるvalue部分は、サポートされている任意のエンコーディングで指定できます。 RUEIは、valueを本来のエンコーディング(Shift-JISなど)からUTF-8に変換して、ユーザー・インタフェース内で本来の言語(日本語など)でレンダリングできるようにします。
ただし、valueの本来のエンコーディングが不明な場合は、ユーザーIDがユーザー・インタフェース内で正しくレンダリングできず、レポートされる値が文字化けします。 HTTPプロトコルの制限のために、一部のWebサイトではuser IDsが予想どおりにレンダリングされない場合があります。 この場合、コレクタ・エンコーディングを指定して使用することをお薦めします。 これについては、「URL引数/コレクタ・エンコーディングの指定」で説明しています。 この設定に指定したエンコーディングは、URLおよびPOST引数のみに適用されます。 コンテンツベースのレポート(関数エラーなど)はこの設定による影響を受けません。 これによってすべての値が正しくレンダリングされることが保証されないため、Webサイト定義もレビューし、すべてのユーザーIDsがASCIIのみであることを確認する必要があります。
ページ・コンテンツ・チェックを指定する場合、クライアント・ブラウザ内でレンダリング(およびエンドユーザーに表示)されるコンテンツは、基となるHTMLページ・ソースとは異なる場合があります。 これは、基となるフォント、書式設定、リンクの各タグ、およびエンティティ定義などに原因があります。 したがって、クライアント・ブラウザ内でレンダリングされたページからテキストの一部を単にコピーして貼り付けるのみでは、必ずしも要求どおりに機能しない場合があります。
通常、この問題を解決するには、クライアント・ブラウザのソース表示機能でコピーと貼付けを行います。 ただし、UTF-8以外のエンコーディングを使用するページの場合、ブラウザがInternet Explorer 6または7であると、この方法は機能しません。 これは、IEでは、UTF-8のみをサポートするメモ帳がソース・ビューアとして使用されるためです。 その結果、ソースが文字化けして表示される場合があり、RUEIにコピーおよび貼り付けることの意味がなくなります。
Mozilla Firefoxでは内部のHTMLソース・レンダリング・ツールが使用されるため、UTF-8以外のエンコーディングでもHTMLソースは常に正確にレンダリングされます。 このため、このブラウザをコンテンツベース・チェックのベースとして使用することをお薦めします。また、HTMLソースの正確なレンダリングが必要な場合もこのブラウザを使用することをお薦めします。
RUEIが監視しているネットワーク・トラフィックに関して正確にレポートするには、そのトラフィック内で使用されているエンコーディングを認識している必要があります。 RUEIでは、様々なキャラクタ・エンコーディング標準のデータを含むネットワーク・トラフィックを監視できます。 RUEIでサポートされているすべてのエンコーディング標準は、表G-1を参照してください。
一般的に、RUEIは最初に、対応するHTMLドキュメントについて指定されているドキュメントのエンコーディングを使用しようとします。 これは自動検出です。 このエンコーディングで満足できる結果が得られなかった場合には、URL引数およびポストされたフォーム引数をデコードするために、コレクタ・エンコーディング(指定されている場合)が使用されます。
コレクタ・エンコーディングは、ドキュメント・エンコーディングを手動で上書きするものではありません。 むしろ、ドキュメントのエンコーディングがURL引数を満足できる形でデコードできなかったときに、RUEIによって自動的に使用されるエンコーディングを指定するものです。 コレクタ・エンコーディングでも満足できる結果が得られなかった場合、引数は元の(デコードされていない)形式でレポートされます。
URL引数およびコレクタ・エンコーディング
URL引数とコレクタ・エンコーディングを指定する手順は、次のとおりです。
構成→セキュリティ→コレクタ・エンコーディングの順に選択します。 図G-1に示すパネルが表示されます。
図G-1 コレクタ・エンコーディング
目的のコレクタ・プロファイルに現在定義されているコレクタ・エンコーディングをクリックします。 デフォルトでは、コレクタ・エンコーディングは定義されていません。 図G-2に示すダイアログが表示されます。
図G-2 コレクタ・エンコーディングの編集ダイアログ
コレクタ・エンコーディングメニューを使用して、自動検出が失敗したときに、選択したコレクタ・プロファイルのコレクタによってアプリケーション・フィルタのURL引数のために使用されるエンコーディングを指定します。 使用可能なエンコーディングのリストは、表G-1に示すリストと等価です。
次に、保存をクリックします。 この設定は、変更すると、ほぼ即座に有効になります。
重要
この機能を使用する場合には、次の点に特に注意する必要があります。
この設定は、アプリケーション定義内のURL引数のデコードにのみ適用されます(「アプリケーションの定義」を参照)。 コンテンツベースのレポート(関数エラーなど)はこの設定による影響を受けません。 また、選択したコレクタ・エンコーディングは、選択したプロファイルのコレクタによって監視されているアプリケーション、ページ、ドメインのすべてに適用されます。
Webサイト内で各国語キャラクタ・セットを使用している場合は、「強く」 webサイトのコンテンツとそれに使用されているエンコーディングを入念に確認することをお薦めします。 また、すべてのURL引数のレポートを定期的に調べて、それらの引数が正しいことを確認する必要があります。