6.3.9.4 セル・ディスクI/Oを監視する際の注意事項
不均衡
Exadata環境では、すべてのセルまたはディスクに負荷を均等に分散することが期待されます。ただし、状況によっては不均衡が発生する場合があります。
負荷の不均衡は、次のようなワークロードの特性によって発生する可能性があります。
-
小さい表のスキャンの繰返し — これは多くの場合、ネステッド・ループ結合の右側の表が原因で発生します。小規模の表は少数のディスクまたはセルにのみ存在する可能性があるため、繰返しアクセスは、小さいデバイス・セット(データがExadata Smart Flash Cacheに存在する場合はフラッシュ・デバイス)からの読取りを意味します。不均衡に対処するために、影響を受けるSQL文を特定し、その実行計画を確認できます。また、影響を受けるセグメントの物理組織を考慮することもできます。
-
制御ファイルの読取りの繰返し — 制御ファイルの読取りは、一部のデータベース動的パフォーマンス・ビューに対する問合せが原因で発生する場合があります。制御ファイルは小さく、少数のディスクまたはセルにのみ存在する可能性があるため、繰返しアクセスは、小さいデバイス・セット(通常はフラッシュ)からの読取りを意味します。制御ファイルの読取りが繰り返されていることは、AWRレポートのファイル・タイプ別のIOStatセクションの
control file sequential read
待機イベントからわかります。制御ファイルの読取りが繰り返される原因を把握するには、AWRレポートのExadata IO Reasonsセクションを使用して、多数の制御ファイルの読取りを処理するセルを識別し、これを上位データベース・セクションの統計と相互に関連付けて、制御ファイルの読取りを発行するデータベースを識別します。また、アクティブ・セッション履歴(ASH)を確認して、
control file sequential read
の待機が発生しているSQL文を特定することもできます。負荷の軽いシステムでは、制御ファイルの読取りにより、不均衡な少量のI/Oが発生する場合があることに注意してください。この場合、不均衡は無視して問題ありません。
-
LOBセグメントなどの小さいセグメントの読取りの繰返し — このような不均衡に対処するには、セグメントのデータベース統計を確認するか、ASHを調べて原因となるSQLコマンドを特定します。次に、SQLおよび周囲のアプリケーション・ロジックを調べて、繰返し読取りを回避できるかどうかを確認します。
-
ASMメタデータへのアクセスの繰返し — これは多くの場合、ASMメタデータへのアクセスが必要な、領域使用量に関連するデータベース問合せが原因です。ASMメタデータは小さく、少数のディスクまたはセルにのみ存在する可能性があるため、繰返しアクセスは不均衡として表示される場合があります。これは、AWRレポートのExadata IO Reasonsセクションに、ASMの接頭辞(ASM CACHE IOなど)が付いた理由とともに表示される場合があります。Exadata IO Reasonsセクションを使用して影響を受けるセルを識別し、これを上位データベース・セクションの統計と相互に関連付けて、ASMをI/Oのソースとして確認できます。不均衡に対処するには、メタデータにアクセスするASM領域使用量問合せの必要性と頻度を確認します。
ワークロード関連の原因とは別に、不均衡の原因として次のことが考えられます。
- 不均等なデータ分散 — 一部のディスクに含まれるデータが他のディスクよりも多いまたは少ない場合、ホット・スポットが発生することがあります。データ分散が均等であるかをチェックするには、大規模な全表スキャンを含むSQL問合せの実行前後に
V$ASM_DISK_IOSTAT
ビューを問い合せます。この場合、read
列とread_bytes
列の統計は、ディスク・グループ内のすべてのディスクでほぼ同じである必要があります。また、My Oracle Supportのドキュメント367445.1で入手できるスクリプトを使用して、データ分散が均等であるかをチェックすることもできます。 - 非対称のグリッド・ディスク構成 — グリッド・ディスクのサイズがセルごとに異なる場合は、各セルのデータ量が異なる可能性があるため、不均等なデータ分散が原因で不均衡になります。このため、システム内のすべてのストレージ・サーバーで対称な構成をお薦めします。
- 障害または障害からのリカバリ — 一部の処理では、残りのディスクまたはセルに均等に分散できません。たとえば、フラッシュ・カードに障害が発生した場合、そのカードを含むセルのFlash Cache領域は少なくなり、Flash Cache統計が他のセルと比較されると不均衡として表示されることがあります。
不均衡は、多くの場合、AWRレポートの様々な統計に表示されます。AWRレポートの様々なセクションを相互に関連付けることで、不均衡をより深く理解できます。
高I/O負荷
データベース・パフォーマンスの問題がExadataストレージ・サーバーのI/O負荷に関連する場合は、通常、I/O関連の待機イベントのレイテンシが増加し、User I/OまたはSystem I/OのWait Classのデータベース時間が増加します。高I/O負荷を処理する場合は、まずI/O負荷の構成を理解します。I/O負荷の構成に基づいて、より深く理解するために別の統計に誘導されます。
AWRレポートでは、Disk Activity・セクションから始めることをお薦めします。このセクションには、Disk Activityの潜在的なソースの概要が表示されます。Disk Activity・セクションは、AWRレポートのExadata Statistics→パフォーマンス・サマリーの下にあります。「Disk Activity」を参照してください。
内部I/O
AWRレポートでは、上位IO理由の中に内部I/Oが報告されている場合は、Internal IO Reasonsを要約したセクションも含められます。このセクションを使用して、内部I/Oの構成を理解します。内部I/O負荷の構成に基づいて、より深く理解するために別の統計に誘導されます。Internal IO Reasonsを参照してください。
親トピック: セル・ディスクI/Oの監視