부록 D Sun Management Center 소프트웨어 규칙
이 부록에서는 Sun Management Center 다음 모듈에 대한 규칙을 설명합니다.
규칙에 대한 개념
규칙은 모니터 대상 호스트 또는 노드의 상태를 확인하기 위해 복잡하거나 특수한 목적의 논리에 사용할 수 있는 경보 확인 메커니즘입니다.
규칙에는 두 가지 유형이 있습니다.
-
단순 규칙은 모니터 대상 등록정보를 규칙과 비교하는 rCompare 규칙을 기초로 합니다. 규칙 조건이 참이면 경보가 생성됩니다. 간단한 규칙으로는 디스크 공간 사용률을 예로 들 수 있습니다. 디스크 공간 사용률이 규칙에서 지정한 비율보다 크거나 같으면 경보가 생성됩니다.
-
복합 규칙은 여러 조건을 기초로 합니다. 다음 조건들이 일치하면 경고 경보가 생성되도록 지정하는 복합 규칙을 예로 들 수 있습니다.
-
디스크를 75% 이상 사용 중입니다.
-
평균 대기열 길이가 10 이상입니다.
-
대기열이 증가합니다.
주 –
사용자 정의 Solstice SyMONTM 1. x 규칙은 Sun Management Center 소프트웨어에서 사용하려면 Sun Management Center 환경으로 포트되어야 합니다.
커널 판독기
다음 표에서는 커널 판독기 단순 규칙에 대해 설명합니다.
표 D–1 커널 판독기 단순 규칙
등록 정보
|
설명
|
avg_1min
|
마지막 1 분 동안의 로드 평균입니다.
|
avg_5min
|
마지막 5 분 동안의 로드 평균입니다.
|
avg_15min
|
마지막 15 분 동안의 로드 평균입니다.
|
cpu_delta
|
이전 시간과 현재 시간 간의 차이입니다.
|
cpu_idle
|
CPU 유휴 시간입니다.
|
cpu_kernel
|
CPU 커널 시간입니다.
|
cpu-user
|
CPU 사용자 시간입니다.
|
cpu_wait
|
CPU 대기 시간입니다.
|
ipctused
|
Inode 사용률입니다.
|
kpctused
|
사용률(KB)입니다.
|
mem-inuse
|
사용 중인 실제 메모리(MB)입니다.
|
numusers
|
사용자 수
|
numsessions
|
사용자 세션 수입니다.
|
swap_used
|
사용된 스왑(KB)입니다.
|
wait_io
|
CPU 대기 시간 정지입니다.
|
wait_pio
|
CPU 대기 시간 정지입니다.
|
wait_swap
|
CPU 대기 시간 정지입니다.
|
다음 표에서는 커널 판독기 복합 규칙에 대해 설명합니다.
표 D–2 커널 판독기 복합 규칙
규칙 ID
|
설명
|
경보 유형
|
rknrd100
|
이 규칙은 임시 이벤트에 적용됩니다. 디스크를 75% 이상 사용 중이고 평균 대기열 길이가 10 이상이며 대기열이 증가하는 경우 경고 경보를 생성합니다. 경고 경보는 디스크 사용률이 70% 미만이고 평균 대기열 길이가 8 미만일 때까지 그대로 남아 있습니다.
|
알림
|
rknrd102
|
이 규칙은 임시 이벤트에 적용됩니다. 스왑 공간을 90% 이상 사용 중이면 경고 경보를 생성합니다. 경보를 유발하는 이벤트는 사용 중인 스왑 공간이 전체 스왑 공간의 80% 미만일 때까지 그대로 남아 있습니다.
|
경고
|
rknrd103
|
이 규칙은 임시 이벤트에 적용됩니다. 지정된 CPU의 스와핑과 페이징이 많은 경우 경고 경보를 생성합니다. 이는 CPU가 스래싱할 수도 있다는 것을 의미합니다. CPU가 초당 1 스왑 아웃, 10 페이지 인 및 10 페이지 아웃을 초과하면 경고 경보가 생성됩니다. CPU가 초당 1 스왑 아웃, 8 페이지 인 및 8 페이지 아웃을 초과하면 경고 경보는 그대로 남아 있습니다.
|
경고
|
rknrd105
|
file system full 오류입니다. 이 규칙은 syslog (/var/adm/message)에서 file system full 오류 메시지를 찾습니다.
|
바로 닫히는 경고 경보
|
rknrd106
|
no swap space 오류입니다. 이 규칙은 syslog (/var/adm/message)에 있는 no swap space 오류 메시지를 찾습니다.
|
바로 닫히는 경고 경보
|
rknrd400
|
이 규칙은 CPU당 6 이상의 시스템 로드가 4 시간 동안 지속하는지 확인합니다.
|
정보
|
rknrd401
|
이 규칙은 x 시간 동안 파일의 90% 이상을 디스크에서 사용하는지 검사합니다. 매개 변수 필드는 CPU 로드가 6 이하인 마지막 시간을 표시하고 2001년의 특정 날짜로 초기화됩니다.
|
정보
|
rknrd402
|
이 규칙은 사용할 수 있는 스왑 공간이 x 시간 동안 10% 이하로 내려가는지 여부를 확인합니다. 매개 변수 필드는 CPU 로드가 6 이하인 마지막 시간을 표시하고2001년의 특정 날짜로 초기화됩니다.
|
정보
|
rknrd403
|
현재 이 규칙은 지원되지 않습니다.
|
정보
|
rknrd404
|
규칙 rknrd401이 4회 발생하면 정보 경보가 생성됩니다.
|
정보
|
rknrd405
|
규칙 rknrd402가 4회 발생하면 정보 경보가 생성됩니다.
|
정보
|
상태 모니터
다음 표에서는 상태 모니터 복합 규칙에 대해 설명합니다.
표 D–3 상태 모니터 복합 규칙
규칙 ID
|
설명
|
경보 유형
|
rhltm000
|
이 규칙은 스왑 공간이 충분히 있는지 확인합니다.
|
위험, 경고, 주의
|
rhltm001
|
CPU가 여유 공간을 확보하기 위해 잠금 대기를 해야 할 때마다 CPU 전력이 소모됩니다. 커널이 상호간에 배타적인 잠금 기능을 사용하여 작업을 동기화하고 여러 CPU가 중요한 코드와 데이터 영역에 동시에 액세스하지 못하도록 하기 때문에 이 이벤트가 중요합니다.
|
위험, 경고, 주의
|
rhltm002
|
호출이 재전송된 후에 복제 응답과 관련하여 NFS 원격 프로시저 호출 시간 초과가 발생할 수 있습니다. 이 시간 초과는 네트워크가 정상이지만 서버가 느리게 응답하고 있음을 나타냅니다.
|
위험, 경고, 주의
|
rhltm003
|
각 시간 간격이 지나면 모든 CPU가 실행 대기열에서 작업을 가져가므로 CPU 수에 의해 실행 대기열 길이가 구분됩니다.
|
위험, 경고, 주의
|
rhltm004
|
사용 중인 디스크나 속도가 느린 디스크는 시스템 처리량을 감소시키고 사용자 응답 시간을 증가시킵니다. 이 규칙은 로드의 균형을 다시 조정할 수 있도록 로드된 디스크를 식별합니다.
|
위험, 경고, 주의
|
rhltm005
|
참조하지 않는 페이지에 대한 체제 시간에 기반한 RAM 규칙입니다. 가상 메모리 시스템은 다른 목적으로 이용할 유휴 페이지를 찾으려고 검색할 때 해당 시스템에 추가 메모리가 필요함을 나타냅니다.
|
위험, 경고, 주의
|
rhltm006
|
이 규칙은 로그인 시도나 네트워크 연결이 예기치 않게 실패할 때 발생하는 커널 메모리 할당과 관련된 문제를 나타냅니다. 문제가 발생한 원인은커널이 주소 공간의 범위 한도에 도달했거나 여유 목록에 할당할 페이지가 포함되어 있지 않기 때문일 수 있습니다. 반복적으로 실패하는 경우 문제를 간과했을 수 있다는 것을 의미합니다.
|
위험, 경고, 주의
|
rhltm007
|
디렉토리 경로 이름 구성 요소의 글로벌 캐시가 있습니다. 이 캐시를 디렉토리 이름 조회 캐시(DNLC)라고 합니다. 이 캐시가 없는 경우 디스크에서 디렉토리 항목을 읽고 스캔하여 올바른 파일을 찾아야 합니다.
|
위험, 경고, 주의
|