Sun Management Center 3.6.1 사용 설명서

부록 D Sun Management Center 소프트웨어 규칙

이 부록에서는 Sun Management Center 다음 모듈에 대한 규칙을 설명합니다.

규칙에 대한 개념

규칙은 모니터 대상 호스트 또는 노드의 상태를 확인하기 위해 복잡하거나 특수한 목적의 논리에 사용할 수 있는 경보 확인 메커니즘입니다.

규칙에는 두 가지 유형이 있습니다.

커널 판독기

다음 표에서는 커널 판독기 단순 규칙에 대해 설명합니다.

표 D–1 커널 판독기 단순 규칙

등록 정보 

설명 

avg_1min 

마지막 1 분 동안의 로드 평균입니다. 

avg_5min 

마지막 5 분 동안의 로드 평균입니다. 

avg_15min 

마지막 15 분 동안의 로드 평균입니다. 

cpu_delta 

이전 시간과 현재 시간 간의 차이입니다. 

cpu_idle 

CPU 유휴 시간입니다. 

cpu_kernel 

CPU 커널 시간입니다. 

cpu-user 

CPU 사용자 시간입니다. 

cpu_wait 

CPU 대기 시간입니다. 

ipctused 

Inode 사용률입니다. 

kpctused 

사용률(KB)입니다. 

mem-inuse 

사용 중인 실제 메모리(MB)입니다. 

numusers 

사용자 수 

numsessions 

사용자 세션 수입니다. 

swap_used 

사용된 스왑(KB)입니다. 

wait_io 

CPU 대기 시간 정지입니다. 

wait_pio 

CPU 대기 시간 정지입니다. 

wait_swap 

CPU 대기 시간 정지입니다. 

다음 표에서는 커널 판독기 복합 규칙에 대해 설명합니다.

표 D–2 커널 판독기 복합 규칙

규칙 ID 

설명 

경보 유형 

rknrd100

이 규칙은 임시 이벤트에 적용됩니다. 디스크를 75% 이상 사용 중이고 평균 대기열 길이가 10 이상이며 대기열이 증가하는 경우 경고 경보를 생성합니다. 경고 경보는 디스크 사용률이 70% 미만이고 평균 대기열 길이가 8 미만일 때까지 그대로 남아 있습니다.

알림 

rknrd102

이 규칙은 임시 이벤트에 적용됩니다. 스왑 공간을 90% 이상 사용 중이면 경고 경보를 생성합니다. 경보를 유발하는 이벤트는 사용 중인 스왑 공간이 전체 스왑 공간의 80% 미만일 때까지 그대로 남아 있습니다.

경고 

rknrd103

이 규칙은 임시 이벤트에 적용됩니다. 지정된 CPU의 스와핑과 페이징이 많은 경우 경고 경보를 생성합니다. 이는 CPU가 스래싱할 수도 있다는 것을 의미합니다. CPU가 초당 1 스왑 아웃, 10 페이지 인 및 10 페이지 아웃을 초과하면 경고 경보가 생성됩니다. CPU가 초당 1 스왑 아웃, 8 페이지 인 및 8 페이지 아웃을 초과하면 경고 경보는 그대로 남아 있습니다.

경고 

rknrd105

file system full 오류입니다. 이 규칙은 syslog (/var/adm/message)에서 file system full 오류 메시지를 찾습니다.

바로 닫히는 경고 경보 

rknrd106

no swap space 오류입니다. 이 규칙은 syslog (/var/adm/message)에 있는 no swap space 오류 메시지를 찾습니다.

바로 닫히는 경고 경보 

rknrd400

이 규칙은 CPU당 6 이상의 시스템 로드가 4 시간 동안 지속하는지 확인합니다.  

정보 

rknrd401

이 규칙은 x 시간 동안 파일의 90% 이상을 디스크에서 사용하는지 검사합니다. 매개 변수 필드는 CPU 로드가 6 이하인 마지막 시간을 표시하고 2001년의 특정 날짜로 초기화됩니다.

정보 

rknrd402

이 규칙은 사용할 수 있는 스왑 공간이 x 시간 동안 10% 이하로 내려가는지 여부를 확인합니다. 매개 변수 필드는 CPU 로드가 6 이하인 마지막 시간을 표시하고2001년의 특정 날짜로 초기화됩니다.

정보 

rknrd403 

현재 이 규칙은 지원되지 않습니다. 

정보 

rknrd404

규칙 rknrd401이 4회 발생하면 정보 경보가 생성됩니다.  

정보 

rknrd405

규칙 rknrd402가 4회 발생하면 정보 경보가 생성됩니다.  

정보 

상태 모니터

다음 표에서는 상태 모니터 복합 규칙에 대해 설명합니다.

표 D–3 상태 모니터 복합 규칙

규칙 ID 

설명 

경보 유형 

rhltm000

이 규칙은 스왑 공간이 충분히 있는지 확인합니다.

위험, 경고, 주의 

rhltm001

CPU가 여유 공간을 확보하기 위해 잠금 대기를 해야 할 때마다 CPU 전력이 소모됩니다. 커널이 상호간에 배타적인 잠금 기능을 사용하여 작업을 동기화하고 여러 CPU가 중요한 코드와 데이터 영역에 동시에 액세스하지 못하도록 하기 때문에 이 이벤트가 중요합니다.

위험, 경고, 주의 

rhltm002

호출이 재전송된 후에 복제 응답과 관련하여 NFS 원격 프로시저 호출 시간 초과가 발생할 수 있습니다. 이 시간 초과는 네트워크가 정상이지만 서버가 느리게 응답하고 있음을 나타냅니다.

위험, 경고, 주의 

rhltm003

각 시간 간격이 지나면 모든 CPU가 실행 대기열에서 작업을 가져가므로 CPU 수에 의해 실행 대기열 길이가 구분됩니다.

위험, 경고, 주의 

rhltm004

사용 중인 디스크나 속도가 느린 디스크는 시스템 처리량을 감소시키고 사용자 응답 시간을 증가시킵니다. 이 규칙은 로드의 균형을 다시 조정할 수 있도록 로드된 디스크를 식별합니다.

위험, 경고, 주의 

rhltm005

참조하지 않는 페이지에 대한 체제 시간에 기반한 RAM 규칙입니다. 가상 메모리 시스템은 다른 목적으로 이용할 유휴 페이지를 찾으려고 검색할 때 해당 시스템에 추가 메모리가 필요함을 나타냅니다.

위험, 경고, 주의 

rhltm006

이 규칙은 로그인 시도나 네트워크 연결이 예기치 않게 실패할 때 발생하는 커널 메모리 할당과 관련된 문제를 나타냅니다. 문제가 발생한 원인은커널이 주소 공간의 범위 한도에 도달했거나 여유 목록에 할당할 페이지가 포함되어 있지 않기 때문일 수 있습니다. 반복적으로 실패하는 경우 문제를 간과했을 수 있다는 것을 의미합니다.

위험, 경고, 주의 

rhltm007

디렉토리 경로 이름 구성 요소의 글로벌 캐시가 있습니다. 이 캐시를 디렉토리 이름 조회 캐시(DNLC)라고 합니다. 이 캐시가 없는 경우 디스크에서 디렉토리 항목을 읽고 스캔하여 올바른 파일을 찾아야 합니다.  

위험, 경고, 주의