设为首页 | 收藏本站

400-650-1086

监控范围:Windows(2K\XP\2003\Vista)
LINUX(Red Hat\SUSE \红旗 \Ubuntu Linux\FreeBSD\Turbo)
UNIX(Solaris 8、9、10)\AIX (4.X、5.1、5.2、5.3)\HP-UX (11i)
监控方式:SNMP\AGENT
监控说明:SNMP方式监控,被管机器上仅需要启动SNMP服务,采集的指标为一些通用指标,AGENT方式监控,需要在被管机器上安装AGENT程序,采集的指标丰富,而且可以根据具体需要进行定制,AGENT监测方式支持对主机的简要操作。
注:AGENT程序是经过严格测试,对目标机器的资源占用很少,也可限定对内存的占用大小,不会影响目标机器的正常运行。
指标分析:
UNIX\LINUX

监控项
指标名
描述
报警范围
CPU
CPUCpuUtil
显示的是CPU使用率
一般报警:90% ~ 95%
严重报警:95% ~ 100%
CPULoad
在采样间隔内,内核中运行队列中排队的进程的平均值
需要了解系统的实际情况后而定
CPUUserTime
用户模式下的命令使用的CPU的时间
需要了解系统的实际情况后而定
CPUSysTime
系统模式下的系统命令使用的CPU的时间
一般报警:90% ~ 95%
严重报警:95% ~ 100%
文件系统
FSCapacity
反映了文件系统使用空间的百分比
一般报警:96% --- 98%
严重报警:98% ~ 100%
FSMountState
文件系统挂载状态
一般告警:1(unmounted)
严重告警:2(unknown)
内存
MEMFreeMem
反映了操作系统中空闲的内存
一般报警:100 ---200K
严重报警:0 ---100K
MEMRCache
缓冲区逻辑读的百分比
一般报警:1-10%
严重报警:10-20%
进程
PROCTopProcs
显示最占用系统资源的前10个进程
文本输出
PROCExec
每秒钟系统调用次数
图形显示
交换区
SWPTotSwapUsedPercent
反映的是系统中所有的交换区的使用的空间的数量
一般报警:90% ~ 95%
严重报警:95% ~ 100%
用户
USRNoUser
在系统登陆的用户数
图形显示
UsrNoSession
用户session数量
图形显示

WINDOWS

监控项
指标名
描述
报警范围
磁盘
Logical Disk Space
显示逻辑硬盘剩余空间的百分比
一般报警:5% ~ 10%
严重报警:0 ~ 5%
CPU
CPU
在采样间隔内,系统使用CPU的时间
一般报警:90% ~ 95%
严重报警:95% ~ 100%
内存
Memory Available
显示内存的可用空间
一般报警:4MB ~10M
严重报警:<4MB
Memory Page Faults
显示每分钟Memory Page Faults的次数
一般报警:10~20
严重报警:<10 Page File
PageFile
Page File
Page文件使用的百分比
一般报警:80% ~90%
严重报警:90% ~ 100%
进程
ProcTopProcs
消耗资源最大的Top10的进程
文本显示
安全
SECsvrErrorsLogon
检查从系统启动开始的所有失败的登陆次数
图形显示
SECsvrErrorsLogonDelta
上一轮询周期内的登陆失败次数
图形显示
服务
ServiceStatus
监控自动启动的服务启动情况
严重报警:not running