获取整个系统的运行状态水平,对其变化和状态进行监控和报警,是保障系统监控运行必不可少的措施。
📌 监控指标定义
服务器
主要为 基础监控指标
[1]
-
CPU
-
使用率过高:连续 300s,80%。一般
-
-
内存
-
剩余可使用空间不足:使用超过85%,剩余可用不足1G。
-
-
磁盘
-
IO 过高:连续 300s,队列超10,使用率80%。一般
-
使用率过高
-
剩余可使用空间不足:空间占用率超90%,可用不足20G。
-
-
网络
-
半连接数过高:超过3w
-
IO 过高:连续 300s,80%。一般
-
时间
-
时钟跳变:超30s。提醒。
-
时区不一致
-
夏令时不正确
-