zabbix和nagios的区别 为什么会产生延时

君,已阅读到文档的结尾了呢~~
nagios页面操作说明
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
nagios页面操作说明
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口nagios优化
&一直在使用nagios做的监控管理,最多的一台nagios服务器已经管理了769台机器,5658个服务,运行良好,状态更新很及时,但在这个过程中做了很多优化,在此列举一下。
1.调整external_command_buffer_slots nagios的命令都是通过这个接收的,处理不过来的命令都会在这排队,如果你管理的service较多,建议将这个值调大。
2.避免servicegroup,hostgroup过大 有一次我的一个servicegroup下的service达到了3670个,导致nagios plugin返回127.将这个servicegroup下的service降到2900个后恢复正常。
3.设置use_large_installation_tweaks 这个设置缺省是关闭的,在监控的service较多的情况下,建议打开这个设置。
4.调整max_concurrent_checks& 如果有部分service的监控状态一直不更新,建议将这个配置适度调大。
5.调整check_result_reaper_frequency 这个配置决定了处理检查结果的频率,如果这个值太大,会导致监控service的状态更新延时变大。
6.调整max_check_result_reaper_time 这个配置决定了每次处理检查结果最多可以花费的时间。这个值太大或太小都会导致监控service的状态更新延时变大。
作者&linux进阶屋&新手园地& & & 硬件问题Linux系统管理Linux网络问题Linux环境编程Linux桌面系统国产LinuxBSD& & & BSD文档中心AIX& & & 新手入门& & & AIX文档中心& & & 资源下载& & & Power高级应用& & & IBM存储AS400Solaris& & & Solaris文档中心HP-UX& & & HP文档中心SCO UNIX& & & SCO文档中心互操作专区IRIXTru64 UNIXMac OS X门户网站运维集群和高可用服务器应用监控和防护虚拟化技术架构设计行业应用和管理服务器及硬件技术& & & 服务器资源下载云计算& & & 云计算文档中心& & & 云计算业界& & & 云计算资源下载存储备份& & & 存储文档中心& & & 存储业界& & & 存储资源下载& & & Symantec技术交流区安全技术网络技术& & & 网络技术文档中心C/C++& & & GUI编程& & & Functional编程内核源码& & & 内核问题移动开发& & & 移动开发技术资料ShellPerlJava& & & Java文档中心PHP& & & php文档中心Python& & & Python文档中心RubyCPU与编译器嵌入式开发驱动开发Web开发VoIP开发技术MySQL& & & MySQL文档中心SybaseOraclePostgreSQLDB2Informix数据仓库与数据挖掘NoSQL技术IT业界新闻与评论IT职业生涯& & & 猎头招聘IT图书与评论& & & CU技术图书大系& & & Linux书友会二手交易下载共享Linux文档专区IT培训与认证& & & 培训交流& & & 认证培训清茶斋投资理财运动地带快乐数码摄影& & & 摄影器材& & & 摄影比赛专区IT爱车族旅游天下站务交流版主会议室博客SNS站务交流区CU活动专区& & & Power活动专区& & & 拍卖交流区频道交流区
白手起家, 积分 9, 距离下一级还需 191 积分
论坛徽章:0
最近配置了个nagios,不过由于nagios发现故障速度太慢,做了以下配置,速度快了不少,5分钟内报警短信能出来,不过还是达不到即时发现要求,
晒下配置参数,不足之处希望大家多指点,
nagios.cfg 主配置文件
状态文件刷新间隔
status_update_interval=5
最大主机检测间隔(不知道理解对不,默认30M改为3M)
max_host_check_spread=3
服务重新检测间隔(60改为 10 )
service_freshness_check_interval=10
我想Nagios能做到即时监控,不知道可行否?
[ 本帖最后由 妖哥 于
20:35 编辑 ]
&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp
丰衣足食, 积分 801, 距离下一级还需 199 积分
论坛徽章:0
nagios的强项本来就是即时监控。建议仔细找些nagios的帖子看看主配置每行的意思。你的这几个理解都不太对。(现在nagios的配置帖子已经非常多了。)
status_update_interval跟调度没关系,不用修改。
freshness是个新鲜度,推荐不要使用。
如果你的监控点在3000以内,那么理顺各配置文件,基本不会有多大延时,实在觉得调度太慢,可以修改service_inter_check_delay_method=n(监控点再多就不推荐修改了),提醒service_interleave_factor这个离散因子不要调。监控点3000以上,搭分布式环境吧。总之主动调度要保证performance info中的平均调度时延别超过5s,基本就算符合监控的要求了。
[ 本帖最后由 exp07 于
20:16 编辑 ]
白手起家, 积分 9, 距离下一级还需 191 积分
论坛徽章:0
感谢楼上的回复...,我试下,
丰衣足食, 积分 889, 距离下一级还需 111 积分
论坛徽章:0
原帖由 妖哥 于
12:12 发表
最近配置了个nagios,不过由于nagios发现故障速度太慢,做了以下配置,速度快了不少,5分钟内报警短信能出来,不过还是达不到即时发现要求,
晒下配置参数,不足之处希望大家多指点,
nagios.cfg 主配置文件 ...
其实我觉得对报警速度影响最大的是services.cfg这个参数:
max_check_attempts& & 4
每次检测都有时间周期,这个参数是4次的检测全部错误,才会发报警,一般我的核心应用都是2次(1次有可能会误报),这样速度会快很多。
这两个参数也会有影响:
& & normal_check_interval 3
& && & retry_check_interval&&2
丰衣足食, 积分 510, 距离下一级还需 490 积分
论坛徽章:0
除非分布式的。
论坛徽章:0
提示: 作者被禁止或删除 内容自动屏蔽当前位置: >
nagios的check_ping插件学习
时间: 11:48 来源:网络整理 作者: 阅读:次
nagios的check_ping插件学习
(nagios插件:nagios-plugins-1.4.12/plugins/check_ping.c)
[root@datacenter libexec]# ./check_ping --help
check_ping v1.4.15 (nagios-plugins 1.4.15)
Copyright (c) 1999 Ethan Galstad &&
Copyright (c)
Nagios Plugin Development Team
Use ping to check connection statistics for a remote host.
check_ping -H &host_address& -w &wrta&,&wpl&% -c &crta&,&cpl&%
[-p packets] [-t timeout] [-4|-6]
-h, --help
Print detailed help screen
-V, --version
Print version information
-4, --use-ipv4
Use IPv4 connection
-6, --use-ipv6
Use IPv6 connection
-H, --hostname=HOST
host to ping
-w, --warning=THRESHOLD
warning threshold pair
-c, --critical=THRESHOLD
critical threshold pair
-p, --packets=INTEGER
number of ICMP ECHO packets to send (Default: 5)
-L, --link
show HTML in the plugin output (obsoleted by urlize)
-t, --timeout=INTEGER
Seconds before connection times out (default: 10)
THRESHOLD is &rta&,&pl&% where &rta& is the round trip average travel
time (ms) which triggers a WARNING or CRITICAL state, and &pl& is the
percentage of packet loss to trigger an alarm state.
This plugin uses the ping command to probe the specified host for packet loss
(percentage) and round trip average (milliseconds). It can produce HTML output
linking to a traceroute CGI contributed by Ian Cass. The CGI can be found in
the contrib area of the downloads section at
Send email to if you have questions
regarding use of this software. To submit patches or suggest improvements,
send email to
[root@datacenter libexec]#
Usage: check_ping -H &host_address& -w &wrta&,&wpl&% -c &crta&,&cpl&%
[-p packets] [-t timeout] [-L] [-4|-6]
具体如下:
-H&&&& 主机地址
-w&&&& WARNING 警告状态:&& 响应时间(毫秒),丢包率 (%)&& 阀值
-c&&&& CRITICAL 危险状态:& 响应时间(毫秒),丢包率 (%)&& 阀值
-p&&&& 发送的包数&&&&&& 默认5个包
-t&&&& 超时时间&&&&&&&& 默认10秒
-4|-6&&&&&&&&&&&&&&&&&& 使用ipv4|ipv6 地址&&&& 默认ipv4
复制代码 代码如下:
./check_ping -H 8.8.8.8 -w 200,20% -c 300,50% -p 3 -t 2
-H 目标主机
-w 延时200丢包20%
-c 延时300丢包50%
延时有3个范围
1. 延时 小于 200
2. 延时 在 200 - 300 范围内
3. 延时 大于 300
小于则输出 OK 正常
范围内则输出 WARNING 警告
大于则输出 CRITICAL 宕机
1、OK 正常
复制代码 代码如下:
[root@204 plugins]# ./check_ping -H 8.8.8.8 -w 200,20% -c 300,50% -p 3 -t 2
PING OK - Packet loss = 0%, RTA = 96.45 ms|rta=96.000;0.000000 pl=0%;20;50;0
2、WARNING 警告
复制代码 代码如下:
[root@204 plugins]# ./check_ping -H 8.8.8.8 -w 100,20% -c 200,50% -p 3 -t 2
PING WARNING - Packet loss = 0%, RTA = 106.00 ms|rta=106.000;0.000000 pl=0%;20;50;0
3、CRITICAL 宕机
复制代码 代码如下:
[root@204 plugins]# ./check_ping -H 8.8.8.8 -w 50,20% -c 100,50% -p 3 -t 2
PING CRITICAL - Packet loss = 0%, RTA = 128.41 ms|rta=128.000;100..000000 pl=0%;20;50;0
感谢您对的支持,我们为您免费提供技术文章,详细使用和说明,有时可能不完善、敬请谅解!如果有错误请给我们留言,我们将尽快修复文章错误,如果您觉得本站不错,请分享给周围的朋友!谢谢!

我要回帖

更多关于 nagios cacti 的文章

 

随机推荐