我正在使用最新的sensu核心版本0.26.1,在一台CentOS机器上设置sensu服务器,在另一台机器上设置一个sensu客户端.
在一个sensu客户端中有大约500个检查,我一直"previous check command execution in progress"
在sensu-client.log中看到,但每个检查实际上都非常快(大多数小于0.1秒,间隔为60秒),我可以通过运行它来确认sensu
用户sudo su sensu -c "{run my check}"
.
然而,实际情况是,在uchiwa仪表板中,它显示我的许多支票运行超过1分钟,似乎感觉客户端严重卡住/慢,我尝试了以下方法:
删除几个长时间运行的检查并重启sensu服务器/客户端
将超时定义添加到我的检查中,将超时限制为10,然后导致许多检查"执行超时".
我试过只运行1次,10次,50次检查,似乎一切正常,但是,一旦检查计数达到一定数量可能是200-300,问题就出现了.
以上工作都没有,有没有办法调试哪些检查实际上是阻塞的?或者我可以将sensu配置为在超出timeout
定义时简单地终止检查吗?所以我不会在日志中看到此消息"以前的检查命令正在执行"
我被这个阻止了,需要帮助:)