如何做线上服务器的监控运维和批量操作? | 马犇-技术博客

如何做线上服务器的监控运维和批量操作?

来源:本站原创 微信技术群总结 超过2,441 views围观 0条评论

【今日话题】
如何做线上服务器的监控运维和批量操作? – 黑夜路人

1. 批量操作的话 parallel ssh 很不错 – 姚文强

2. 可以批量的把命令通过ssh 发送到多台主机上. 还可以批量的把文件 通过scp拷贝 到多台主机上. 还可以返回每个主机执行命令的状态 – 姚文强

3. 还是要用日志监控. logstash elasticsearch kibana. 监控线上. 自动化运维工具saltstack – flea

4. 监控的话 分布式监控系统 gonglia 这个貌似很不错 不过还没尝试过
https://www.evernote.com/shard/s180/sh/59e702af-0ac7-4436-bdc1-8ffe60a6e91b/40317d21a058a4f3e80f0e92d7c8643c
这个大家感兴趣的话可以去瞄一下 – 姚文强

回: @姚文强 是Ganglia,我们正在搭建的数据处理平台监控部分就选了这个 – 水浸街

5. 问: ganglia和nagios有啥区别 – 黑夜路人

回: 主要原因是我们使用了hadoop、hbase,Ganglia可以检测到更为详细信息. nagios只能检测到机器信息. 打个比方,nagios类似网络层监控,而Ganglia是应用层监控 – 水浸街

6. 批量执行工具怎么能少的了我,ansible 谁用谁幸福. 有完整的api 开发运维系统必备. 被控端不需要 agent – @理鱼

7. cacti不错!!! 而且还可以自己重构!!!用于网络层,应用层监控!! – 于洋

8. 问: 能问下大家怎么监控mysql主从么. 怎么监控主从同步没有因为error暂停. 需要自己写脚本,定时slave status么 – 轩脉刃

回: 针对nagios那种,应该可以写监控脚本吧,然后把状态写进去 – 黑夜路人

回: 自己写脚本监控同步也好简单,而且可以定义延时多久报警 – Lphy

回: http://exchange.nagios.org/directory/Plugins/Databases/MySQL/Check-MySQL-Replication-Slave-Status/details 看下这插件行不, 插件 => 有没人分享代码 => 自己写, 应该是这样了 – twin

9. 我是认为是工作在应用层监控,所以应该自己弄插件是可以监控到的. 一般监控都是四层监控,七层应该需要自己写插件去监控 – 黑夜路人

回: 第四层是哪一层?有时候这种说法不一致. 按七层来算的话就是传输层 – 陈一回

回: 一般说四层七层都是指的osi模型吧 – 光阴的故事

回: lvs那层 – flea

10. 问: 大家有轻量级的监测系统推荐吗 用来上报接口运行时间和次数 – twin

回: nagios – 随手写的

回: 在nagios官网看到各种demo,还是很大一个系统,得消化下 – twin

11. 监控zabbix 操作saltstack. 80%需求可以满足了 – 张浩

12. 问: saltstack跟puppet这种区别在哪里? – 陈一回

回: puppet 去拉配置 saltstack 推. 个人感觉saltstack更灵活- 张浩

13. puppet 我们做配置管理,推送. 批量操作,我们只是自己用py写了一个 可以并发ssh 操作的 – 一席

回: saltstack也可以的 – 张浩

14. fabric发布用得比较多吧 – 张浩

15. 我们这边用zabbix和puppet. 感觉还是很不错的. 这边puppet做了一个界面,操作起来非常简单可靠. zabbix监控我在处理,之前做的个人感觉不太舒服. 还有,我不知道大家怎么做日志分析监控的. 我来到这边后是自己写了个工具,效果还不错。分析然后给zabbix. 分钟级别 16w条,处理延时在5s内,cpu负载在15%左右,有几秒在80%以上,其余几乎为0 – hello

16. 问: zabbix跟nagios是一个东西么? – 黑夜路人

回: 不是,但都是做监控用的. 各有千秋吧,zabbix比较赞. 他的画图功能非常强大. – hello

17. 了解了下zabbix安装部署比较方便. 更适合服务器比较多的情况 – 黑夜路人

18. 分享个软件monit. 我就当大家不知道了哈. 类似supervisor. 测试了下,资源消耗要少. – hello

回: 怎么看的啊? 我看差不多,就选了supervisor – twin

回: pidstat看的. 还有monit可以管理非daemon的. 反正工具没有优劣,看怎么用了 – hello