收藏文章 楼主

争议 | 对于400台云主机+100台k8s的node,这三种监控方案谁更好?

版块:休闲娱乐   类型:普通   作者:小羊羔links   查看:476   回复:0   获赞:0   时间:2022-06-09 14:01:38

来自twt社区同行交流,欢迎更多同行参与交流

400台云主机+ 100台k8s的node,用什么方案监控好呢?Zabbix?Prometheus?还是两套都上?

问题来自社区会员,探讨来自twt社区众多同行的分享,欢迎大家参与交流,各抒己见。
* “争议”栏目内容来自同行分享的一手体验和观察,仅代表个人观点


@jason2006xu 昆仑银行 技术经理

个人建议直接上Prometheus,理由如下

1、Prometheus可以监控主机(cpu、内存、磁盘空间等 、网络。

2、Prometheus是K8s的孪生兄弟,可以监控docker、pod,还有master,比zabbix有天然优势。

3、400台云主机+100个node纳管数量对于Prometheus不是问题。

4、Prometheus可以定制开发exporter轻松实现采集代理定制开发。


@jiaoyutwt  系统运维工程师

400台云主机+ 100台k8s的node。没有说要监控容器,监控的是节点与主机。Zabbix和Prometheus 都可以。推荐Zabbix如果要监控容器,当然用Prometheus,不过现在Zabbix也支持监控k8s,要看模板的支持度能否满足自己的监控需要。自己是做IT基础设施的,当然比较偏向Zabbix,对硬件监控支持度更好、更全面。


@天衣无缝 杭州市中医院 工程师

上只能建议上一套,两个同时上性能开销太大,资源利用率随之下降,两者选其一即可。Prometheus呢直接原生的方案可以直接搞定大批量的资源监控并发,Zabbix呢可能因为并发的限制要稍微设计下架构。


@qiuhaovs  交互工程师

prometheus是最棒的方案,如果你python和go特别好的话,还可以做定制化。


@xylonxiang 湖南高阳通联 运维经理

如果没有特殊要求,建议使用Prometheus监控体系就可以了,只不过部署方案上可能是部署两套。

Prometheus,一套在k8s集群外,一套在k8s集群内,通过Prometheus联邦方式把监控数据集中到k8s集群外的Prometheus中,再配置相应的监控告警规则。


@zhangfan13cmbc 中国民生银行 项目经理

容器云平台的监控首选Prometheus。

从监控指标这个角度,因为Prometheus天然就和k8s监控做了集成,监控指标几乎是开箱即用(这点是最重要的,不管k8s如何升级迭代,我们都不用花精力去适配开发监控指标,因为 k8s 已经提供了基于Prometheus 的专业监控能力 ,一些特殊的监控需求也可以定制开发exporter来实现。

从性能容量这个角度看,400台云主机+ 100台k8s的node只能算是比较小规模的环境了,一套Prometheus server 完全够用,如果后续规模扩大,可以通过Prometheus server 集群的方式来扩大性能容量,支撑能力完全没问题。

从以上两个角度看,只用Prometheus就够了,除非你的项目之前主要使用的是Zabbix,你不想彻底用Prometheus替换Zabbix(毕竟要花巨大的人力物力 ,那就可以考虑用Prometheus 做容器云平台的监控采集,把数据集成到Zabbix里去,这样两套工具就结合起来了。


@powertiandi 李宁(中国 体育用品有限公司 系统架构师

因为不涉及硬件的监控 ,OS+容器 Prometheus 作为趋势和整体方案更为合理些。目前Zabbix监控k8s成熟度还有待提高。


@hufeng719 某钢铁企业 系统工程师

看作者主要关心什么指标。正如大家所说Zabbix偏物理主机、网络、磁盘、资源、进程、服务等综合性较好。Prometheus主要偏向于容器、pod监控。各有各的优点。个人感觉Zabbix简单一些,Prometheus+grafana+alertmanager一直是我的梦想,至今都没完整的搭建出来。尤其是 alertmanager 配置个性化设置较为复杂。具体效果还不太了解。上面jiaoyutwt的老师说Zabbix也支持监控k8s ,不知道监控到什么粒度?有没有模板?能否与大家一起分享下?

@jiaoyutwt
zabbix 6.0 官方已经提供了模板


@chinesezzqiang  信息技术经理

Zabbix虽然是一个开源产品,但是其本身对容器的监控说实话没有Prometheus好,比较适合主机、网络、存储等常规的环境监控。


@pysx0503  系统工程师

按现在主流的方式来说,好像Prometheus对容器的监控更好一些。

按我的理解应该会用Zabbix监控网络和主机性能,Prometheus来主要针对容器监控,形成一个互补的监控方案。

欢迎大家来探讨,点击文末 到原帖发表观点

觉得本文有用,请转发、点赞 点击在看,让更多同行看到


  /文章推荐

  • 基于 Zabbix 系统监控 Windows、Linux、VMware 等

  • 基于 Prometheus 和 Zabbix 实现容器云平台整体监控方案


欢迎关注社区 "监控"技术主题 ,将会不断更新优质 、文章。地址

http://www..com/Topic/3937

下载 twt 社区客户端 APP


长按 即可下载

到应用商店搜索“twt”


长按二维码关注

*本 所发布内容仅代表作者观点,不代表社区立场;封面图片由版权图库授权使用

小羊羔锚文本外链网站长https://seo-links.cn 
回复列表
默认   热门   正序   倒序

回复:争议 | 对于400台云主机+100台k8s的node,这三种监控方案谁更好?

Powered by 小羊羔外链网 8.3.6

©2015 - 2024 小羊羔外链网

免费发软文外链 鄂ICP备16014738号-6

您的IP:54.235.6.60,2024-03-19 11:56:48,Processed in 0.05165 second(s).

支持原创软件,抵制盗版,共创美好明天!
头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息