收藏文章 楼主

集中式存储 vs 分布式存储,谁更适合部署容器云平台?

版块:IT/互联网   类型:普通   作者:小羊羔links   查看:355   回复:0   获赞:0   时间:2022-09-23 20:48:18

来自twt社区同行交流,欢迎更多同行参与交流

集中式存储和分布式存储哪个更适合部署容器云平台?
集中式存储已经稳定运行多年,分布式存储近年来也发展态势迅猛,对近期比较火的容器云平台哪类存储更加适合?选择依据是什么?不同类型的存储对于容器云平台部署是否有限制?
问题来自社区会员@hf_0535 城商银行系统工程师


@haizdl 技术经理

问题没有特别明确是哪部分场景,就当容器云本身的存储使用场景来看了。

容器平台本身就是一个分布式架构,从纵向的各个方面都追求的是松散的分布式,如果用集中式存储去支撑这样的架构,本身就是不伦不类的组合。再有,当容器平台横向扩展到一定程度,集中式存储读写必然面对上层的并发压力,出现瓶颈。

因此,如果讨论的是容器云平台层的存储使用场景,还是支持分布式存储。


@一只红松鼠

这个问题要分两部分来看,一个是容器自身使用的存储,一个是容器中应用使用的存储,估计问题想讨论的是后者。

对容器自身使用的存储 ,分布式较为常见。毕竟容器的几大组件都是从开源软件发展起来的,而配套的开源存储软件都是分布式存储。

但容器中的应用并不是因为使用了容器才需要存储的,而是因为应用本身就需要使用存储。这时存储的需求就主要看应用对存储的需求。当然还有个其次,那就是存储对容器平台调用配置运维的适配能力。

从17年开始进行应用无状态改造进而向容器搬迁,到18年开始和用户讨论有状态容器(当时主要是文件类需求 使用存储的解决方案,到最近使用K8S的CSI接口支持应用和数据库容器化,看到的容器PaaS使用存储最大的困难就来自存储 者难以满足应用的需要, 者和容器对接困难。第一应用的要求往往开源和一些商业式存储难以满足的,尤其是性能、可靠性和运维。另一方面能满足这些需求的企业级存储(无论是集中式还是分布式 与K8S的对接管理长期都不太好。好在现在基于CSI接口,这个问题得到了比较好的解决,但未到完美的程度。

而从应用对存储的需求来看,各种存储都有在容器上使用的需要。高性能块存储用于数据库,高性能文件主要用于海量小文件类应用,海量存储支撑大文件、大数据应用。

所以总结一下,容器云存储选型,首先从应用需求角度看需要哪类存储,再考虑是否满足容器使用的接口能力需求。


@顾黄亮 苏宁消费金融有限公司 技术总监

脱离了场景谈适合,本身就不适合。

给出一点参考意见,存算分离场景和融合模式场景。

存算分离,架构比较容易理解,计算端和存储端各自建设,通过存储协议连接(iSCSI、NVMf ,架构扩容相对独立,适合较大规模的金融机构基础架构建设。(计算与存储资源需求不均衡场景

融合模式,将分布式存储前移,与计算端(虚拟化/容器 融合,共用底层服务器,将原来的三层结构减少到二层,扩容节点,同时扩容了计算和存储能力,较适合中小型金融机构的基础架构建设。(计算与存储资源需求相对均衡场景


@NealZhang 戴尔科技 CPS

这个问题可以从多个角度来看

容器本身是开源的项目,从这个角度来说,同样源于开源的分布式存储更适合,但是有一个问题 容器云一旦用于生产环境,客户是选择采用类似于云厂商的基于开源架构自己运维,还是选择企业级的产品组合架构?

另一个简单的场景,现在单个磁盘容量越来越大,单节点服务器的容量越来越大,若客户的容量需求在几个节点就能满足的情况下,是使用分布式还是集中式?需要从管理,运维,成本,性能等综合来考虑。


@leizi 中国移动 售前技术支持

还是要考虑容器具体应用的场景,集中存储相比分布式存储的优势依然是提供高性能的存储,对一些业务敏感型的应用依然适合,分布式存储解决海量存储的同时去兼顾存储性能和成本,对于性能要求高且业务集中类型场景的集中存储可能会更好,对于大规模微服务式的业务分布式存储更适合这样的存储场景。


@chinesezzqiang 信息技术经理

这个问题其实还是发散的,要框定不同的场景来说。集中式存储和分布式存储都可以适用容器云平台的建设需求。那么哪些场景适合分布式?哪些适合集中存储,各人见解不同。结合自己的理解,我觉得

1.容器平台自身建议还是分布式存储,这也是大多数平台的首选。因为分布式存储成本低、扩展性的特点,比较适合各类前台应用的使用和按需拓展;

2.容器云内的数据存储,不一定非要用分布式存储,有些场景可以考虑使用集中式存储。比如容器云外挂的业务数据, 者通俗的说是应用数据。这些数据有的存储在数据库内,有的用于文件存储 ,有的用户别的应用外挂,这种场景就可以考虑使用集中式存储;

存储仅仅是容器云平台的一个组件,分布式 者集中式存储都可以适用容器云平台,没有任何的部署方面的限制。


@北京不眠夜 产品经理

集中式存储适合场景

集中式的存储依然是目前不可替代的,一般用于企业的生产、办公等交互频繁的关键业务。因为集中存储效率高,速度快,这是分布式存储不具备的优势,分布式由于数据分布在不同的区域保存,应用存取自然会损耗一定的存取时延。

集中式存储的物理介质集中布放;数据要上传到中心对机房环境要求高,要求机房空间大,承重、空调等都是需要考虑的问题。

传统的SAN存储,面对PB级规模存储时,成本非常高,数据共享差,难以支撑多用户文件共享。

常见的NAS存储,由于共享网络带宽,并发性能差。

分布式存储适合场景

大数据、时序数据库,列式数据库,非结构化数据,搜索引擎索引等。

海量数据的非结构化数据最适合分布式存储,加快系统的读写速度,提高系统的容错性和可用性。

分布式存储的物理介质可以分布到不同的地理位置,数据就近上传,对骨干网带宽要求低;可采用多套低端的小容量的存储设备分布部署,设备价格和维护成本较低;小容量设备分布部署,对机房环境要求低。


@笑笑 三一 软件架构设计师

这个从两方面来看 1.如果是上公有云,你就选择公有云的各种性能级别的存储 2.如果是自建容器云平台,有两种建设方式,2.1 在虚拟化平台上搭建 2.2在物理机上搭建 。如果是在虚拟化平台搭建,虚拟化平台如果使用集中存储,那么你容器云大概率使用集中存储。如果是在物理机上搭建,既然有这个能力,可以考虑搭建一套ceph来提供存储空间。不同类型存储肯定对容器云平台部署是有限制的。


@pysx0503 系统工程师

对容器的理解并不深,不过集中式存储和分布式存储的争论倒是由来已久,信息化发展到现在,已经变得越来越多元化,不再像初期时那样有固定的架构模式,现在的信息化更像是一个拼装的积木。集中是存储,分布式存储都不过是一个积木块。在合适的位置采用合适的积木。而整个积木的成品多数已经不仅仅局限在某一种积木了。

从容器的特点来看。分布式似乎更适 为容器的运行环境,而集中式存储则更适合对数据的可靠性,IO性能等要求更高的业务,同时,信息化的规模。未来的发展规划,资金,技术 入的状况也都会影响最后的选型。对于众多的中小企业来说。往往初期时候要选择性价比高的方式来兼顾所有业务,随着业务的扩展在逐步将计算,存储等业务逐步分离成独立的架构。


@cpc1989 某保险公司 存储工程师

对于容器云平台来说,容器云原生存储方案与容器平台的契合度更高,它基于服务器本地存储盘构建分布式存储资源池 ,可以充分发挥容器平台的优势,满足高可用性、可扩展性、动态部署、存储服务自维护的需求,但成熟度还不高,目前有多种开源和商业方案。

当然,容器云平台也可以通过CSI插件也能适配传统的集中式存储,能满足NFS、Block接口的存储需求。传统集中式存储成熟度高,也有着性能、稳定性优势,但与容器平台架构的匹配度不高。

技术选型可以优先尝试考虑契合度更高的存储方案,而最终转向生产环境时,则需要综合方案的契合度与成熟度。


@menglunyang 中国银行 系统工程师

个人认为分布式存储更适合部署容器云平台,首先容器平台需要具备弹性能力,分布式存储天然具有横向扩展能力,在性能和高可用方面远优于集中式存储,非常适合应对大规模虚拟化场景。与此同时,分布式存储也逐渐具备了企业级存储的能力,包括快照、克隆等等。

虽然分布式存储更适合部署容器云平台,但容器云平台依然也需要对接集中式存储,对于需要稳定性好,高IO性能的厂家可以提供集中式存储的能力,比较好的做法是容器平台默认使用分布式存储,对于特殊场景提供集中存储能力。


@s6dong 东软集团 IT技术咨询顾问

首先,容器云平台可以部署在集中式存储上,也可以部署在分布式存储上。如果说哪一种存储类似合适,可以说是各有利弊,具体还要看实际应用场景。

其次,集中式存储部署容器云可以说是没有任何问题,不管是对容器的有状态还是无状态应用都能够提供很好的支持,在性能上来讲,高端存储也能够满足。如果是传统的业务应用场景,还是能够满足使用的。但是集中式存储最大的问题可能来自扩展性、成本和灵活性的挑战。容器云平台大多为敏捷应用使用,需要面对灵活的交付场景和IT运营模式,集中式存储稍显能力不足,特别是当容器云规模越来越大的情况下,集中式存储的成本、扩容能力和灵活性问题会越来越突出,可以说是后劲不足,发展弊端会越来越明显。

容器云的发展离不开分布式存储系统,在大规模容器云平台环境下,分布式存储提供的灵活扩展能力和成本更容易满足容器云平台的建设和发展。但是,在选择和使用分布式存储时候,也需要考虑一些问题。如果选择不好,可能还不如选择集中式存储。当容器云采用 K8s 容器编排并部署业务应用后,会面临如何在容器环境中访问持久化数据的问题。也就是容器云平台如何使用有状态应用的问题,包括接口适配、Pod跨节点重建后快速访问原有数据、多Pod间数据共享等问题。分布式存储最好能够提供标准的CSI插件对接K8S, 者是其他类似的解决方案去处理数据存储问题。在性能方面,分布式存储需要合理配置硬盘类型和节点数量配比,否则性能会大打折扣。在扩展性方面,要了解现有分布式存储的扩容机制,是否存在扩容重建时间过长的问题,否则会在后期扩容和运维过程中极大的影响生产系统性能。

最后,集中和分布式存储原则上都能满足容器云平台的需要,但是还要看具体的应用场景和需求,还需要选择对合适的产品。


您怎么看?

欢迎大家来探讨,点击文末 到原帖发表观点

觉得本文有用,请转发、点赞 点击在看,让更多同行看到


  /文章推荐

  • 基于容器特点和传统网络安全能力进行容器云安全规划设计 | 联盟发布

  • 如何设计容器云平台内部集群的网络隔离?

  • 容器云对接持久化存储并使用 | 最佳实践


欢迎关注社区 “容器云”技术主题 ,将会不断更新优质 、文章。地址

https://www..com/Topic/98447

下载 twt 社区客户端 APP


长按 即可下载

到应用商店搜索“twt”


长按二维码关注

*本 所发布内容仅代表作者观点,不代表社区立场

小羊羔锚文本外链网站长https://seo-links.cn 
回复列表
默认   热门   正序   倒序

回复:集中式存储 vs 分布式存储,谁更适合部署容器云平台?

Powered by 小羊羔外链网 8.3.11

©2015 - 2024 小羊羔外链网

免费发软文外链 鄂ICP备16014738号-6

您的IP:216.244.66.232,2024-04-18 17:56:12,Processed in 0.06292 second(s).

支持原创软件,抵制盗版,共创美好明天!
头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息