在11月4日举办的2021腾讯数字生态大会云原生专场上 , 腾讯云联合中国信通院率先在国内重磅发布了《降本之源-云原生成本管理白皮书》(简称白皮书) , 基于腾讯云在业内最大规模的Kubernetes 实践经验 , 系统性呈现云原生成本优化方法论和最佳实践路径 。
文章图片
【率先在国内首发《云原生成本管理白皮书》,腾讯云打造云原生成本优化最佳实践】腾讯云容器产品总经理邹辉表示:“Kubernetes是云原生技术栈的核心 , 腾讯云原生经过多年的技术积累以及众多腾讯内外部复杂业务考验已经步入非常成熟的阶段 。 TKE 目前拥有国内最大规模的 Kubernetes 集群以及业界最好的 Kubernetes 成本优化实践;目前TKE运行着 900 万+个Pod, 管理了数千万 CPU 核;同时我们大规模在腾讯内部核心业务中应用了成本优化技术 , CPU 利用率最高提升了3倍;在腾讯外部 , 小红书80%的业务都跑在TKE上 , 成本降低了40% 。 ”
当前 , 越来越多的企业开始拥抱云计算 , 但随着用云程度的加深 , 云资源浪费的问题也变得越发明显 。 白皮书指出 , 弹性按需是云原生的资源利用优势 , 但如果资源配置策略设置不合理可能会导致资源的浪费 。 此外 , 云原生资源利用的计量方式如果不够灵活 , 会使得企业难以准确调控用云成本 , 因此 , 企业在应用云原生架构之后 , 需要考虑如何管理、优化和使用云原生服务来进一步提升业务的数字化转型效 。
基于丰富的海量应用服务经验 , 腾讯云原生在内部和外部都有着成熟的资源优化方法论 。 在内部 , 腾讯云采用资源利用率成熟度模型 , 通过四个阶段对业务进行容器化 , 最终实现利用率达到60~70% 。 在外部 , 腾讯云推出了容器产品“成本大师” , 从成本洞察、成本优化、成本运营三个层面来协助企业做更好的成本管理 。
据介绍 , 成本大师具有全链路的成本优化能力 , 能够精确智能的进行成本洞察 , 一分钟发现资源浪费 , 并提供8种弹性策略组合 , 满足任意场景的弹性需求 , 而全构混部是业内首家云上支持CPU/GPU的混部产品 , 覆盖腾讯千万核资源规模 。 核心能力 qGPU , 是强隔离的 GPU 虚拟化技术 , 该技术在业内首次实现了GPU算力、显存和故障的强隔离 , 支持算力精细切分共享和多优先级混部 ,GPU利用率最高可提升230% 。
文章图片
《降本之源-云原生成本管理白皮书》正是腾讯基于内外云原生成本管理最佳实践 , 并结合行业优秀案例 , 提出的一套体系化的云原生成本优化方法论和最佳实践路径 。 旨在帮助企业改善用云成本 , 充分发挥云原生的效能和价值 。
此外 , 白皮书中 , 腾讯云还通过对数十个客户的详细访谈 , 了解到在企业实际成本管理中存在的焦点问题 , 并基于资源利用率的现状和挑战 , 整理出企业使用的“成本洞察”、“成本优化”、“成本运营”三阶段云原生成本管理模型 。
成本洞察即团队需要定义一致的标签和命名空间来改善分配 , 基于多维度(如云产品、环境、业务线)的资源和成本的可视化分析 , 能够帮助团队有效地建立起相应的问责机制 , 并根据获取到的实时数据快速制定优化方案及措施 。
成本优化是对云资源规格、数量的调整 , 也包含了对业务的架构优化、以及通过弹性能力和资源混部等手段提升资源利用率 。 主要方案包括:设置合适的资源请求 , 通过动态调度解决资源碎片的问题 , 提高装箱率 。 通过弹性和混部做到按需使用;对于固定资源池 , 对负载峰值在不同时段的在线应用、在离线应用进行混部 , 做到分时复用;针对 GPU 资源 , 实现资源的池化和共享 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
