当前位置:首页 > 科技  > 软件

Karmada 多云容器编排技术加速分布式云原生应用升级

来源: 责编: 时间:2024-10-23 09:18:42 185观看
导读 本文来源于《华为云 DTSE®》第五期开源专刊,更多文章请查看:https://bbs.huaweicloud.com/blogs/435823作者:任洪彩华为云高级软件工程师,Karmada 社区 Maintainer摘要:管理和协调跨多个云平台的容器化应用是当前

本文来源于《华为云 DTSE®》第五期开源专刊,更多文章请查看:https://bbs.huaweicloud.com/blogs/435823FXJ28资讯网——每日最新资讯28at.com

作者:任洪彩华为云高级软件工程师,Karmada 社区 MaintainerFXJ28资讯网——每日最新资讯28at.com

摘要:管理和协调跨多个云平台的容器化应用是当前企业面临的复杂性挑战之一,Karmada 多云容器编排技术使得用户能够像操作单一集群一样轻松管理多集群,简化了多云环境的运维复杂度,加速分布式云原生应用升级。FXJ28资讯网——每日最新资讯28at.com

行业背景FXJ28资讯网——每日最新资讯28at.com

随着云计算技术的飞速发展,企业对于云基础设施的需求日益多样化,多云策略成为了众多企业的首选。多云环境不仅能够提高业务的灵活性和可用性,还能有效降低对单一云服务商的依赖风险。根据最新的调查报告显示,超过 87% 的企业正在使用多个云厂商的服务,然而,随之而来的是管理和协调跨多个云平台的容器化应用的复杂性挑战。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

业界流行的容器编排工具 Kubernetes(简称 K8s),虽然在单一集群内展现了强大的资源管理和自动化部署能力,但在面对多云场景时,其跨集群的资源调度、统一管理以及数据一致性等问题成为了亟待解决的痛点。FXJ28资讯网——每日最新资讯28at.com

现阶段,云原生多云多集群业务的编排面临着诸多挑战:FXJ28资讯网——每日最新资讯28at.com

1)集群繁多的重复劳动:运维工程师需要应对繁琐的集群配置、不同云厂商集群间的管理差异以及碎片化的 API 访问入口等问题。FXJ28资讯网——每日最新资讯28at.com

2)业务过度分散的维护难题:应用在各集群的差异化配置繁琐;业务跨云访问以及集群间的应用同步难以管理。FXJ28资讯网——每日最新资讯28at.com

3)集群的边界限制:应用的可用性受限于集群;资源调度、弹性伸缩受限于集群。FXJ28资讯网——每日最新资讯28at.com

4)厂商绑定:业务部署的黏性问题,缺少自动化故障迁移;缺少中立的开源多云容器编排项目。FXJ28资讯网——每日最新资讯28at.com

Karmada 多云容器编排引擎,简化多云环境管理复杂度FXJ28资讯网——每日最新资讯28at.com

为了解决上述挑战,华为于 2021 年正式推出了开源项目 Karmada,旨在打造一个云原生的多云容器编排平台。Karmada(Kubernetes Armada,舰队之意)继承并超越了社区 Federation v1 和 v2(kubefed)的设计理念,它不是简单地在不同集群间复制资源,而是通过一套全新的 API 和控制面组件,实现了在保持 Kubernetes 原有资源定义 API 不变的前提下,无缝地在多云环境中部署和管理分布式工作负载。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

Karmada 提供了一个全局的控制面板,使得用户能够像操作单一集群一样管理多云上的 Kubernetes 集群,简化了多云环境的运维复杂度,引入了高级的跨集群调度策略,根据资源需求、成本、合规性等因素,自动将工作负载优化部署到最适合的云平台或区域。通过分布式数据管理和同步机制,确保多云间的数据和配置一致性,降低了数据管理的复杂度。FXJ28资讯网——每日最新资讯28at.com

实践案例:Karmada 在工业智能检测领域的应用FXJ28资讯网——每日最新资讯28at.com

工业智能检测领域亟需标准化智能检测提升效率FXJ28资讯网——每日最新资讯28at.com

在液晶面板生产领域,由于多种因素,产品常出现不良品。为此,关键工艺节点后引入了自动光学检测(AOI)设备,通过光学原理检测常见缺陷。然而,现有 AOI 设备仅识别缺陷有无,需要人工分类和识别缺陷,这一过程耗时且影响生产效率。数之联的客户企业,某面板龙头企业,引入自动缺陷分类系统(ADC)以提高判定准确性并减轻劳动强度,使用深度学习技术自动分类 AOI 输出的缺陷图片,并筛除误判,从而提高生产效率。FXJ28资讯网——每日最新资讯28at.com

客户企业率先在一个工厂引入 ADC,后续在其他工厂推广,节省人力资源,提高判定效率。尽管如此,由于工艺复杂和供应商差异,现场建设呈现出割裂和分散管理的趋势,给数据共享和运维带来困难。为解决这些问题,客户企业启动了工业智能检测平台的建设,该平台利用人工智能技术,实现标准化智能检测并提高生产效率和良率。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

工业智能检测平台FXJ28资讯网——每日最新资讯28at.com

工业智能检测平台将 ADC 作为核心,扩展至模型训练和检测复判,实现“云”(管理 + 训练)+“边”(推理)+“端”(业务)的一体化方案,旨在通过标准化平台提高生产质量和数据价值。建设范围包括资源共享中心、现地训练和边侧推理等子平台,将在若干工厂实施。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

工业智能检测平台架构图FXJ28资讯网——每日最新资讯28at.com

项目目标是实现现地 ADC 上线、资源共享和云边端标准化,以减轻运维负荷、提升标准。工业智能检测平台旨在通过规范化和标准化客户企业全集团的 ADC 系统,为后续 ADC 建设提供样本和模板,降低成本和周期,提高生产和质检效率以及产品良率。平台包含系统管理员、资源配置员等用户角色,并涉及 ADC 推理、模型训练、数据共享等信息流,以及云端协同功能,确保 ADC 的自动缺陷分类生产过程,并提高模型和缺陷图片的利用率。FXJ28资讯网——每日最新资讯28at.com

结合 Karmada 多集群管理构建解决方案FXJ28资讯网——每日最新资讯28at.com

一、集群管理:多地域集群统一纳管FXJ28资讯网——每日最新资讯28at.com

不同地域的 K8s 集群注册至中心云系统,中心云系统对多个现地的集群进行管理。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

二、应用管理:全局统一部署、监控FXJ28资讯网——每日最新资讯28at.com

通过 Karmada 提供的集群统一访问能力,用户在中心云实现可视化大屏等需要聚合成员集群的数据的功能。FXJ28资讯网——每日最新资讯28at.com

1、集群监控FXJ28资讯网——每日最新资讯28at.com

针对在线的集群,中心云系统可对内存、CPU、磁盘、网络流入流出速率、GPU、日志等指标进行监控数据展示,并可切换集群进行数据查看。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

资源监控FXJ28资讯网——每日最新资讯28at.com

中心云可以看到和训练云相同的监控,通过 Karmada 聚合层 API 由集群的 Java 程序对 PromQL 封装后提供给前端页面。FXJ28资讯网——每日最新资讯28at.com

2、中心云数据下发FXJ28资讯网——每日最新资讯28at.com

用户在中心云上传的数据,可自由选择下发至指定现地,包括数据集、标注、算子工程、算子镜像以及模型等。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

数据集、算子工程、模型,通常是文件,在完成传输后,会保存到本地或 NAS 等存储中。标注,通常是结构化数据,在完成传输后,会保存到 DB 中。算子镜像,一般导出为 tar 包,在完成传输后,会推送到当前集群的 harbor 中。中心云除了 Karmada 的控制面以外,也带有自己的业务 K8s 集群,也包括存储,因此可以作为一个中转器。以上均通过 Karmada 的聚合层 API 来调用我们提供的文件上传到 svc,实现了集群和集群之间的调用。FXJ28资讯网——每日最新资讯28at.com

3、跨现地训练FXJ28资讯网——每日最新资讯28at.com

针对某现地训练资源不足的情况下,可通过申请其他现地资源的方式,进行跨现地训练。该功能实现方式为将 A 现地训练所需要的数据集、标注、算子工程、算子镜像等数据发送至 B 现地,通过 B 现地的资源进行训练。再将训练好的模型返回给 A 现地。FXJ28资讯网——每日最新资讯28at.com

FXJ28资讯网——每日最新资讯28at.com

原理和中心云数据下发类似,任务所需的数据会直接发送到对应集群,体现了成员集群和成员集群之间的调用关系。FXJ28资讯网——每日最新资讯28at.com

4、可视化大屏FXJ28资讯网——每日最新资讯28at.com

根据中心云注册的现地,统计不同现地的各类指标数据进行大屏展示。在这类大屏中展示实时数据的时候,通过 Karmada 聚合层 API,我们可以方便地直接调用成员集群的 svc,而无需让所有的数据显示都走大数据的离线分析、实时分析,提供更高的时效性。FXJ28资讯网——每日最新资讯28at.com

总结展望FXJ28资讯网——每日最新资讯28at.com

Karmada 项目自 2021 年开源并加入云原生计算基金会 (CNCF) 成为沙箱项目以来,已经取得了显著的发展与认可。项目于 2023 年底正式晋升为 CNCF 的孵化级别项目。这一成就标志着 Karmada 技术生态获得全球业界的广泛认可,进一步巩固了其在分布式云原生技术领域的领先地位。该项目凭借其创新的多云多集群容器编排能力,已被全球范围内超过 30 家知名企业所采纳用于构建企业级云原生平台。FXJ28资讯网——每日最新资讯28at.com

Karmada 的出现,为多云时代的企业提供了一个强大且灵活的容器编排解决方案,它不仅解决了多云管理的痛点,还为企业在云原生旅程中探索更广阔的应用场景提供了坚实的技术支撑。随着云原生技术的不断演进,Karmada 有望成为连接和简化多云生态的关键力量,助力企业释放云的全部潜能,加速数字化转型的进程。FXJ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-125113-0.htmlKarmada 多云容器编排技术加速分布式云原生应用升级

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: KubeEdge:云原生边缘计算赋能多行业、多场景的智能化升级

下一篇: 基于微服务 SDK 框架与 JavaAgent 技术,华为云全链路灰度发布方案助力应用发布效率

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 7月安卓手机性价比榜:努比亚+红魔两款新机入榜

    7月登场的新机有努比亚Z50S Pro和红魔8S Pro,除了三星之外目前唯二的两款搭载超频版骁龙8Gen2处理器的产品,而且努比亚和红魔也一贯有着不错的性价比,所以在本次的性价比榜单
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • 华为Mate 60系列用上可变灵动岛:正式版体验将会更出色

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • 回归OPPO两年,一加赢了销量,输了品牌

    成为OPPO旗下主打性能的先锋品牌后,一加屡创佳绩。今年618期间,一加手机全渠道销量同比增长362%,凭借一加 11、一加 Ace 2、一加 Ace 2V三款爆品,一加
  • 机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

    7月20日消息,据外媒报道,研究机构的报告显示,由于需求下滑,今年二季度全球智能手机的出货量,同比下滑了11%,三星、苹果等主要厂商的销量,较去年同期均有下
  • 北京:科技教育体验基地开始登记

      北京“科技馆之城”科技教育体验基地登记和认证工作日前启动。首批北京科技教育体验基地拟于2023年全国科普日期间挂牌,后续还将开展常态化登记。  北京科技教育体验基
Top