当前位置:首页 > 科技  > 软件

Karmada 多云容器编排技术加速分布式云原生应用升级

来源: 责编: 时间:2024-10-23 09:18:42 206观看
导读 本文来源于《华为云 DTSE®》第五期开源专刊,更多文章请查看:https://bbs.huaweicloud.com/blogs/435823作者:任洪彩华为云高级软件工程师,Karmada 社区 Maintainer摘要:管理和协调跨多个云平台的容器化应用是当前

本文来源于《华为云 DTSE®》第五期开源专刊,更多文章请查看:https://bbs.huaweicloud.com/blogs/435823Xnj28资讯网——每日最新资讯28at.com

作者:任洪彩华为云高级软件工程师,Karmada 社区 MaintainerXnj28资讯网——每日最新资讯28at.com

摘要:管理和协调跨多个云平台的容器化应用是当前企业面临的复杂性挑战之一,Karmada 多云容器编排技术使得用户能够像操作单一集群一样轻松管理多集群,简化了多云环境的运维复杂度,加速分布式云原生应用升级。Xnj28资讯网——每日最新资讯28at.com

行业背景Xnj28资讯网——每日最新资讯28at.com

随着云计算技术的飞速发展,企业对于云基础设施的需求日益多样化,多云策略成为了众多企业的首选。多云环境不仅能够提高业务的灵活性和可用性,还能有效降低对单一云服务商的依赖风险。根据最新的调查报告显示,超过 87% 的企业正在使用多个云厂商的服务,然而,随之而来的是管理和协调跨多个云平台的容器化应用的复杂性挑战。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

业界流行的容器编排工具 Kubernetes(简称 K8s),虽然在单一集群内展现了强大的资源管理和自动化部署能力,但在面对多云场景时,其跨集群的资源调度、统一管理以及数据一致性等问题成为了亟待解决的痛点。Xnj28资讯网——每日最新资讯28at.com

现阶段,云原生多云多集群业务的编排面临着诸多挑战:Xnj28资讯网——每日最新资讯28at.com

1)集群繁多的重复劳动:运维工程师需要应对繁琐的集群配置、不同云厂商集群间的管理差异以及碎片化的 API 访问入口等问题。Xnj28资讯网——每日最新资讯28at.com

2)业务过度分散的维护难题:应用在各集群的差异化配置繁琐;业务跨云访问以及集群间的应用同步难以管理。Xnj28资讯网——每日最新资讯28at.com

3)集群的边界限制:应用的可用性受限于集群;资源调度、弹性伸缩受限于集群。Xnj28资讯网——每日最新资讯28at.com

4)厂商绑定:业务部署的黏性问题,缺少自动化故障迁移;缺少中立的开源多云容器编排项目。Xnj28资讯网——每日最新资讯28at.com

Karmada 多云容器编排引擎,简化多云环境管理复杂度Xnj28资讯网——每日最新资讯28at.com

为了解决上述挑战,华为于 2021 年正式推出了开源项目 Karmada,旨在打造一个云原生的多云容器编排平台。Karmada(Kubernetes Armada,舰队之意)继承并超越了社区 Federation v1 和 v2(kubefed)的设计理念,它不是简单地在不同集群间复制资源,而是通过一套全新的 API 和控制面组件,实现了在保持 Kubernetes 原有资源定义 API 不变的前提下,无缝地在多云环境中部署和管理分布式工作负载。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

Karmada 提供了一个全局的控制面板,使得用户能够像操作单一集群一样管理多云上的 Kubernetes 集群,简化了多云环境的运维复杂度,引入了高级的跨集群调度策略,根据资源需求、成本、合规性等因素,自动将工作负载优化部署到最适合的云平台或区域。通过分布式数据管理和同步机制,确保多云间的数据和配置一致性,降低了数据管理的复杂度。Xnj28资讯网——每日最新资讯28at.com

实践案例:Karmada 在工业智能检测领域的应用Xnj28资讯网——每日最新资讯28at.com

工业智能检测领域亟需标准化智能检测提升效率Xnj28资讯网——每日最新资讯28at.com

在液晶面板生产领域,由于多种因素,产品常出现不良品。为此,关键工艺节点后引入了自动光学检测(AOI)设备,通过光学原理检测常见缺陷。然而,现有 AOI 设备仅识别缺陷有无,需要人工分类和识别缺陷,这一过程耗时且影响生产效率。数之联的客户企业,某面板龙头企业,引入自动缺陷分类系统(ADC)以提高判定准确性并减轻劳动强度,使用深度学习技术自动分类 AOI 输出的缺陷图片,并筛除误判,从而提高生产效率。Xnj28资讯网——每日最新资讯28at.com

客户企业率先在一个工厂引入 ADC,后续在其他工厂推广,节省人力资源,提高判定效率。尽管如此,由于工艺复杂和供应商差异,现场建设呈现出割裂和分散管理的趋势,给数据共享和运维带来困难。为解决这些问题,客户企业启动了工业智能检测平台的建设,该平台利用人工智能技术,实现标准化智能检测并提高生产效率和良率。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

工业智能检测平台Xnj28资讯网——每日最新资讯28at.com

工业智能检测平台将 ADC 作为核心,扩展至模型训练和检测复判,实现“云”(管理 + 训练)+“边”(推理)+“端”(业务)的一体化方案,旨在通过标准化平台提高生产质量和数据价值。建设范围包括资源共享中心、现地训练和边侧推理等子平台,将在若干工厂实施。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

工业智能检测平台架构图Xnj28资讯网——每日最新资讯28at.com

项目目标是实现现地 ADC 上线、资源共享和云边端标准化,以减轻运维负荷、提升标准。工业智能检测平台旨在通过规范化和标准化客户企业全集团的 ADC 系统,为后续 ADC 建设提供样本和模板,降低成本和周期,提高生产和质检效率以及产品良率。平台包含系统管理员、资源配置员等用户角色,并涉及 ADC 推理、模型训练、数据共享等信息流,以及云端协同功能,确保 ADC 的自动缺陷分类生产过程,并提高模型和缺陷图片的利用率。Xnj28资讯网——每日最新资讯28at.com

结合 Karmada 多集群管理构建解决方案Xnj28资讯网——每日最新资讯28at.com

一、集群管理:多地域集群统一纳管Xnj28资讯网——每日最新资讯28at.com

不同地域的 K8s 集群注册至中心云系统,中心云系统对多个现地的集群进行管理。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

二、应用管理:全局统一部署、监控Xnj28资讯网——每日最新资讯28at.com

通过 Karmada 提供的集群统一访问能力,用户在中心云实现可视化大屏等需要聚合成员集群的数据的功能。Xnj28资讯网——每日最新资讯28at.com

1、集群监控Xnj28资讯网——每日最新资讯28at.com

针对在线的集群,中心云系统可对内存、CPU、磁盘、网络流入流出速率、GPU、日志等指标进行监控数据展示,并可切换集群进行数据查看。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

资源监控Xnj28资讯网——每日最新资讯28at.com

中心云可以看到和训练云相同的监控,通过 Karmada 聚合层 API 由集群的 Java 程序对 PromQL 封装后提供给前端页面。Xnj28资讯网——每日最新资讯28at.com

2、中心云数据下发Xnj28资讯网——每日最新资讯28at.com

用户在中心云上传的数据,可自由选择下发至指定现地,包括数据集、标注、算子工程、算子镜像以及模型等。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

数据集、算子工程、模型,通常是文件,在完成传输后,会保存到本地或 NAS 等存储中。标注,通常是结构化数据,在完成传输后,会保存到 DB 中。算子镜像,一般导出为 tar 包,在完成传输后,会推送到当前集群的 harbor 中。中心云除了 Karmada 的控制面以外,也带有自己的业务 K8s 集群,也包括存储,因此可以作为一个中转器。以上均通过 Karmada 的聚合层 API 来调用我们提供的文件上传到 svc,实现了集群和集群之间的调用。Xnj28资讯网——每日最新资讯28at.com

3、跨现地训练Xnj28资讯网——每日最新资讯28at.com

针对某现地训练资源不足的情况下,可通过申请其他现地资源的方式,进行跨现地训练。该功能实现方式为将 A 现地训练所需要的数据集、标注、算子工程、算子镜像等数据发送至 B 现地,通过 B 现地的资源进行训练。再将训练好的模型返回给 A 现地。Xnj28资讯网——每日最新资讯28at.com

Xnj28资讯网——每日最新资讯28at.com

原理和中心云数据下发类似,任务所需的数据会直接发送到对应集群,体现了成员集群和成员集群之间的调用关系。Xnj28资讯网——每日最新资讯28at.com

4、可视化大屏Xnj28资讯网——每日最新资讯28at.com

根据中心云注册的现地,统计不同现地的各类指标数据进行大屏展示。在这类大屏中展示实时数据的时候,通过 Karmada 聚合层 API,我们可以方便地直接调用成员集群的 svc,而无需让所有的数据显示都走大数据的离线分析、实时分析,提供更高的时效性。Xnj28资讯网——每日最新资讯28at.com

总结展望Xnj28资讯网——每日最新资讯28at.com

Karmada 项目自 2021 年开源并加入云原生计算基金会 (CNCF) 成为沙箱项目以来,已经取得了显著的发展与认可。项目于 2023 年底正式晋升为 CNCF 的孵化级别项目。这一成就标志着 Karmada 技术生态获得全球业界的广泛认可,进一步巩固了其在分布式云原生技术领域的领先地位。该项目凭借其创新的多云多集群容器编排能力,已被全球范围内超过 30 家知名企业所采纳用于构建企业级云原生平台。Xnj28资讯网——每日最新资讯28at.com

Karmada 的出现,为多云时代的企业提供了一个强大且灵活的容器编排解决方案,它不仅解决了多云管理的痛点,还为企业在云原生旅程中探索更广阔的应用场景提供了坚实的技术支撑。随着云原生技术的不断演进,Karmada 有望成为连接和简化多云生态的关键力量,助力企业释放云的全部潜能,加速数字化转型的进程。Xnj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-125113-0.htmlKarmada 多云容器编排技术加速分布式云原生应用升级

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: KubeEdge:云原生边缘计算赋能多行业、多场景的智能化升级

下一篇: 基于微服务 SDK 框架与 JavaAgent 技术,华为云全链路灰度发布方案助力应用发布效率

标签:
  • 热门焦点
  • Redmi Buds 4开箱简评:才199还有降噪 可以无脑入

    在上个月举办的Redmi Note11T Pro系列新机发布会上,除了两款手机新品之外,Redmi还带来了两款TWS真无线蓝牙耳机产品,Redmi Buds 4和Redmi Buds 4 Pro,此前我们在Redmi Note11T
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • 三万字盘点 Spring 九大核心基础功能

    大家好,我是三友~~今天来跟大家聊一聊Spring的9大核心基础功能。话不多说,先上目录:图片友情提示,本文过长,建议收藏,嘿嘿嘿!一、资源管理资源管理是Spring的一个核心的基础功能,不
  • 19个 JavaScript 单行代码技巧,让你看起来像个专业人士

    今天这篇文章跟大家分享18个JS单行代码,你只需花几分钟时间,即可帮助您了解一些您可能不知道的 JS 知识,如果您已经知道了,就当作复习一下,古人云,温故而知新嘛。现在,我们就开始今
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 质感不错!OPPO K11渲染图曝光:旗舰IMX890传感器首次下放

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • 世界人工智能大会国际日开幕式活动在世博展览馆开启

    30日上午,世界人工智能大会国际日开幕式活动在世博展览馆开启,聚集国际城市代表、重量级院士专家、国际创新企业代表,共同打造人工智能交流平台。上海市副市
Top