当前位置:首页 > 科技  > 软件

如何完成 Kafka 和 Cassandra 的大规模迁移

来源: 责编: 时间:2024-07-03 10:11:18 276观看
导读了解策略和流程,以及一些最佳实践,让任何大规模、关键任务的 Cassandra 和 Kafka 迁移更加顺利。译自How We Completed a Massive Kafka and Cassandra Migration,作者 Ben Slater。无论迁移规模如何,任何数据层迁移都需

了解策略和流程,以及一些最佳实践,让任何大规模、关键任务的 Cassandra 和 Kafka 迁移更加顺利。GUS28资讯网——每日最新资讯28at.com

译自How We Completed a Massive Kafka and Cassandra Migration,作者 Ben Slater。GUS28资讯网——每日最新资讯28at.com

无论迁移规模如何,任何数据层迁移都需要进行仔细的规划和执行。话虽如此,我们最近完成的可能是迄今为止执行过的最大规模的Apache Cassandra和Apache Kafka迁移(吉尼斯世界纪录尚未对此进行统计……)。GUS28资讯网——每日最新资讯28at.com

在我看来,这是一个特别有趣的用例,它可以在没有停机时间的情况下实现相当复杂的技术壮举(并且仅使用 Cassandra 和 Kafka 的完全开源版本——这里没有开放核心)。下面,我将分享所使用的策略和流程,以及一些最佳实践,这些实践将有助于使任何大规模、关键任务的 Cassandra 和 Kafka 迁移更加顺利。GUS28资讯网——每日最新资讯28at.com

管理大规模迁移

让我们了解一下这次迁移的规模。这家企业的开源Cassandra 部署包括 58 个集群和 1,079 个节点,其中包括 17 种不同的节点大小,分布在AWS和Kafka 前端上,该公司使用了 154 个集群和 1,050 个节点,共有 21 种节点大小,同样分布在这两个云提供商和六个区域中。正如你所想象的,进行迁移需要大量的时间和精力。时间表要求准备九个月,然后是八个月的谨慎生产迁移。GUS28资讯网——每日最新资讯28at.com

与任何迁移一样,强大的项目管理和治理至关重要。如果这一步出了问题,你以后会遇到麻烦。我们根据项目管理方法为一些关键角色分配了具体职责,包括一名总体项目经理、一名 Cassandra 迁移项目经理和一名 Kafka 迁移项目经理、每项的技术负责人以及一名关键产品经理。这个团队迅速建立了密切的协作和与企业的清晰沟通,这是获得积极项目成果的另一种行之有效的方法。GUS28资讯网——每日最新资讯28at.com

在项目的初始阶段,这种密切联系证明了它的价值,因为我们与企业的架构、安全和合规团队同步工作,以满足他们在这些领域的严格要求。这意味着确保迁移的目标环境具有入侵检测、访问日志记录、审计日志、强化操作系统以及帐户级选择加入,以自动配置具有日志传输和其他控制的新集群。我们还启用了自定义 Kafka Connect 连接器的加载过程,以使用实例角色而不是访问密钥进行 Amazon S3 访问,并改进了用于配置单点登录 (SSO) 访问的 SCIM(跨域身份管理系统)API。GUS28资讯网——每日最新资讯28at.com

在此准备阶段,我们还认识到并采取了优化迁移集群的架构契合度的机会。由于企业的架构在 Kafka 集群级别之上提供了高可用性,因此我们使用 RF2(复制因子 2)来支持在两个可用性区域中运行的 Kafka 集群。我们还准备通过利用最新的 AWS 和 GCP 节点类型来优化成本。GUS28资讯网——每日最新资讯28at.com

Kafka 迁移

“流出”方法是 Kafka 迁移的第一个想法:只需将 Kafka 消费者指向源集群和目标集群,将生产者切换为仅向目标集群发送消息,等到从源读取所有消息,然后瞧。限制在于流出不会保留消息顺序,这是许多 Kafka 用例(包括此用例)必不可少的。GUS28资讯网——每日最新资讯28at.com

MirrorMaker2为 Kafka 迁移提供了另一个强大的选择,但是其高度的消费者/生产者应用程序依赖性意味着它不适合这里。GUS28资讯网——每日最新资讯28at.com

“共享集群”方法——将源集群和目标集群作为单个集群运行——成为剩下的最佳选择。我们继续为每个集群创建详细的变更计划,始终牢记回滚启用。高级步骤从配置目标集群开始,更新配置以匹配源,并将网络环境与源集群加入虚拟私有云对等互连。然后,我们在目标中以观察者模式启动Apache ZooKeeper,以及目标 Kafka 代理。GUS28资讯网——每日最新资讯28at.com

接下来,我们使用 Kafka 分区重新分配来移动数据。其中包括增加复制因子和跨目标和源代理的复制,将首选领导交换为目标代理,然后减少复制因子以移除源代理副本。通过将目标代理重新配置为其初始联系点,然后移除旧代理,从而完成流程。GUS28资讯网——每日最新资讯28at.com

源环境额外带来了一些皱褶,我们在迁移期间已将其熨平。例如,它跨多个集群共享一个 ZooKeeper 实例,导致我们仔细重新配置和清理每个目标 ZooKeeper 中其他集群的数据。我们还扩展了目标配置以支持企业的特定端口侦听器映射,避免了主要的重新配置工作。GUS28资讯网——每日最新资讯28at.com

Cassandra 迁移

零停机 Cassandra 迁移最常见的方法是向现有集群添加数据中心。我们还使用并推荐我们的 Instaclustr Minotaur 一致重建工具(在 GitHub 上提供)。此开源解决方案解决了源集群中缺少数据副本可能导致重建过程从同一节点复制多个副本的问题,从而导致目标副本减少。Minotaur 确保目标集群至少具有与源集群一样多的副本,并且可以将任何需要的修复推迟到迁移之后。GUS28资讯网——每日最新资讯28at.com

当我们遇到具有高度不一致性的集群时,对这次迁移使用此方法特别有价值。在一个案例中,集群在迁移后需要两个半月的修复。另一组集群由于在流式传输期间架构更改时 Cassandra 丢弃临时数据,因此每两到三个小时定期丢弃表。我们首先尝试在节点重建期间手动暂停表丢弃,但发现该方法不可持续。最后,我们使用我们的供应 API 检测节点状态并在必要时自动暂停表丢弃。GUS28资讯网——每日最新资讯28at.com

重大挑战,巨大成功

最终,(也许)有史以来最大规模的 Cassandra 和 Kafka 迁移按计划完成,且几乎没有出现问题。我将这一积极成果归功于所有参与者密切合作、周密规划和采用的战略最佳实践,并建议任何参与类似的大型复杂迁移的人员应用这些相同技术。GUS28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-98416-0.html如何完成 Kafka 和 Cassandra 的大规模迁移

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: C# WinForm中的MDI(多文档界面)窗体技术详解

下一篇: C#字符串处理技术详解,你学会了吗?

标签:
  • 热门焦点
  • 2023年Q2用户偏好榜:12+256G版本成新主流

    3月份的性能榜、性价比榜和好评榜之后,就要轮到2023年的第二季度偏好榜了,上半年的新机潮已经过去,最明显的肯定就是大内存和存储的机型了,另外部分中端机也取消了屏幕塑料支架
  • 跑分安卓第一!Redmi K60至尊版8月发布!卢伟冰:目标年度性能之王

    8月5日消息,Redmi K60至尊版将于8月发布,在此前举行的战略发布会上,官方该机将搭载搭载天玑9200+处理器,安兔兔V10跑分超177万分,是目前安卓阵营最高的分数
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 量化指标是与非:挽救被量化指标扼杀的技术团队

    作者 | 刘新翠整理 | 徐杰承本文整理自快狗打车技术总监刘新翠在WOT2023大会上的主题分享,更多精彩内容及现场PPT,请关注51CTO技术栈公众号,发消息【WOT2023PPT】即可直接领取
  • 自动化在DevOps中的力量:简化软件开发和交付

    自动化在DevOps中扮演着重要角色,它提升了DevOps的效能。通过自动化工具和方法,DevOps团队可以实现以下目标:消除手动和重复性任务。简化流程。在整个软件开发生命周期中实现更
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 华为HarmonyOS 4升级计划公布:首批34款机型今日开启公测

    8月4日消息,今天下午华为正式发布了HarmonyOS 4系统,在更流畅的前提下,还带来了不少新功能,UI设计也有变化,会让手机焕然一新。华为宣布,首批机型将会在
Top