当前位置:首页 > 科技  > 软件

高可用架构下 B 站、小红书崩了?对于阿里回应,网友认为裁员裁到大动脉

来源: 责编: 时间:2024-07-03 10:12:22 116观看
导读大家好,我是码哥,可以叫我靓仔。作为靓仔,是应该经常打开 B 站的,毕竟里面很多美好的“东西”,结果出现网络错误,我以为由于日夜观摩 B 站的视频导致流量超了。吃瓜虽好,可不要贪杯。我们的重点是根据 B 站、小红书服务故障

大家好,我是码哥,可以叫我靓仔。HOQ28资讯网——每日最新资讯28at.com

作为靓仔,是应该经常打开 B 站的,毕竟里面很多美好的“东西”,结果出现网络错误,我以为由于日夜观摩 B 站的视频导致流量超了。HOQ28资讯网——每日最新资讯28at.com

吃瓜虽好,可不要贪杯。我们的重点是根据 B 站、小红书服务故障来聊聊高可用架构的一些设计思路。HOQ28资讯网——每日最新资讯28at.com

B 站、小红书崩了

在 2020-07-02 上午 10 点~11 点左右,B 站和小红书都崩了,出现了不同程度的故障。HOQ28资讯网——每日最新资讯28at.com

打开微博, 看到 #B 站(哔哩哔哩)、小红书崩了# 的话题相继登上热搜。HOQ28资讯网——每日最新资讯28at.com

图片图片HOQ28资讯网——每日最新资讯28at.com

还有网友反映小红书首页内容无法刷新。有的则表示刷出来的内容也不是我的推荐。HOQ28资讯网——每日最新资讯28at.com

图片图片HOQ28资讯网——每日最新资讯28at.com

图片图片HOQ28资讯网——每日最新资讯28at.com

图片图片HOQ28资讯网——每日最新资讯28at.com

@酷安网 也发文表示网站崩了。随后,阿里云客户服务中心回复:北京时间 2024 年 07 月 02 日 10:04,阿里云监控发现上海地域可用区 N 网络访问出现异常,阿里云工程师正在紧急处理中。HOQ28资讯网——每日最新资讯28at.com

图片图片HOQ28资讯网——每日最新资讯28at.com

B 站、小红书崩了之后,对于阿里云的回应,网友认为裁员裁到大动脉了有网友认为,这次是阿里云裁员裁到大动脉了HOQ28资讯网——每日最新资讯28at.com


HOQ28资讯网——每日最新资讯28at.com

HOQ28资讯网——每日最新资讯28at.com

码哥跳动HOQ28资讯网——每日最新资讯28at.com

Infoq签约作者,51CTO Top红人,阿里云开发者社区专家博主,担任后端架构师职责,擅长 Redis,Spring,Kafka,MySQL技术和云原生微服务。愿大家拥抱硬核技术和对象,面向人民币编程。HOQ28资讯网——每日最新资讯28at.com

169篇原创内容HOQ28资讯网——每日最新资讯28at.com

公众号HOQ28资讯网——每日最新资讯28at.com

高可用架构

言归正传,吃瓜归吃瓜,我们应该从阿里云的网络切换故障,看到一些高可用的解决方案。HOQ28资讯网——每日最新资讯28at.com

虽然网络故障,B 站、并不是所有的网页打不开,而且系统并没有垮掉,依然返回相关错误信息或者页面给用户。我们也能从里面了解到大厂工程师如何应对此问题的解决方案。HOQ28资讯网——每日最新资讯28at.com

从这次的故障可以看出,B 站和小红书的系统均满足系统服务可降级HOQ28资讯网——每日最新资讯28at.com

B 站的做法是提供一个加载错误的页面,引导用户重试。HOQ28资讯网——每日最新资讯28at.com

图片图片HOQ28资讯网——每日最新资讯28at.com

小红书的降级策略有所不同,因为其表现为无法刷新内容,首页刷出来的内容不是用户推荐的。HOQ28资讯网——每日最新资讯28at.com

所以小红书的降级策略是使用了缓存作为降级,比如平台无法通过网络获取用户推荐的信息流时,就直接从缓存系统或者服务器本地的缓存中获取一些内容返回给用户。HOQ28资讯网——每日最新资讯28at.com

这些也是只码哥根据有限的信息哥大家聊聊,估计不久就会有官方的反馈了。本次故障相当于验证了一把 B 站和小红书的高可用是否足够强大。HOQ28资讯网——每日最新资讯28at.com

故障来源

系统宕机原因主要有以下:HOQ28资讯网——每日最新资讯28at.com

无计划的HOQ28资讯网——每日最新资讯28at.com

  • 系统级故障,包括主机、操作系统、中间件、数据库、网络、电源以及外围设备。
  • 数据和中介的故障,包括人员误操作、硬盘故障、数据乱了。
  • 还有自然灾害、人为破坏,以及供电问题等。

有计划的HOQ28资讯网——每日最新资讯28at.com

  • 日常任务:备份,容量规划,用户和安全管理,后台批处理应用。
  • 运维相关:数据库维护、应用维护、中间件维护、操作系统维护、网络维护。
  • 升级相关:数据库、应用、中间件、操作系统、网络,包括硬件升级。

分个类。HOQ28资讯网——每日最新资讯28at.com

  1. 网络问题。网络链接出现问题,网络带宽出现拥塞……
  2. 性能问题。数据库慢 SQL、Java Full GC、硬盘 IO 过大、CPU 飙高、内存不足……
  3. 安全问题。被网络攻击,如 DDoS 等。
  4. 运维问题。系统总是在被更新和修改,架构也在不断地被调整,监控问题……
  5. 管理问题。没有梳理出关键服务以及服务的依赖关系,运行信息没有和控制系统同步……
  6. 硬件问题。硬盘损坏、网卡出问题、交换机出问题、机房掉电、挖掘机问题……

高可用架构原则

系统出现问题的地方很多,解决的方式各不相同,想要解决问题,先说下高可用的总体解决思路,才能更好的解决问题。HOQ28资讯网——每日最新资讯28at.com

避免发生

想要系统高可用,我们要想办法避免问题的发生。比如说,我们可以通过 UPS(Uninterruptible Power System,不间断电源)来避免服务器断电。HOQ28资讯网——每日最新资讯28at.com

故障转移

如果问题真的发生了,我们要考虑的是如何故障转移,比如说,我们可以通过冗余部署,当一个节点发生故障时,用其它正常的节点来代替问题节点。HOQ28资讯网——每日最新资讯28at.com

主从复制

几乎所有的存储系统都提供了主从复制的功能,例如 MySQL、Redis、MongoDB 等。HOQ28资讯网——每日最新资讯28at.com

主从复制要点:HOQ28资讯网——每日最新资讯28at.com

  • 存在一主多从
  • 主机负责读&写,并定期复制数据给从机。
  • 从机只负责读。
  • 一旦主机宕机,可以通过人工手段,将其中一个从节点作为主节点。

图片图片HOQ28资讯网——每日最新资讯28at.com

图片来源https://raw.githubusercontent.com/dunwu/images/master/snap/20200614184921.pngHOQ28资讯网——每日最新资讯28at.com

分片集群

主从复制有一个问题,每个机器上存储的都是全量数据。HOQ28资讯网——每日最新资讯28at.com

但是,单机的数据存储量总是有上限的,当数据量上升为 TB 级甚至 PB 级数据,单机终究有无法支撑的时候。这时,就需要对数据进行分片(sharding)。HOQ28资讯网——每日最新资讯28at.com

分片后的节点可以视为一个独立的子集,每个子集也要保证高可用降级:系统抛弃部分不重要的功能,比如不发送短信通知,以此确保核心功能不受影响。。HOQ28资讯网——每日最新资讯28at.com

图片图片HOQ28资讯网——每日最新资讯28at.com

图片来源https://raw.githubusercontent.com/dunwu/images/master/snap/20200614184921.pngHOQ28资讯网——每日最新资讯28at.com

服务可降级

如果故障无法正面方式解决,那我们要做的就是努力降低故障带来的影响。比如说流量太大,我们可以通过限流,来保证部分用户可以正常使用,或者通过业务降级的手段,关闭一些次要功能,保证核心功能仍旧可用。HOQ28资讯网——每日最新资讯28at.com

这次 B 站、小红书亦是采取了该方案。HOQ28资讯网——每日最新资讯28at.com

限流

限流则是从用户访问压力的角度来考虑如何应对故障。限流指只允许系统能够承受的访问量进来,超出系统访问能力的请求将被丢弃。HOQ28资讯网——每日最新资讯28at.com

降级

降级指系统将某些业务或者接口的功能降低,可以是只提供部分功能,也可以是完全停掉所有功能。比如 B 站返回错误引导页,以此确保核心功能不受影响。HOQ28资讯网——每日最新资讯28at.com

拒绝服务 - 拒绝低优先级应用的调用,减少服务调用并发数,确保核心应用正常使用。或者随机拒绝部分调用,节约资源,避免要死大家一起死的惨剧。HOQ28资讯网——每日最新资讯28at.com

关闭服务 - 关闭部分不重要的服务,或者服务内部关闭部分不重要的功能,以节约资源。HOQ28资讯网——每日最新资讯28at.com

熔断

熔断和降级是两个比较容易混淆的概念,因为单纯从名字上看好像都有禁止某个功能的意思,但其实内在含义是不同的,原因在于降级的目的是应对系统自身的故障,而熔断的目的是应对依赖的外部系统故障的情况。HOQ28资讯网——每日最新资讯28at.com

我们不去调用出问题的服务,让系统绕开故障点,就像电路的保险丝一样,自己熔断,切断通路,避免系统资源大量被占用HOQ28资讯网——每日最新资讯28at.com

监控

在实践中,系统的故障防不胜防,问题的定位和解决也非常的困难,所以,要想全面保障系统的可用性,最重要的手段就是监控。HOQ28资讯网——每日最新资讯28at.com

通过监控,我们可以实时地了解系统的当前状态,这样很多时候,业务还没出问题,我们就可以提前干预,避免事故;而当系统出现问题时,我们也可以借助监控信息,快速地定位和解决问题。HOQ28资讯网——每日最新资讯28at.com

博主简介HOQ28资讯网——每日最新资讯28at.com

码哥,9 年互联网公司后端工作经验,InfoQ 签约作者、51CTO Top 红人,阿里云开发者社区专家博主,目前担任后端架构师主责,擅长 Redis、Spring、Kafka、MySQL 技术和云原生微服务。HOQ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-98421-0.html高可用架构下 B 站、小红书崩了?对于阿里回应,网友认为裁员裁到大动脉

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Python用户宝典:了解并实现遗传算法

下一篇: 腾讯 2024 上半年累计回购股份金额达 523 亿港元,超 2023 全年

标签:
  • 热门焦点
  • 服务存储设计模式:Cache-Aside模式

    服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • 这款新兴工具平台,让你的电脑效率翻倍

    这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • WebRTC.Net库开发进阶,教你实现屏幕共享和多路复用!

    WebRTC.Net库开发进阶,教你实现屏幕共享和多路复用!

    WebRTC.Net库:让你的应用更亲民友好,实现视频通话无痛接入! 除了基本用法外,还有一些进阶用法可以更好地利用该库。自定义 STUN/TURN 服务器配置WebRTC.Net 默认使用 Google 的
  • 2023年,我眼中的字节跳动

    2023年,我眼中的字节跳动

    此时此刻(2023年7月),字节跳动从未上市,也从未公布过任何官方的上市计划;但是这并不妨碍它成为中国最受关注的互联网公司之一。从2016-17年的抖音强势崛起,到2018年的“头腾
  • 得物宠物生意「狂飙」,发力“它经济”

    得物宠物生意「狂飙」,发力“它经济”

    作者|花花小萌主近日,得物宣布正式上线宠物鉴别,通过得物App内的“在线鉴别”,可找到鉴别宠物的选项。通过上传自家宠物的部位细节,就能收获拥有专业资质认证的得物鉴
  • 当家的盒马,加速谋生

    当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
  • 引领旗舰级影像能力向中端机普及 OPPO K11 系列发布 1799 元起

    引领旗舰级影像能力向中端机普及 OPPO K11 系列发布 1799 元起

    7月25日,OPPO正式发布K系列新品—— OPPO K11 。此次 K11 在中端手机市场长期被忽视的影像板块发力,突破性地搭载索尼 IMX890 旗舰大底主摄,支持 OIS
  • DRAM存储器10月价格下跌,NAND闪存本月价格与上月持平

    DRAM存储器10月价格下跌,NAND闪存本月价格与上月持平

    10月30日,据韩国媒体消息,自今年年初以来一直在上涨的 DRAM 存储器的交易价格仅在本月就下跌了近 10%,此次是全年首次降价,而NAND 闪存本月价格与上月持平。市
Top