ChatGPT也遭殃亚马逊服务器故障半个互联网都崩了

Docker是一个重要的应用容器引擎,有开发者发现Docker全线瘫痪了,多个核心服务集体中断。

除了Docker,另一个重要开发工具npm也出现了同样的问题,还有备受青睐的AI编程工具Cursor、Vercel一样未能幸免。

除了开发者,其他打工人也受到影响——视频会议软件Zoom、OpenAI同款办公平台Slack,全都崩了。

抓马的是,据说今年亚马逊内部开会开始改用Zoom,这样一来,没有Zoom的话AWS就开不了线上会议,但AWS不修复Zoom就用不了……

AI工具方面,最著名的ChatGPT也被认为受到波及,还有著名AI搜索工具Perplexity也榜上有名。

而且影响也从线上蔓延到了线下,打车软件崩了,麦当劳星巴克崩了,日常生活中的叫车、点餐都无法进行。

比上不了飞机更惨的是在飞机上下不去,小红书上就有网友现身说法,表示自己乘坐的达美航空班机落地后无法停靠,一飞机的人只能在跑道等待,机长广播通知原因正是亚马逊宕机。

比如英超官方宣布,由于受到AWS故障的影响,西汉姆联对阵布伦特福德的比赛当中半自动越位系统故障,将比赛中若有需要,将采用以往的人工画线方式来辅助判定。

AWS的说法则是,问题起源于EC2内部网络的一个子系统,该子系统用于监控和管理网络负载均衡器的健康状态。

该监控系统的异常导致了网络连接不稳定、数据库访问延迟以及部分API请求失败。在连锁反应下,多项核心云服务出现大范围故障。

us-east-1是AWS最早建立的区域,基础设施历史最长,服务种类最多,大量企业都在us-east-1部署核心服务。

us-east-1不仅是计算/存储资源的大本营,也是许多全球控制面服务的集中托管区域,这意味着其他区域即便本地运行正常,部署、身份验证、权限变更等控制层操作仍需依赖us-east-1。

而且这也不是us-east-1第一次崩了,过去几年(2020、2021、2023年)也发生过类似的“大范围瘫痪”事件,每次都会影响一大批线上服务。

像亚马逊这样的大型云服务的确提升了全球网络安全和稳定性,但成也萧何,这种标准、集中化的服务,意味着任何一个小故障,都有可能造成灾难性的后果。

Hacker News上就有网友表示,其静态站点通过CloudFront连接多个区域,没有全部押注us-east-1,因此在这次事件中没有受到影响。

阅读剩余
THE END