
周二上午,互联网基础设施巨头Cloudflare的CDN网络出现大规模故障,导致流量无法中继到源服务器。由于Cloudflare发生故障,包括ChatGPT、Claude、Spotify、X等在内的大部分互联网服务瘫痪或无法正常工作。
Cloudflare自身的控制台和客服系统也受到影响。19点48分,CF status更新信息:“已注意到并正在调查一个可能影响多位客户的问题。如有更多信息,我们将及时公布。”
Cloudflare在美国东部时间早上 8 点左右在其状态页面上表示,已发现问题并正在实施修复。不到两小时后,Cloudflare 表示“修复程序已实施,我们相信该事件现已解决。我们将继续监控错误,以确保所有服务恢复正常。”
大约在同一时间,Cloudflare的首席技术官 Dane Knecht在一篇道歉的X帖子中解释说,这是一个潜在的错误导致了这个问题。
“简而言之,我们用于缓解机器人攻击的底层服务中一个潜在的漏洞,在我们进行例行配置更改后开始崩溃。这导致我们的网络和其他服务出现大范围性能下降。这不是一次攻击,”克内希特写道,他指的是一个在测试中未被发现且未造成故障的漏洞。
Knecht还表示,Cloudflare 的这次服务中断辜负了其客户和“更广泛的互联网”,并承诺该公司已经在努力确保“此类事件不再发生”。
“我知道今天这件事造成了真正的痛苦,”克内希特补充道,并承诺“几个小时后”将对发生的事情进行更深入的分析。
该公司随后在其状态页面上指出,部分客户可能仍然无法登录或使用 Cloudflare 控制面板。Cloudflare 表示正在努力修复此问题,并将继续监控是否存在任何其他问题。
Cloudflare的大规模宕机事件距离亚马逊网络服务(AWS)的类似宕机事件不到一个月,这再次鲜明地提醒我们,整个互联网都依赖于少数几家公司。如果这些巨头出现问题,整个互联网都将开始崩溃。
据估计,互联网上约有 20% 的网站使用 Cloudflare。该公司表示,其数据中心遍布 330 个城市,并且有 13,000 个网络“直接连接到 Cloudflare,其中包括所有主流互联网服务提供商、云服务提供商和企业”。
Cloudflare为客户提供的主要服务之一是抵御分布式拒绝服务 (DDoS) 攻击,这种攻击旨在使网站瘫痪,因此周二发生的宕机事件颇具讽刺意味。
圈小蛙