AWS云服务在大型网站遭遇长达一天的中断后恢复

亚马逊网络服务公司（AWS）作为云基础设施市场的领导者，周一报告了一次重大服务中断，导致众多大型网站瘫痪。

亚马逊表示，其弗吉尼亚州北部数据中心的云计算部门已基本控制住了一场大规模网络中断造成的影响。此次故障导致全球数千个网站陷入混乱，包括Snapchat以及Reddit等部分热门应用。

亚马逊称，已找到问题根源并接近彻底解决，但部分用户仍反映数字钱包Venmo和视频会议网站 Zoom等服务存在使用障碍。

许多网站在几个小时内恢复上线，但Downdetector显示，美国东部时间中午前后，亚马逊、AWS 和 Alexa 的服务中断用户报告数量再次激增。

该公司于美国东部时间下午 6:53 发布的最新更新指出，“所有 AWS 服务已于美国东部时间下午 6 点后不久恢复正常运行”。

AWS表示，部分服务仍有消息积压，将在接下来的几个小时内完成处理。

“我们将分享一份详细的 AWS 事件后总结报告，”该公司在声明中表示。

此次更新是在服务中断和延迟持续到周一下午之后发布的，该公司观察到，当客户尝试在其提供虚拟服务器容量的热门云服务 EC2 中启动新实例时，“错误率有所增加”。

“我们正在努力尽快全面恢复服务，”该公司当时写道。

美国东部时间下午 1:30 左右，AWS 表示，它开始看到一些地区的 EC2 服务出现“早期恢复迹象”，并且正在对剩余地区进行修复，“届时我们预计启动错误和网络连接问题将会减少”。

亚马逊也证实，此次故障影响了 Amazon.com、其部分子公司以及 AWS 客户支持运营。

美国东部时间凌晨 3 点 11 分，AWS 位于弗吉尼亚州北部的美国东部 1 区主服务器首次报告出现故障。AWS 状态页面上的通知称，其数据库服务 DynamoDB（支撑许多其他 AWS 应用程序的底层服务）的 DNS 解析出现问题。

DNS（域名系统）将网站名称转换为 IP 地址，以便浏览器和其他应用程序可以加载。

美国亚马逊云服务（AWS）在美东时间凌晨5点01分发布的最新消息中指出，由于“运营问题”，多项服务受到影响，公司正在“采取多种并行方案加速恢复”。超过70项AWS自身服务受到影响。

亚马逊引用了一份在线声明称，相关问题已得到 “完全缓解”。此次故障源于域名系统 (DNS)。该系统出现问题后，各类应用无法找到AWS DynamoDB API的正确地址，后者是一个用于存储用户信息及其他关键数据的云数据库。

根据Synergy Research Group的数据，AWS 是领先的云基础设施技术提供商，占据约三分之一的市场份额，领先于微软和谷歌。数百万家公司和组织依赖 AWS 提供云计算服务，例如服务器和存储。

科技圈动态，尽在圈小蛙