Azure 故障导致多项服务中断
作者: CBISMB
责任编辑: 邹大斌
来源: ISMB
时间: 2025-10-30 10:38
关键字: Azure,CDN,服务中断,微软
浏览: 4891
点赞: 278
收藏: 31
10月29日(美国时间)微软公司的 Azure 云平台出现技术问题,导致该公司及其客户运营的多项在线服务中断。
包括星巴克、Costco 和第一资本金融公司(Capital One Financial Corp.)在内的多家微软客户均受到影响。与此同时,微软自身也有多个面向消费者的服务陷入瘫痪。此次中断还波及了微软的投资者关系页面,在其最新财报发布前一度无法访问。
此次中断源于 Azure Front Door——即微软内容分发网络(CDN)——出现的错误。该 CDN 使网站运营方可将其内容副本存储在全球数十个服务器集群中。当用户访问网页时,CDN 会从距离最近的服务器集群下载内容,从而加快加载速度。
Azure Front Door 包含多项旨在降低中断风险的功能。
当 CDN 用于存储客户内容的某个服务器集群(即“边缘节点”)离线时,用户流量会自动被重新路由至另一个边缘节点。这类集群超过 110 个,分为两组:内环和外环。外环被配置为在内环出现技术问题时接替其功能。
据微软称,此次中断始于美国东部时间中午左右。不仅 Azure Front Door 受到影响,还有十多个依赖该 CDN 运行的 Azure 服务也同时瘫痪。受影响的服务清单中包括多个客户用于保护其云环境的网络安全产品。
中断发生后不久,微软确认问题是由一次“意外的配置更改”引起的。随后,公司工程师着手恢复到已知无错误的上一个配置版本。微软状态页面的最新更新表示,回滚操作已经完成,目前正处于“观察恢复”阶段。
目前,公司正在将请求从出现故障的 Azure Front Door 节点重新路由至已成功恢复的服务器。然而,部分请求仍会到达故障节点,导致“部分客户遭遇间歇性故障或可用性降低”。微软补充称,服务目前“可用性已恢复至 98% 以上”。
为防止潜在技术问题,公司已暂时禁止客户更改其 Azure Front Door 部署的配置。今天早些时候,部分客户在 Azure 管理控制台中进行配置更改时也遇到困难。对此,微软通过将控制台从 Azure Front Door 迁移出来解决了该问题。
此次服务中断发生在几天前亚马逊网络服务公司(Amazon Web Services Inc.)位于繁忙的 US-EAST-1 数据中心集群发生长达数小时中断之后。那次故障影响了 ChatGPT、Disney+、Snapchat 以及众多其他热门服务。AWS 在中断后发布的博客文章中解释称,问题源于其托管数据库服务 Amazon DynamoDB 的 DNS 系统。
DNS 问题也是 2021 年 Azure 上一次大规模中断的“罪魁祸首”。那次错误导致多个 Azure 和 Microsoft 365 服务中断数小时之久。
