难以置信!两周,微软遭遇两次重大故障
据微软总部所在地华盛顿州雷德蒙市媒体周一晚间报道,北美及其他地区的用户无法访问微软某些服务,包括 Outlook.com 网络邮件。这一故障一直持续到了周二。
随后,微软在Office.com服务状态页面发布通告:“位于北美地区的用户访问Outlook.com时,可能无法发送、接收或搜索电子邮件。其他功能如 Microsoft Teams 等服务所使用的日历也会受到影响。”
众包网站和服务中断报告的Downdetector网站显示,从凌晨 3 点 24 分(UTC)开始,用户报告 Outlook 问题的数量激增。
这次故障似乎只影响到微软的消费者类型服务。Outlook.com是其免费的网络邮件服务,以前称为Hotmail,与Outlook for Web和OWA不同,后者是企业型网络邮件服务。
微软表示,Microsoft Teams 等其他服务使用的 Outlook.com 功能(例如日历 API)也受到影响。这似乎只是对其消费者版本的 Teams 的引用。
微软上一次遭受重大故障是在13天前,当时其内部团队进行的广域网络路由变更导致全球微软365中断,许多Azure云服务变得无法访问,包括Outlook、Microsoft Teams、SharePoint Online、OneDrive for Business等。
Outlook的访问和服务问题
微软周二凌晨4点04分(UTC)首次确认其最新的故障,20分钟后发推文表示“正在调查Outlook的访问和服务问题"。
此后不久,微软表示此次故障与最近更改的服务器有关,并开始有针对性地重新启动基础设施中受最近变化影响的部分,以尝试解决这个问题。
微软在上午6点46分(UTC)发布推文表示目标资源正在取得进展,一些环境得到了改善,并正在寻找其他方式以加快解决速度。
此次故障不仅涉及北美的基础设施,在全球范围内仍然可以看到中断现象。对此,微软在报告中解释道:“由于北美基础设施的受影响部分,北美以外其他地区的用户可能会经历一些残余的影响”。
随后,随着微软继续重新启动更多系统,一些受影响地区的用户逐渐得到改善。"
截至上午9:37分(UTC),微软报告称,服务尚未完全恢复。“我们正在对受影响的基础设施的一个子集应用有针对性的缓解措施,并验证它已经减轻了影响。我们还在进行流量优化工作,以减轻用户的影响,并加快恢复”。
服务恢复
周二晚些时候,微软报告称,在问题开始约12小时后,问题已基本得到解决。微软说:“我们可以从遥测数据中看到,大部分影响已经得到解决,服务可用性达到99.9%。我们正在继续监测环境,并对显示有残留影响的后端邮箱组件进行有针对性的改善,以确保所有用户恢复正常使用。”