关键词
服务中断
据网站宕机监测平台Downdetector显示,美东时间周四下午,Spotify、Discord及其他平台的数万用户陆续报告服务出现异常。报告量从下午2点开始上升,2点30分到3点达到高峰,随后大部分服务故障逐渐缓解,有用户反映访问逐步恢复。
截至下午3点,谷歌云已有超过1.3万用户报告故障。Spotify用户的投诉最多,达4.6万条,有管理员在社区声明用户登录和播放音乐遇到问题。
谷歌发言人称,故障源于谷歌云服务问题,状态页面显示,美国及海外客户均受影响。截至下午3点12分,谷歌表示服务正在恢复,但无法确定完全恢复时间。系统处理中,受影响服务仍可能间歇出现错误。
此外,OpenAI下午4点26分发布公告称,所有受影响服务已恢复。部分网友表示,AWS、谷歌云、Azure和Cloudflare等多家云服务几乎同时出现中断。
据Downdetector统计,太平洋夏令时上午11点30分左右,Google Cloud报告事件超过13000起;微软Azure约1000起,AWS约5000起,但微软和AWS官方状态页面未显示异常。Character AI同时间也报告约4000起故障。
OpenAI指出,其单点登录和其他登录方式出现问题,工程团队正在努力修复。同时,Claude Sonnet 4和Gemini Pro等服务也出现大量错误。
谷歌云全球瘫痪近3小时,波及众多第三方应用
此次谷歌云宕机影响范围广泛,导致谷歌旗下及众多第三方平台服务中断。宕机高峰在太平洋夏令时上午11点30分左右,事件数量快速增加,之后逐渐下降。
谷歌称,身份与访问管理服务(IAM)故障导致GCP多项产品受影响,包括Gmail、Google日历、Google文档、Google云搜索等多款办公套件服务。
事故发生后,谷歌工程师紧急处理,虽然大部分区域服务已恢复,但部分服务仍受影响。下午14点更新中,谷歌表示已经在美国多个区域采取缓解措施,恢复迹象明显,预计一小时内完成服务恢复。
下午15点16分,谷歌确认大部分产品已恢复正常,仅个别服务如Dataflow和Vertex AI仍有延迟和错误。至下午18点27分,谷歌宣布所有服务完全恢复。
Spotify、Cloudflare等遭遇严重影响
除谷歌自家服务外,众多客户企业受到波及。电子商务平台Shopify为谷歌云重要客户,表示受此次事故严重影响。
Spotify自故障开始后,用户报告持续激增,访问量大幅下降,问题持续数小时才逐渐缓解。
Cloudflare也因依赖谷歌云部分服务出现故障,其关键的Workers KV服务受影响,导致多项产品功能受限。Cloudflare核心服务未受影响,但部分依赖服务出现间歇性错误。Cloudflare于下午接近14点时宣布服务逐步恢复,晚些时候完全恢复运营。
Cloudflare首席技术官公开致歉,承诺尽快发布详细事后分析报告,表示深刻理解此次故障对客户的影响,将采取措施避免类似事件再次发生。
故障原因及行业影响讨论
此次宕机引发广泛讨论,有观点认为谷歌一项名为“Chemist”的服务出现故障,导致关键策略检查失败,引发连锁反应,影响多个产品和服务。
也有业内人士注意到多个平台和服务同时出现异常,包括ChatGPT、Heroku、NVIDIA开发文档、Pipedrive等,猜测背后存在关联。
业内专家感叹,此次谷歌云和Cloudflare同时出现大规模故障极为罕见,暴露了大型云服务商之间的依赖关系和潜在风险。
不少用户担忧,云服务商之间相互依赖可能导致“多米诺骨牌效应”,一旦核心服务崩溃,整个互联网生态可能陷入瘫痪。
谷歌云业务面临挑战
谷歌云部门近年来增长迅速,借助人工智能产品需求扩大市场,但此次宕机事件对其声誉造成打击。
此次事件波及美国、欧洲、亚洲共13个谷歌云服务,连带影响AWS的Twitch、CoreWeave、Elastic、GitLab、LangChain,微软的GitHub、Replit,以及Intuit的Mailchimp等多家服务。
这场大规模宕机提醒业界,云计算服务的稳定性依然面临严峻挑战,企业需要警惕供应链及服务链上的潜在风险。
END
原文始发于微信公众号(安全圈):【安全圈】美东时间周四,谷歌云发生大范围故障,导致多家大型网络服务中断,包括Spotify、OpenAI、GitHub等。
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论