腾讯云公布4月8日大范围故障原因 升级API产生兼容性问题并产生循环依赖 – 蓝点网
4 月 8 日腾讯云出现大范围故障,腾讯此次故障主要影响产品控制台例如用户无法通过 Web 界面对服务器或其他产品进行操作,云公原因当然由于是布月并产 API 问题实际上也无法通过 API 执行各类操作。
此次故障对于服务器等产品本身是日大容性没有影响的,即服务器仍然是范围正常运行的只不过用户无法执行操作,其他产品例如 CDN 和域名解析等也是故障同理。

昨天腾讯云公众号发布 4 月 8 日的升级生兼生循故障复盘及情况说明,简单来说是问题发布新版 API 时出现了兼容性错误:
故障的直接原因是云 API 服务行版本向前兼容性考虑不够和配置数据灰度机制不足的问题。本次 API 升级过程中,环依由于新版本的赖蓝接口协议发生变化,在后台发布新版本之后对于旧版本前端传来的点网数据处理逻辑异常,导致生成了一条错误的腾讯配置数据。
由于灰度机制不足导致异常数据快速扩散到了全网地域,云公原因造成整体 API 使用异常。布月并产
然后还有循环依赖问题:
发生故障后按照标准回滚方案将服务后台和配置数据同时回滚到旧版本并重启 API 后台服务,日大容性但此时因为承载 API 服务的容器平台也依赖 API 服务才能提供调度能力,即发生了循环依赖 (需要安装 WinRAR 时下载网站给你了个 WinRAR.rar)
发生循环依赖的后果就是服务无法自动拉起,最终运维通过手工启动方式才让 API 服务重启,完成了整个故障的恢复。
针对此次问题腾讯云也汲取教训制定了改进措施:
改进措施里就有针对循环依赖问题的解决方案,包括提供优化服务部署架构,通过分层架构、代码审查和监控等手段,避免 API 服务中存在的循环依赖问题。
同时还要提供 API 服务逃生通道,当故障发生后可以提供调用方法快速切换。
针对 Status 页面的透明度问题:
透明度问题目前是国内云计算提供商都存在的问题,即问题发生后状态页面还显示一切正常,这让很多用户看了状态页后以为是自己问题。
腾讯云此次故障状态页同样没有及时更新,原因是状态页也依赖 API,但此时 API 已经寄了,所以腾讯云计划将状态页解除对云 API 等云服务的依赖,确保云服务故障时状态页依然能准确及时传递 故障信息。
(责任编辑:娱乐)
- switch版《吃豆人锦标赛第2版PLUS》加入双人模式
- 粉饼会卡粉吗 粉饼卡粉是什么原因
- 2021好玩的爱情摹拟游戏保举 真人爱情足游
- 萝卜丁口红色号推荐 萝卜丁口红哪个色号最好看
- 第一人称生存射击《红移点》现已上架发售时间待定
- 《放射兵士3》季票第1弹2月28日上线 回回初代园天尚兴市
- 2023年7月份游戏版号公布:《铃兰之剑:为那战役的天下》等游戏过审
- 开击传奇足游保举 那几款很好玩
- 《死神:魂魄觉醒》玩法概述预告发布支持中文
- 甲油胶有颗粒怎么回事 甲油胶有点粘稠怎么办
- 粉饼可以当气垫用吗 粉饼可以直接用吗
- 《圆船保存退化》次世代版本重逝世物“巨匪龙”图谱公开,史前逝世界的恐龙保母
- 《圣剑传说 Visions of Mana》现已开启免费试玩
- 《贪玩蓝月》查询拜访内患,正正两圆剑拔弩张!
