网上曝光流出阿里云事件官方出的调查报告,大家理性吃瓜!里面说的一句话概括就是半截的白名单没灰度就更新了,并且举例:保障完双十一之后总要回滚部分服务和配置吧,然后恰巧有个配置涉及到了阿里云非常底层的一个鉴杈组件叫RAM,要改RAM配置总得先导出一个配置文件吧,导配置文件的时候正好内存溢出文件没导完就停了也很难发现对吧,然后我们年轻的研发同学就把这个只导了半截的配置文件更新到了所有地域。 负责任的说,这是假的大家散了吧,首先配置更新有鉴权,其次大促后第二天还是周末是不允许发布和线上机器rollback,第三上面的例子举的都不恰当利益相关,这次事故关键词是异常场景、堆积。上面的太扯了,谁大促后第二天休息日过后自己默默搞配置,配置更新一般是不需要人手工导出导入的,尤其是大促后,而且配置导出和导入前都有规则校验,怎么可能只让你更新半截文件,最后线上配置更新是要走审批的,不是一个人能立马做的
评论列表