运维应急响应
-
阿里云服务器被攻击后,我这样排查和止损,亲测有效
做运维这些年,我最怕的不是深夜告警,而是打开监控后台时,发现一台业务服务器的CPU、带宽和磁盘IO同时飙升。那种感觉,很多人经历过一次就忘不了。尤其是当业务跑在云上时,表面上看资源弹性很强,但一旦遇到异常流量、恶意扫描、暴力破解甚至植入后门,损失往往来得又快又猛。前段时间,我就真实经历了一次阿里云的服务器被攻击事件,从发现异常到排查来源,再到临时止损和后续加…
-
阿里云炸了别慌!先做这5步排查,避免业务彻底停摆
“阿里云炸了”,这句话一旦出现在技术群、运维群,往往几分钟内就会引发连锁紧张。网站打不开、接口超时、后台登录不上、支付回调异常,很多企业第一反应是:完了,是不是云厂商全挂了?但真正经历过故障处置的人都知道,阿里云炸了并不等于所有业务一定全面瘫痪,更不意味着马上就要陷入不可控局面。真正决定损失大小的,往往不是故障本身,而是团队在前30分钟内的判断和动作。 很多…