阿里云服务器网站卡顿排查解决方法
1、云服务器,突然一天下午网站打不开,只能显示出网站标题,内容根本显示不出来,同时远程桌面无法登录。登录ECS控制台,强制重启服务器,依然无法正常。
2、打电话给售后,按照客服提示进行排查:首先瞌蕞凿鸠登录ECS,找到【实例与镜像】,点击实例,看到自己的服务器后,点后面的【管理】,再点击【监控】,看一下当前服务器各项指标。CPU使用率:不高,内台仵瑕噤存使用率也不高,唯有公网带宽项,出现了峰值,鼠标放到曲线上,可以看到 OUT rate 已经超出1M/s。 客服说应该就是带宽满了,建议我增加带宽。可事实上,我的网站一天最多100人访问,配置的1m带宽应该是绰绰有余,并且上午还好好的,我看了一下,前几天的曲线都是正常的,只有出故障这个时间段突然达到高峰。
3、点击ECS控制台的 【远程连接】,打开网页版窗口,这里可以正常登陆服务器,打开【任务管理器】,查看【性能】,再点击最下面的【打开资源监视器】,可以看到cpu,内存都在正常范围内。这时候,查看【网络】项,看是向哪个公网IP地址发送了大量的流量。导致带宽占满。
4、既然是这个原因,先在【控制面板】中找到晃瓿淀眠【服务】,关闭World Wide Web server(IIS)服务,然后试了一下通过wi荏鱿胫协ndow的远程桌面连接,发现可以正常登录了,但只要开启iis,立即无法操作服务器又处于卡死状态,说明确实是这几个IP占用了大量的带宽。解决方案就是先要禁止这几个IP访问服务器。回到 ECS控制台,找到实例所在安全组中,禁止该IP地址访问ECS实例。如果要禁止一组IP,则将端口设置为 全部,源设置为:X.X.0.0/16设置后,网站立刻可以正常访问了。
5、后续:禁止IP只能将已知风险去掉,所以,还要在服务器上排查这几个IP到底访问了什么内容导致卡顿。打开C:\inetpub\logs\LogFiles 目录 ,找到里面当天所有日志文件,打开,搜索IP,找到对应的记录,发现是在同时多进程访问一个大的视频文件,于是,将该视频文件删除,以绝后患。