阿里云ECS无法开机解决方法及安全操作流程
之前有一次阿里云ECS磁盘满了,连不上主机,后来点了重启就无法开机了,发工单给阿里云的工程师得到回复是这样的:
您的服务器系统在启动过程中会卡住,不能正常启动完成。 在系统启动时,设置用单用户模式可以正常进入系统,单用户模式进去,检查系统里边也没有发现异常,尝试把 /etc/rc3.d/ 下边开机启动的服务都取消了,重启服务器还是会卡在,目前没能修复系统启动的问题。
当前是单用户模式进去的,您也可以从控制台登录服务器里,检查一下系统里的启动服务情况。
可以备份一下服务器里的数据,考虑给服务器重新初始化系统,恢复到最初正常的系统启动。
我后来重新创建了一个 ECS,使用和故障机器一样的系统版本,增加一块数据盘,数据盘以此前备份的快照创建。
启动后,fdisk -l 查看分区,使用 mount /dev/vdb1 /mnt 挂载成功。(需要注意,每个系统的分区名称可能不一样,自己实际看一下再挂载)
到这里心里基本有底,备份故障机器,重新装系统,直接用 mount /dev/vdb1 /mnt 挂载成功。
总结恢复流程:
1、备份快照
2、重装系统
3、fdisk -l 查看分区
4、挂载数据盘
mount /dev/vdb1 /mnt
(需要注意,每个系统的分区名称可能不一样,自己实际看一下再挂载)
5、注意设置开机自动挂载磁盘
也可以新开一个机器 挂载通过快照创建的云盘。
这里要特别说一下,我的数据都在 RDS 上,所以重新获得数据盘的文件即可,系统无所谓。数据和 WEB 服务器分离、系统和网站文件磁盘分离,这是有必要的。