PVE Proxmox Virtual Environment 学习笔记(四)CEPH故障换硬盘


简介:

硬盘其实是服务器故障率最高的设备,没有之一。

只有它是机械的,有磨损,风扇还好,无尘机房可以一直用。

玩意硬盘坏一块怎么办?

一:查看ceph状态

root@pve4:~# ceph osd tree
ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF
-1 3.27478 root default
-3 0.81870 host pve1
0 hdd 0.81870 osd.0 up 1.00000 1.00000
-5 0.81870 host pve2
1 hdd 0.81870 osd.1 up 1.00000 1.00000
-7 0.81870 host pve3
2 hdd 0.81870 osd.2 up 1.00000 1.00000
-9 0.81870 host pve4
3 hdd 0.81870 osd.3 down 0 1.00000

osd.3  下线了

二:去除故障硬盘

ceph osd out osd.3    #下线osd盘
ceph auth del osd.3   #删除权限
ceph osd rm 3           #删除3号

ceph osd crush rm osd.3     #管理删除osd

ceph osd crush rm pve4      #管理删除节点

root@pve4:~# ceph osd rm 3
removed osd.3
root@pve4:~# ceph osd tree
ID  CLASS  WEIGHT   TYPE NAME      STATUS  REWEIGHT  PRI-AFF
-1         3.27478  root default
-3         0.81870      host pve1
 0    hdd  0.81870          osd.0      up   1.00000  1.00000
-5         0.81870      host pve2
 1    hdd  0.81870          osd.1      up   1.00000  1.00000
-7         0.81870      host pve3
 2    hdd  0.81870          osd.2      up   1.00000  1.00000
-9         0.81870      host pve4
 3    hdd  0.81870          osd.3     DNE         0
root@pve4:~# ceph osd crush rm osd.3
removed item id 3 name 'osd.3' from crush map
root@pve4:~# ceph osd tree
ID  CLASS  WEIGHT   TYPE NAME      STATUS  REWEIGHT  PRI-AFF
-1         2.45609  root default
-3         0.81870      host pve1
 0    hdd  0.81870          osd.0      up   1.00000  1.00000
-5         0.81870      host pve2
 1    hdd  0.81870          osd.1      up   1.00000  1.00000
-7         0.81870      host pve3
 2    hdd  0.81870          osd.2      up   1.00000  1.00000
-9               0      host pve4

三:添加新磁盘

记得初始化

wipefs -af /dev/sdc #sdc为新更换的磁盘设备名称

 

相关