记一次误删引发的服务雪崩
K8s node节点磁盘报警,报警后我找到服务中占用磁盘最多的地方,在overlay2目录下,对下面的文件进行了删除
删除后,有状态服务先出现了问题,服务无法启动、停止、删除。
对节点进行重启后,无状态服务集体雪崩…
报错信息如图:
解决方法:
# 缓存镜像层的问题,要清除缓存镜像层docker system prune -a
分析:docker容器将容器缓存放在了overlay2这个目录下,保存着当前服务的状态等资源。将目录删除后,容器默认会先去查状态,然后再进行销毁、重启等操作。这时候,找不到目录,就停在了这里。
建议: 清理docker内存,使用docker删除镜像的命令,除非删除挂载卷备份文件,其他不要使用rm去找文件。