环境 :
操作系统:centos7docker版本: docker 20.10.5
公司的项目的云服务提供方均为阿里云,为了减少运维成本,也基本基于阿里云的产品进行构建。
当然这样做有好处,也有不足,好处是:大大减少了相关产品运维成本更加方便。 不足就是一旦用上了阿里云的这种相关产品以后基本不太可能迁移他处,迁移成本过大。
背景:
由于centos即将停更,后续业务系统准备迁移至debian系统,由于之前所有业务系统全是centos系列产品,必须对debian进行相关测试,今天发现刚装完docker发现无法login登录。
现象
晚上9点半时,接到项目组电话,线上正式环境要进行发布时,自动化流程jenkins一直卡住不动,部分镜像无法推送到中心仓库,项目无法发布。
背景介绍
目前服务皆基于K8S集群构建,团队需要周期性对系统进行安全维护更新,今天又踩一坑,集群中机器分批维护,维护之前排空节点,统一的命令维护更新,结果是绝大部分机器OK,唯独其中一台机器出现如下图故障。