跳转到内容

常见问题

1. pod无缘无故的会重启,且可以正常重启

可以登陆到Kuboard中,看看重启的pod在哪台服务器上,然后进入到对应的节点中,在事件中可以看到重启的原因。很有可能是SystemOOM导致的,此时可以申请对服务器进行内存扩容。

2. images越来越多,导致硬盘空间不足

  1. 在jenkins中可以清理掉多余的构建过程,因为构建过程会产生镜像,过多的话会导致硬盘告急。
  2. 可以登陆服务器删除掉悬挂镜像,即没有tag标签的镜像。如果知晓哪个image也不再使用,也可以手动删除不再使用的image 清除悬挂镜像的命令:docker images --filter "dangling=true" -q | xargs -r docker rmi、清除已经停止的容器命令:docker container prune
  3. 登录Harbor,清理掉确认不再使用的镜像。目前Harbor中设置了定时任务,每天定时留下最新的5个镜像,会清理掉旧的镜像。
  4. 登录Harbor,在首页的清理服务中,有垃圾清理,可以点击立即清理垃圾。

3. Jenkins中构建项目失败

这个问题出现的可能性就比较多了,需要进入到控制台输出中看具体的错误信息。目前jenkins已经平稳运行,如果出现编译错误,那么可能是代码错误以及引用镜像的问题。 第一个代码问题就需要对应开发修改,在本地编译正常后再提交到gitlab。第二个如果是引用的基础镜像找不到,比如jdk、nginx、node等镜像拉取失败。那么可以登陆到jenkins所在服务器中,手动用docker命令把tar文件加载出来(正式环境在/root下边,测试环境在/home/jlbyw下边),命令是:docker load -i node.tar

4. 搭建K8S的时候,calico一直报启动失败

这种情况的原因有很多,需要看具体的错误日志。如果是刚接触k8s,然后自己搭建的话,有很大的可能是由于版本的问题。 除了calico版本外,还有k8s相关的一些组件,他们的版本也都需要适配。 以下的版本是经过验证后的,目前功能足以满足日常需求,并且版本也不算太久,如果不是为了最新功能的话,建议使用以下的K8S相关版本:

yaml
Docker版本为:26.1.4
Kubernetes的版本是:V.1.23.17
Calico的版本是:v3.25.0
pause:3.6
etcd:3.5.6-0
coredns:v1.8.6

5. 在Kuboard中部署服务时,发现新的服务一直起不来

产生这种问题的时候,可以点击到报错的容器组中,看Reason中的具体报错是什么。或者点击跟踪日志,看下日志中有什么报错。

常见的错误有调整镜像版本时,版本号不对,即拿A服务的版本号去更新B服务;或编译的服务是测试环境的,但是在Kuboard中调整版本号时,集群空间是UAT环境。

6. 修改了Nacos配置文件后,发现不重启Nacos服务无法生效

这个问题一般是代码中没有加@RefreshScope注解,加上这个注解,自定义的参数就会生效,不用再重启Nacos。 但是这个只限于支持动态配置刷新的,对于不支持动态应用的配置(例如数据库连接池、端口号等需要重新初始化的配置),那么可能需要重启服务才能使配置生效。