排序
快速修复重装系统后的 Kubernetes Master 节点
最近碰到两次,因故障需要重装主机系统。其中一次 Etcd 只剩下一个节点,导致整个集群宕机半个小时才恢复。 本篇主要记录的是新系统 Ubuntu 20.04 初始化的过程,完成初始化之后采用优秀的集群...
kubernetes集群降级|k8s1.24+版本降级到1.23
在CentOS系统上进行Kubernetes版本降级需要谨慎操作,因为降级可能会导致集群出现不稳定的情况。在进行版本降级之前,建议先备份Kubernetes集群和相关数据,以便在出现问题时可以恢复到之前的状...
multipass + k3s 搭建本地K3s高可用集群
环境 k3s官网最新multipass+hyperv开始创建虚拟网卡外部 选择要连接的物理设备 网卡名WAN创建虚拟机数据库节点以及负载均衡节点 multipass launch --name k8sLB --m 1G --network WAN master1 m...
k8s自动清理节点
一、自动清理节点 将节点添加到集群时后,会创建容器、虚拟网络接口等资源和证书、配置文件。从集群中正常删除节点时(如果处于 Active 状态),将自动清除这些资源,并且只需重新启动节点即可。...
Robusta 收集 Kubernetes Pod 崩溃时的 OOM 日志
robusta 的功能远不止本章介绍的这些,它可以去监控 Kubernetes,提供观测性,可以于 prometheus 接入,作为告警的二次处理,自动修复等,也提供了事件的时间线。 此前使用的是阿里的 kube-even...
docker 实用工具 gosu 和 su-exec 实践
volume 的权限问题 在 Docker 中,需要把 host 的目录挂载到 container 中作为 volume 使用时,往往会发生文件权限问题。常见的现象是,container 对该路径并无写权限,以致其中服务的各种千奇...
kubectl的多样用法
kubectl是K8s官方附带的命令行工具, 可以方便的操作K8s集群. 这篇文章主要介绍一些kubectl的别样用法, 希望读者有基础的K8s使用经验. 打印当前使用的API # kubectl 的主要作用就是与A...
CoreDNS之K8S 监控实战
CoreDNS 是 Kubernetes 环境的DNS add-on[1]组件。它是在控制平面节点中运行的组件之一,使其正常运行和响应是 Kubernetes 集群正常运行的关键。学习如何监控 CoreDNS,以及它最重要的指标是什...
当 Pod 崩溃后在报警信息中获取对应的日志信息
Robusta 是一个 Python 开发的用于 Kubernetes 故障排除的开源平台。它位于你的监控堆栈(Prometheus、Elasticsearch 等)之上,并告诉你警报发生的原因以及如何修复它们。 Robusta 包含三个主...
优雅限制 Kubernetes 集群中文件描述符与线程数量
背景 linux中为了防止进程恶意使用资源,系统使用ulimit来限制进程的资源使用情况(包括文件描述符,线程数,内存大小等)。同样地在容器化场景中,需要限制其系统资源的使用量。 限制方法 ulim...












