排序
避免告警疲劳:每个 K8s 工程团队的 8 个技巧
监控 Kubernetes 集群并不容易,告警疲劳通常是一个问题。阅读这篇文章,了解减少告警疲劳的有用提示。如果你是oncall团队的一员,你一定知道什么是警觉性疲劳以及它对你的健康有何影响。而当涉...
开发一个禁止删除namespace的控制器
大家好,我是乔克。image.png昨天收到一个朋友的信息,说不小心把集群的业务namespace干掉了,导致整个业务都停滞了,问我有没有禁止删除namespace的方案。在我的记忆里,Kubernetes的准入里并...
【夜莺监控】从日志中提取指标的瑞士军刀
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.commtail是谷歌开源的一款从应用日志提取 metrics 的工...
Tekton系列之实践篇-如何用Jenkins来管理Tekton
在《Tekton系列之实践篇-由Jenkins改成Tekton》中,我们可以将Jenkinsfile改成Tekton Pipeline,但是Tekton有一个很大的问题是不能很好的划分权限,特别是在Dashboard上根本就做权限控制,那如...
详解Kubernetes网络模型
作者 | Kevin Sookocheff原文 | https://sookocheff.com/post/kubernetes/understanding-kubernetes-networking-model/转载 | 运维开发故事说明 | 版权归原作者所有Kubernetes 是为运行分布式集...
能解决 80% 故障的排查思路
在讲解事件、故障处理思路前,先讲一个故障场景(以呼叫中心系统作为一例子):业务人员反映呼叫中心系统运行缓慢,部分电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况...
记一次内部分享——瞎扯淡
image.png大家好,我是乔克。今天给大家分享的主题是《闲聊Docker》,大家的工作都比较忙,但是也要劳逸结合,所以“闲”是忙里偷闲,而“聊”是只动嘴不动手,整个分享过程中不会去动手实践,...
