包含"kubernetes"的全部内容
Kubernets的NVIDIA设备插件安装方案实践-运维开发故事

Kubernets的NVIDIA设备插件安装方案实践

环境:centos7kubernetes版本:1.24前言:这两天在搞大模型服务,之前也没了解过GPU相关的服务,因此整理了一个关于如何能够使用gpu节点文档。1、现象本来服务已经部署上去,但是一直处理pendin...
Kubernetes中的事件收集以及监控告警-运维开发故事

Kubernetes中的事件收集以及监控告警

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.comKubernetes中的事件监控随着微服务以及云原生的发展...
开发一个接口监控的Prometheus Exporter-运维开发故事

开发一个接口监控的Prometheus Exporter

想必大家对于黑盒监控都不陌生,我们经常使用blackbox_exporter来进行黑盒监控,在K8s中进行黑盒监控可以参考这里。既然已经有成熟的工具,为何自己还要再来尝试开发一个?我说是为了学习,你信...
k8s informer 是如何保证事件不丢失的?-运维开发故事

k8s informer 是如何保证事件不丢失的?

1.资源 Controller 主要作用我们知道 k8s 里重要概念之一就是 声明式 API,比如 kubectl apply 就是声明式 API的实现。效果就是资源对象的运行状态要与我们声明的一致。比如kubectl apply 一个 ...
一文带你了解Docker与Containerd的区别-运维开发故事

一文带你了解Docker与Containerd的区别

容器运行时容器运行时(Container Runtime)是一种负责在操作系统层面创建和管理容器的软件工具或组件。它是容器化技术的核心组件之一,用于在容器内部运行应用程序,并提供隔离、资源管理和安...
手把手教你搭建自己的监控系统-运维开发故事

手把手教你搭建自己的监控系统

开始今天分享前,想先问大家一个问题:哪些人应该学习监控相关的知识?只是运维吗?其实,每个关注高可用、关注服务稳定性的技术人员都应该学习监控相关的知识。在稳定性保障体系中,核心就是在...
这39套云原生技术文档简直是量身为Linux打造,反复啃了3遍-运维开发故事

这39套云原生技术文档简直是量身为Linux打造,反复啃了3遍

云原生这几年的发展可谓是如火如荼,早前大家还会讨论“云原生是不是趋势”,现在这样的声音几乎没有了。云原生已经不是未来趋势,而是我们正处于的环境,现在大家越来越关心“云原生的现实意义...
随便聊聊-运维开发故事

随便聊聊

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com随着分布式架构逐渐成为主流,“可观测性”一词也日...
使用SigNoz搭建可观测系统-运维开发故事

使用SigNoz搭建可观测系统

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com前言SigNoz是一个开源的应用程序性能监控工具,可以...
SQL自动化???-运维开发故事

SQL自动化???

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com数据库在每个企业都占据的非常重要的位置,它存储着...