搜索精彩内容
包含"kubelet"的全部内容
提升GPU利用率:探索NVIDIA的MIG与MPS虚拟化技术
1. 背景 目前GPU卡资源紧张且业务需求逐渐递增,存在整卡不够分配或GPU利用率低造成资源浪费的情况。 我们也不可否认还有非常多的应用场景对算力的需求不大,比如: AI推理场景,基本都是在线...
AIOps系列 | 基础设施即代码
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。 作者:乔克 公众号:运维开发故事 博客:https://jokerbai.com ✍ 道路千万条,安全第一条。操作不规...
Kubernets的NVIDIA设备插件安装方案实践
环境:centos7kubernetes版本:1.24前言:这两天在搞大模型服务,之前也没了解过GPU相关的服务,因此整理了一个关于如何能够使用gpu节点文档。1、现象本来服务已经部署上去,但是一直处理pendin...
Kubernetes中的事件收集以及监控告警
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.comKubernetes中的事件监控随着微服务以及云原生的发展...
一文带你了解Docker与Containerd的区别
容器运行时容器运行时(Container Runtime)是一种负责在操作系统层面创建和管理容器的软件工具或组件。它是容器化技术的核心组件之一,用于在容器内部运行应用程序,并提供隔离、资源管理和安...
随便聊聊
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com随着分布式架构逐渐成为主流,“可观测性”一词也日...
【夜莺监控】海王——Categraf
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com有没有人和我一样,遇到同样的困惑:当我使用 Promet...
【夜莺监控】管理Kubernetes组件指标
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com开始之前Kubernetes 是一个简单且复杂的系统,简单之...
【K8S专栏】Kubernetes应用配置管理
不论什么样的应用,基本都有配置文件,在企业中,大部分会用到配置中心,比如apollo、nacos等,也有一些公司直接使用Kubernetes自带的配置管理,主要有:SecretConfigMapSecret如果把配置信息保...
