排序
Kubernetes中的事件收集以及监控告警
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.comKubernetes中的事件监控随着微服务以及云原生的发展...
关于监控的那些事
关于监控的那些事 监控是整个运维以及产品整个生命周期最重要的一环,它旨在事前能够及时预警发现故障,事中能够结合监控数据定位问题,事后能够提供数据用于分析问题。 一、监控的目的 监控贯...
【K8S专栏】什么是云原生?
大家好,我是乔克。什么是云原生?我相信大部分人都听过云原生,但是要你说出一个所以然,却不知道怎么开口,我也是一样。我不知道云原生到底是什么,从字面来看:云原生就是为云而生。云是什么...
Kubernets的NVIDIA设备插件安装方案实践
环境:centos7kubernetes版本:1.24前言:这两天在搞大模型服务,之前也没了解过GPU相关的服务,因此整理了一个关于如何能够使用gpu节点文档。1、现象本来服务已经部署上去,但是一直处理pendin...
多种边缘集群管理方案对比选型
1.背景 边缘计算平台,旨在将边缘端靠近数据源的计算单元纳入到中心云,实现集中管理,将云服务部署其上,及时响应终端请求。然而,成千上万的边缘节点散布于各地,例如银行网点、车载节点、加...
【K8S专栏】什么是Kubernetes
大家好,我是乔克。什么是Kubernetes?在《Docker容器技术》章节就有简单介绍Kuberntes,它是谷歌开源的容器容器集群管理系统,是谷歌内部容器管理系统Borg的开源版本。Borg系统是谷歌内部使用...
探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard
一、导读 Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。从网络配置到故障排查,每一步都需要深入的技术积累。然而,随着人工智能技术的...
Kubernetes集群多租户资源管理
1.概述 先讲解Pod的两个重要参数:CPU Request与Memory Request。在大多数情况下我们在定义Pod时并没有定义这两个参数,此时Kubernetes会认为该Pod所需的资源很少,并可以将其调度到任何可用的N...
【K8S专栏】Kubernetes集群管理
大家好,我是乔克。Kubernetes作为容器的编排平台,它是以集群的形式为业务提供服务。所以在日常的工作中,作为Kubernetes平台的维护者,会经常对集群进行管理。这里,我将集群管理分为以下几种...
开发 Operator 调度 GPU 实例资源池
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。 作者:乔克 公众号:运维开发故事 博客:https://jokerbai.com ✍ 道路千万条,安全第一条。操作不规...



