运维开发故事-幻灯片
运维开发故事-幻灯片
    最新发布第29页
提升GPU利用率:探索NVIDIA的MIG与MPS虚拟化技术-运维开发故事

提升GPU利用率:探索NVIDIA的MIG与MPS虚拟化技术

1. 背景 目前GPU卡资源紧张且业务需求逐渐递增,存在整卡不够分配或GPU利用率低造成资源浪费的情况。 我们也不可否认还有非常多的应用场景对算力的需求不大,比如: AI推理场景,基本都是在线...
Elasticsearch 知识点全景整理(面试 & 学习指南)-运维开发故事

Elasticsearch 知识点全景整理(面试 & 学习指南)

🚀 无论是求职面试,还是日常工作中的搜索、日志分析和监控系统,Elasticsearch 都是绕不开的技术点。本文从 原理、架构、查询、调优、运维、安全与实践 七大方面,系统梳理 ES 的知识点,帮...
开发 Operator 调度 GPU 实例资源池-运维开发故事

开发 Operator 调度 GPU 实例资源池

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。 作者:乔克 公众号:运维开发故事 博客:https://jokerbai.com ✍ 道路千万条,安全第一条。操作不规...
AIOps系列 | 基础设施即代码-运维开发故事

AIOps系列 | 基础设施即代码

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。 作者:乔克 公众号:运维开发故事 博客:https://jokerbai.com ✍ 道路千万条,安全第一条。操作不规...
一文搞定 Linux 与 Windows 双系统修复-运维开发故事

一文搞定 Linux 与 Windows 双系统修复

!! 大家好,我是wanger,一个不爱折腾的运维工程师,一个睡觉都被自己帅醒的云原生爱好者。 作者:wanger 公众号:运维开发故事 博客:https://devopstory.cn centos 文件系统修复 1. 挂载 ...
深入剖析Alertmanager:解锁告警管理的核心逻辑-运维开发故事

深入剖析Alertmanager:解锁告警管理的核心逻辑

✍ 道路千万条,安全第一条。操作不规范,运维两行泪。一、引言在当今复杂的IT系统架构中,监控体系对于保障系统的稳定运行至关重要。而Alertmanager作为监控体系里关键的一环,在处理告警信息...
AIOps系列 | 开发 K8s GPT 故障诊断工具-运维开发故事

AIOps系列 | 开发 K8s GPT 故障诊断工具

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:https://jokerbai.com✍ 道路千万条,安全第一条。操作不规范,...
KVM虚拟化之设备透传-运维开发故事

KVM虚拟化之设备透传

显卡透传查看显卡PCI地址lspci | grep -i nvidia会看到类似下面的输出,其中包含显卡的 PCI 地址,例如 0000:03:00.0:03:00.0 VGA compatible controller:...
MCP 教程-智能化设计交付:如何使用Cursor IDE的MCP功能将Figma设计稿一键转换为前端代码-运维开发故事

MCP 教程-智能化设计交付:如何使用Cursor IDE的MCP功能将Figma设计稿一键转换为前端代码

还在手动从设计稿提取样式、编写基础代码?试试 Cursor IDE 的模型上下文协议(MCP)功能吧。通过使用 MCP Server - Figma-Context-MCP,自动将你的 Figma 设计稿转换为整洁的前端代码,并生成...
告警平台2.0——仿出强大-运维开发故事

告警平台2.0——仿出强大

✍ 道路千万条,安全第一条。操作不规范,运维两行泪。 在《告警平台1.0》中,我们实现了告警平台,可以实现纳管通过AlertManager推送的告警信息,然后进行灵活的告警通知发送。 在这个基础上...