包含"故障"的全部内容
浅谈yarn的任务管理与资源管理-运维开发故事

浅谈yarn的任务管理与资源管理

1. 概述1.1. Yarn基本概念YARN(Yet Another Resource Negotiator)是Hadoop 2.x的一个计算框架,旨在解决Hadoop 1.x中的资源管理和任务调度问题。它的主要目的是将MR1 JobTracker 的两个主要功...
GLIBC修复笔记(文末送书)-运维开发故事

GLIBC修复笔记(文末送书)

背景公司环境有台机器硬盘故障,需要安装megacli工具进系统查看raid信息,在ubuntu20.04安装megacli解决依赖过程中失误将高版本的libtinfo包装系统上了,导致系统报glibc对应的版本没有找到,系...
流水的运维,铁打的锅-运维开发故事

流水的运维,铁打的锅

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com0e1f0f7f3c8a285faecf627b8fed4f5.jpg在 6 月 5 号,...
kafka的ACK参数的详解和配置建议-运维开发故事

kafka的ACK参数的详解和配置建议

面试的时候,一旦简历上写了Kafka,几乎必然会被问到一个问题:说说acks参数对消息持久化的影响? 这个acks参数在kafka的使用中,是非常核心以及关键的一个参数,决定了很多东西。所以无论是为...
手把手教你搭建自己的监控系统-运维开发故事

手把手教你搭建自己的监控系统

开始今天分享前,想先问大家一个问题:哪些人应该学习监控相关的知识?只是运维吗?其实,每个关注高可用、关注服务稳定性的技术人员都应该学习监控相关的知识。在稳定性保障体系中,核心就是在...
随便聊聊-运维开发故事

随便聊聊

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com随着分布式架构逐渐成为主流,“可观测性”一词也日...
我差点重做整个K8S集群-运维开发故事

我差点重做整个K8S集群

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com没有遇到故障的运维不是合格的运维,没有处理故障的...
使用SigNoz搭建可观测系统-运维开发故事

使用SigNoz搭建可观测系统

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com前言SigNoz是一个开源的应用程序性能监控工具,可以...
【夜莺监控】海王——Categraf-运维开发故事

【夜莺监控】海王——Categraf

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com有没有人和我一样,遇到同样的困惑:当我使用 Promet...
在Kubernetes中从0打造可观测性-运维开发故事

在Kubernetes中从0打造可观测性

!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事博客:www.jokerbai.com!! 原文:https://k8staz.com/setting-up-open-sourc...