好不容易经过了旺季,陆陆续续也经历了Redis数据节点出口带宽
、ES节点负载倾斜宕机
等故障的发生,对于线上基础设施和组件的问题关注也越来越多。
基于Flink实现的业务流量趋势监控
临近旺季,对过往的故障进行复盘,发现目前的全链路更多是服务层面的异常识别和分析,但是对于更上层业务流量的异常是无法识别到的。
来看看一次业务压测流程该如何做
之前有提到最近在配合业务做压测,这个过程中除了在业务及肉鸡上发现一些问题外,在整个压测流程上也踩了不少坑。
记一次业务压测过程中的问题
最近在和业务一起做压测,中间陆陆续续还是发现了一些问题,这里也一起汇总一下,看看压测中需要关注什么,也看看业务中常见的一些性能问题。
带你彻底了解JVM SafePoint
之前听了大佬的JVM工作坊,其中有提到SafePoint
,一直大概知道这个概念,理解很模糊,也比较好奇JVM是如何实现的,所以打算好好研究一把。
一个线上问题看各家线程池拒绝策略
又到了烧高香的季节,业务旺季来了。
由浅入深了解半/全连接队列(二) - 溢出篇
上一篇文章中,我们主要介绍了半/全连接队列的基础知识和溢出判断的方法。但是在实际场景中,队列溢出有不同的可能性,我们也通过例子来简单复现,看看不同的溢出场景下的现象和判断方式。
由浅入深了解半/全连接队列(一) - 基础篇
最近项目上遇到一个问题,运维反馈有一个服务会不定时出现健康检查异常,于是去排查了一下。问题最终发现和半连接、全连接队列大小有关,所以打算好好研究一下。
教你如何丢核弹 - Log4j2漏洞
说起核弹,你可能会想到这样的↓
性能分析与排查 - CPU
最近在公司做了一次简单的技术分享,主要讲性能问题的分析与排查,首次主要以 CPU 为主题进行,这里也把 PPT 整理成文章。