最近有一段时间没搞压测了,团队里的同学也在搭建线上压测平台,想着今年七、八月份能够在业务压测中线上实战一把。
成功升级ZooKeeper:兼容性与性能实践探索
在之前的一篇文章中有提到,我们作了一些ZooKeeper
上的资源管理实践。
记录我们在ZooKeeper上的资源管理实践
并不是专业运维,如果有更好的想法欢迎讨论。
又双叒是压测,来看看这次发现哪些新问题
对,没错,又是我。
对,没错,又是压测。
对,这次又发现了新的问题。
一次Elastic APM导致的线上性能问题
好不容易经过了旺季,陆陆续续也经历了Redis数据节点出口带宽
、ES节点负载倾斜宕机
等故障的发生,对于线上基础设施和组件的问题关注也越来越多。
基于Flink实现的业务流量趋势监控
临近旺季,对过往的故障进行复盘,发现目前的全链路更多是服务层面的异常识别和分析,但是对于更上层业务流量的异常是无法识别到的。
来看看一次业务压测流程该如何做
之前有提到最近在配合业务做压测,这个过程中除了在业务及肉鸡上发现一些问题外,在整个压测流程上也踩了不少坑。
记一次业务压测过程中的问题
最近在和业务一起做压测,中间陆陆续续还是发现了一些问题,这里也一起汇总一下,看看压测中需要关注什么,也看看业务中常见的一些性能问题。
带你彻底了解JVM SafePoint
之前听了大佬的JVM工作坊,其中有提到SafePoint
,一直大概知道这个概念,理解很模糊,也比较好奇JVM是如何实现的,所以打算好好研究一把。
一个线上问题看各家线程池拒绝策略
又到了烧高香的季节,业务旺季来了。