Kubernetes 网络排错骨灰级中文指南 文章将引入 Kubernetes 集群中网络排查的思路,包含网络异常模型,常用工具,并且提出一些案例以供学习。 Pod 常见网络异常分类 网络排查工具 Pod 网络异常排查思路及流程模型 CN... 系统教程# kubernetes# pod# 异常 2年前90
救火必备!问题排查与系统优化手册 软件工程领域存在一个共识:维护代码所花费的时间要远多于写代码。而整个代码维护过程中,最惊心动魄与扣人心弦的部分,莫过于问题排查(Trouble-shooting)了。特别是那些需要 7x24... 网站建设# 开发# 开发工具# 排查 2年前2980
转转B2C一站式服务告警治理的背后 转转B2C技术部主要负责商详、商列等BFF层核心页面业务,单接口甚至需要开线程池并行调用二十多个依赖服务,因此依赖的服务以及执行线程池的稳定性也就成为了B2C关注的重点。,那么站在技术视角看调用链路... 网站建设# bc# 告警# 排查 2年前260
一次由groovy引起的fullGC问题排查 ,一、问题背景,二、分析过程,三、解决方案,prometheus监控报警生效后,某服务每天的上午 8-12 点间会有fullGC的报警;,排查并解决该问题;,二、分析过程,JVM 参数配置如下:,新生... 网站建设# 任务# 定时# 报警 3年前100
业务前端界面报错504排查思路和解决办法 本文主要是写的最近比较影响深刻的一次排查客户访问业务前端域名,报504,timeout错误问题的记录,该客户为私有化部署,给客户部署的服务存在跨洲调用,没有专线,澳洲调用欧洲的服务情况,可能存在网络延... 网站建设# 域名# 客户# 排查 3年前570
生产环境Go程序内存泄露,用pprof如何快速定位 内存泄漏可以在整个系统中以多种形式出现,除了在写代码上的疏忽,忘了关闭该关闭的资源外,更多的时候导致系统发生内存泄露原因可能是设计上决策不对、或者业务逻辑上的疏忽没有考虑到一些边界条件。,比如查数据库... 网站建设# pprof# 内存# 排查 3年前450
面试突击:死锁的排查工具有哪些? 死锁(Dead Lock)指的是两个或两个以上的运算单元(进程、线程或协程),都在等待对方释放资源,但没有一方提起释放资源,从而造成了一种阻塞的现象就称为死锁。,比如线程 1 拥有了锁 A 的情况下试... 网站建设# jps# 如下# 排查 4年前250
如何在测试中发现Goroutine泄漏 哈喽,大家好,我是asong;,众所周知,gorourtine的设计是Go语言并发实现的核心组成部分,易上手,但是也会遭遇各种疑难杂症,其中goroutine泄漏就是重症之一,其出现往往需要排查很久... 网站建设# goleak# goroutine# 可以 4年前130
从Select引起的Bug聊聊多路复用一 很久没写文章了,主要自己还在沉淀,学习类的分享总觉得为了分享而分享,多几天可能自己都记不清细节了,所以一直没有再去写,这次遇到一个比较有意思的bug,多路复用的一个bug,这个领域那,虽然自己也学习过... 网站建设# bug# core# 分享 4年前470
分布式链路追踪Jaeger + 微服务Pig在Rainbond上的实践分享 随着微服务架构的流行,客户端发起的一次请求可能需要涉及到多个或 N 个服务,致使我们对服务之间的监控和排查变得更加复杂。,举个例子:,某条业务线的某个接口调用服务端时快时慢,这时就需要排查各个服务的日... 网站建设# apm# jaeger# 排查 5年前370
问题排查不再愁,Nacos 上线推送轨迹功能 注册配置千千万,唯有推送轨迹最解愁。,微服务体系下,注册中心的调用和配置变更是家常便饭,例如阿里每天就有百万级变更、亿级推送。可是,一旦出现调用或配置异常,问题排查就成了用户最大的困惑:是注册和配置中... 网站建设# 排查# 推送# 注册 5年前480
Java服务异常排查定位大图 ,,研发工程师日常的工作除了开发实现新需求之外,排查定位问题也是重要的组成部分。如果在发生线上故障的时能够快速定位线上bug并且修复bug,不仅是研发工程师技术能力的重要体现,同时也可以帮助线上及时止... 网站建设# 大图# 定位# 定位问题 5年前220