dubbo线程池资源耗尽的分析

二月份的工作总结,分享一下。
近期我们线上A网站爬取效率不高,时间比较长,由于元旦时可以达到30w+一天,故排查重点还是流程以及dubbo线程池问题。
1、dubbo线程池发生:RejectedExecutionException: Thread pool is EXHAUSTED!异常时,使用jstat查看jvm使用情况,GCT的时间在2-3之间,不算太高。
2、使用jstack查看堆栈信息,发现大量java.lang.Thread.State: RUNNABLE,没有死锁发生。对比A网站和B网站的堆栈信息,A网站java.lang.Thread.State: RUNNABLE比例大概是85%以上,其余是TIMED_WAITING和WAITING;而B网站java.lang.Thread.State: RUNNABLE比例大概是10%~20%,其余是TIMED_WAITING和WAITING。(事后分析,这里已经有问题了,大部分的任务都是RUNNABLE应该是存在问题的)
3、网上查找关于查看dubbo线程池方法。
发现可以使用telnet命令来查看dubbo线程池(http://alibaba.github.io/dubbo-doc-static/Telnet+Command+Reference-zh-showComments=true&showCommentArea=true.htm
如图所示:

dubbo线程池资源耗尽的分析 - 在路上的小海贼 - 笑傲江湖

可以查看线程池的健康程度、最大线程数、活跃线程数、任务数等等。
发现当A网站的线程池active是一直波浪增长的,直至达到max,即线程池满了。但查看爬虫自服务、B网站等,active数基本都是1,会增长也会落下来。
至此,基本上可以判断A网站效率问题是由于某种原因导致活跃线程数无法释放,导致最终线程池卡死。
4、由于A网站爬虫有四个定时器启动,分别是a功能、b功能、c功能、d功能,所以分开试验,只启动单个定时器,看active数据是否增长。
a、启动a功能定时器,不增长;
b、启动b功能定时器,缓慢增长;
c、启动c功能定时器,增长较快;
d、启动d功能定时器,不增长。
对比代码,发现b、c中均包含httpClient调用,问题出在httpClient调用。
5、由于B网站也使用了httpClient调用,但并没有出现问题,故需要测试使用代理IP和不使用代理IP两种。
写测试代码测试httpClient调用时使用代理IP与不使用代理IP,发现访问B网站、百度等网站,不使用代理IP,active不增长;使用代理IP访问裁判文书则active增长?;骋蒱ttpClient有些操作导致了线程池资源耗尽。(事后发现此处可以不测试,因为A网站与B网站除了使用与与不使用代理IP外,最大的区别是B网站几乎不超时,而A网站大概率超时)
6、网上查找原因,看了http://blog.csdn.net/clementad/article/details/75649625 这篇文章后发现httpClient的超时设置少了一个,应该增加如下所示:

dubbo线程池资源耗尽的分析 - 在路上的小海贼 - 笑傲江湖

运行代码后发现索然active还是有些增长,但明显慢了很多,在家里运行了将近3个小时,从最开始涨到了50左右,然后基本稳定
7、我一个同事后来发现timeout时间设置没有生效,在httpClient.execute()之前,需要设置配置生效,httpget.setConfig(requestConfig);这样设置后,运行一晚上,active数稳定在20左右。后来发现是由于setDefaultRequestConfig两次,第二次set时可能是冲掉了第一次的timeout设置。之所以配置clientBuilder.setDefaultSocketConfig(SocketConfig.custom().setSoTimeout(30000).build()); 也能够达到效果,但效果不如使用httpget.setConfig(requestConfig);设置效果明显,是因为前者相当于给httpClient设置了一个超时时间的设置,会起效果,但也只是给响应设置了超时时间,而缺少下面三个配置,则效果不够理想

//客户端和服务器建立连接的timeout
requestConfigBuilder.setConnectTimeout(30000);
//从连接池获取连接的timeout
requestConfigBuilder.setConnectionRequestTimeout(30000);
//连接建立后,request没有回应的timeout
requestConfigBuilder.setSocketTimeout(30000);
8、测试环境和最终的线上环境,同时配置了四个超时时间且都是生效的,这样,长期运行下active数量峰值可达到100以上,但会回落,可以回落到个位数十位数,比较稳定。
9、dubbo线程池稳定后,A网站爬取的效率则得到了提升,目前速度比较稳定,需要长期观察爬取速度和dubbo线程池active数量。

最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事?!?“怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351