当前位置：首页 > 科技 > 软件

线程池遇到父子任务，有大坑，要注意！

来源：责编：时间：2024-07-17 07:45:11 720观看

导读你好呀，我是歪歪。最近在使用线程池的时候踩了一个坑，给你分享一下。在实际业务场景下，涉及到业务代码和不同的微服务，导致问题有点难以定位，但是最终分析出原因之后，发现可以用一个很简单的例子来演示。所以歪师傅这次先用

你好呀，我是歪歪。

最近在使用线程池的时候踩了一个坑，给你分享一下。

在实际业务场景下，涉及到业务代码和不同的微服务，导致问题有点难以定位，但是最终分析出原因之后，发现可以用一个很简单的例子来演示。

所以歪师傅这次先用 Demo 说问题，再说场景，方便吸收。

Demo

老规矩，还是先上个代码：

图片

这个代码的逻辑非常简单，首先我们搞了一个线程池，然后起一个 for 循环往线程池里面仍了 5 个任务，这是核心逻辑。

对于这几个任务，我们的这个自定义线程池处理起来，不能说得心应手吧，至少也是手拿把掐。

其他的 StopWatch 是为了统计运行时间用的。至于 CountDownLatch，你可以理解为在业务流程中，需要这五个任务都执行完成之后才能往下走，所以我搞了一个 CountDownLatch。

这个代码运行起来是没有任何问题的，我们在日志中搜索“执行完成”，也能搜到 5 个，这个结果也能证明程序是正常结束的：

图片

同时，可以看到运行时间是 4s。

示意图大概是这样的：

图片

然后歪师傅看着这个代码，发现了一个可以优化的地方：

图片

这个地方从数据库捞出来的数据，它们之间是没有依赖关系的，也就是说它们之间也是可以并行执行的。

所以歪师傅把代码改成了这样：

图片

在异步线程里面去处理这部分从数据库中捞出来的数据，并行处理加快响应速度。

对应到图片，大概就是这个意思：

图片

把程序运行起来之后，日志变成了这样：

图片

我们搜索“执行完成”，也能搜到 5 个对应输出。

而且我们就拿“任务2”来说：

图片

当前线程pool-1-thread-3,---【任务2】开始执行---当前线程pool-1-thread-3,---【任务2】执行完成---当前线程pool-1-thread-1,【任务2】开始处理数据=1当前线程pool-1-thread-2,【任务2】开始处理数据=2

从日志输出来看，任务 2 需要处理的两个数据，确实是在不同的异步线程中处理数据，也实现了我的需求。

但是，程序运行直接就是到了 9.9ms：

图片

这个优化这么牛逼的吗？

从 4s 到了 9.9ms？

稍加分析，你会发现这里面是有问题的。

那么问题就来了，到底是啥问题呢？

你也分析分析大概是啥问题，别老是想着直接找答案啊。

问题就是由于转异步了，所以 for 循环里面的任务中的 countDownLatch 很快就减到 0 了。

于是 await 继续执行，所以很快就输出了程序运行时间。

然而实际上子任务还在继续执行，程序并没有真正完成。

9.9ms 只是任务提交到线程池的时间，每个任务的数据处理时间还没算呢：

图片

从日志输出上也可以看出，在输出了 StopWatch 的日志后，各个任务还在处理数据。

这样时间就显得不够真实。

那么我们应该怎么办呢？

很简单嘛，需要子任务真正执行完成后，父任务的 countDownLatch 才能进行 countDown 的动作。

具体实现上就是给子任务再加一个 countDownLatch 栅栏：

图片

我们希望的运行结果应该是这样的：

当前线程pool-1-thread-3,---【任务2】开始执行---当前线程pool-1-thread-1,【任务2】开始处理数据=1当前线程pool-1-thread-2,【任务2】开始处理数据=2当前线程pool-1-thread-3,---【任务2】执行完成---

即子任务全部完成之后，父任务才能算执行完成，这样统计出来的时间才是准确的。

思路清晰，非常完美，再次运行，观察日志我们会发现：

图片

呃，怎么回事，日志怎么不输出了？

是的，就是不输出了。

不输出了，就是踩到这个坑了。

不论你重启多少次，都是这样：日志不输出了，程序就像是卡着了一样。

坑在哪儿

上面这个 Demo 已经是我基于遇到的生产问题，极力简化后的版本了。

现在，这个坑也已经呈现在你眼前了。

我们一起来分析一波。

首先，我问你：真的在线上遇到这种程序“假死”的问题，你会怎么办？

早几年，歪师傅的习惯是抱着代码慢慢啃，试图从代码中找到端倪。

这样确实是可以，但是通常来说效率不高。

现在我的习惯是直接把现场 dump 下来，分析现场。

比如在这个场景下，我们直观上的感受是“卡住了”，那就 dump 一把线程，管它有枣没枣，打一杆子再说：

图片

通过 Dump 文件，可以发现线程池的线程都在 MainTest 的第 30 行上 parking ，处于等待状态：

图片

那么第 30 行是啥玩意？

图片

这行代码在干啥？

countDownLatchSub.await();

是父任务在等待子任务执行结束，运行 finally 代码，把 countDownLatchSub 的计数 countDown 到 0，才会继续执行：

图片

所以现在的现象就是子任务的 countDownLatchSub 把父任务的拦住了。

换句话说就是父任务被拦住是因为子任务的 finally 代码中的 countDownLatchSub.countDown() 方法没有被执行。

好，那么最关键的问题就来了：为什么没有执行？

你先别往下看，闭上眼睛在你的小脑瓜子里面推演一下，琢磨一下：finally 为什么没有执行？

或者再换个更加接近真实的问题：子任务为什么没有执行？

这个点，非常简单，可以说一点就破。

琢磨明白了，这个坑的原理摸摸清楚了。

...

琢磨明白了吗？你就刷刷往下看？

没明白我再给你一个信息：需要结合线程池的参数和运行原理来分析。

什么？

你说线程池的运行原理你不清楚？

请你取关好吗，你个假粉丝。

...

好，不管你“恍然大悟”了没有，歪师傅给你讲一下。

让你知道“一点就破”这四个是怎么回事儿。

首先，我们把目光聚焦在线程池这里：

图片

这个线程池核心线程数是 3，但是我们要提交 5 个任务到线程池去。

父任务哐哐哐，就把核心线程数占满了。

接下来子任务也要往这个线程池提交任务怎么办？

当然是进队列等着了。

一进队列，就完犊子。

到这里，我觉得你应该能想明白问题了。

应该给到我一个恍然大悟的表情，并配上“哦哦哦~”这样的内心 OS。

你想想，父任务这个时候干啥？

是不是等在 countDownLatchSub.await() 这里。

而 countDownLatchSub.await() 什么时候能继续执行？

是不是要所有子任务都执行 finally 后？

那么子任务现在在干啥？

是不是都在线程池里面的队列等着被执行呢？

那线程池队列里面的任务什么时候才执行？

是不是等着有空闲线程的时候？

那现在有没有空闲线程？

没有，所有的线程都去执行父任务去了。

那你想想，父任务这个时候干啥？

是不是等在 countDownLatchSub.await() 这里。

...

父任务在等子任务执行。

子任务在等线程池调度。

线程池在等父任务释放线程。

闭环了，相互等待了，家人们。

这，就是坑。

现在把坑的原理摸清楚了，我在给你说一下真实的线上场景踩到这个坑是怎么样的呢？

图片

上游发起请求到微服务 A 的接口 1，该接口需要调用微服务 B 的接口 2。

但是微服务 B 的接口 2，需要从微服务 A 接口 3 获取数据。

然而在微服务 A 内部，全局使用的是同一个自定义线程池。

更巧的是接口 1 和接口 3 内部都使用了这个自定义线程池做异步并行处理，想着是加快响应速度。

整个情况就变成了这样：

接口 1 收到请求之后，把请求转到自定义线程池中，然后等接口 2 返回。
接口 2 调用接口 3，并等待返回。
接口 3 里面把请求转到了自定义线程池中，被放入了队列。
线程池的线程都被接口 1 给占住了，没有资源去执行队列里面的接口 3 任务。
相互等待，一直僵持。

我们的 Demo 还是能比较清晰的看到父子任务之间的关系。

但是在这个微服务的场景下，在无形之间，就形成了不易察觉的父子任务关系。

所以就踩到了这个坑。

怎么避免

找到了坑的原因，解决方案就随之而出了。

父子任务不要共用一个线程池，给子任务也搞一个自定义线程池就可以了：

图片

运行起来看看日志：

图片

首先整体运行时间只需要 2s 了，达到了我想要的效果。

另外，我们观察一个具体的任务：

当前线程pool-1-thread-3,---【任务2】开始执行---当前线程pool-2-thread-1,【任务2】开始处理数据=1当前线程pool-2-thread-4,【任务2】开始处理数据=2当前线程pool-1-thread-3,---【任务2】执行完成---

日志输出符合我们前面分析的，所有子任务执行完成后，父任务才打印执行完成，且子任务在不同的线程中执行。

而使用不同的线程池，换一个高大上的说法就叫做：线程池隔离。

而且在一个项目中，公用一个线程池，也是一个埋坑的逻辑。

至少给你觉得关键的逻辑，单独分配一个线程池吧。

避免出现线程池的线程都在执行非核心逻辑了，反而重要的任务在队列里面排队去了。

这就有点不合理了。

最后，一句话总结这个问题：

如果线程池的任务之间存在父子关系，那么请不要使用同一个线程池。如果使用了同一个线程池，可能会因为子任务进了队列，导致父任务一直等待，出现假死现象。

本文链接：http://www.28at.com/showinfo-26-101274-0.html线程池遇到父子任务，有大坑，要注意！

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： React 新 Hook：UseFormStatus 使用详解

下一篇： B+树层面查询数据的全过程详解

标签：

热门焦点

直屏旗舰来了 iQOO 12和K70 Pro同台竞技

旗舰机基本上使用的都是双曲面屏幕，这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰，这次，你们等到了。据博主数码闲聊站带来的最新爆料称，Redmi下代旗舰K70 Pro和iQOO 12两款手
天猫精灵Sound Pro体验：智能音箱没有音质？来听听我的

这几年除了手机作为智能生活终端最主要的核心之外，第二个可以成为中心点的产品是什么？——是智能音箱。手机在执行命令的时候有两种操作方式，手和智能语音助手，而智能音箱只
19个 JavaScript 单行代码技巧，让你看起来像个专业人士

今天这篇文章跟大家分享18个JS单行代码，你只需花几分钟时间，即可帮助您了解一些您可能不知道的 JS 知识，如果您已经知道了，就当作复习一下，古人云，温故而知新嘛。现在，我们就开始今
一文掌握 Golang 模糊测试（Fuzz Testing）

模糊测试（Fuzz Testing）模糊测试（Fuzz Testing）是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
雅柏威士忌多款单品价格大跌，泥煤顶流也不香了？

来源 | 烈酒商业观察编 | 肖海林今年以来，威士忌市场开始出现了降温迹象，越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日，LVMH集团旗下苏格兰威士忌品牌雅柏（Ardbeg
中国家电海外掘金正当时｜出海专题

作者｜吴南南编辑｜胡展嘉运营｜陈佳慧出品｜零态LT（ID：LingTai_LT）2023年，出海市场战况空前，中国创业者在海外纷纷摩拳擦掌，以期能够把中国的商业模式、创业理念、战略打法输出海外，他们依
10天营收超1亿美元，《星铁》比《原神》差在哪？

来源：伯虎财经作者：陈平安即便你没玩过《原神》，你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天，有粉丝因为索尼在PS平台上线《原神》，怒而
ESG的面子与里子

来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起，各地高温预警不绝，但处于厄尔尼诺大“烤”之下的除了众生，还有各大企业发布的ESG报告。ESG是“环境保
华为HarmonyOS 4.0将于8月4日发布或搭载AI大模型技术

华为宣布HarmonyOS4.0将于8月4日正式发布。此前，华为已经针对开发者公布了HarmonyOS4.0，以便于开发者提前进行适配，也因此被曝光出了一些新系统的特性

线程池遇到父子任务，有大坑，要注意！

Demo

坑在哪儿

怎么避免

直屏旗舰来了 iQOO 12和K70 Pro同台竞技

天猫精灵Sound Pro体验：智能音箱没有音质？来听听我的

19个 JavaScript 单行代码技巧，让你看起来像个专业人士

一文掌握 Golang 模糊测试（Fuzz Testing）

雅柏威士忌多款单品价格大跌，泥煤顶流也不香了？

中国家电海外掘金正当时｜出海专题

10天营收超1亿美元，《星铁》比《原神》差在哪？

ESG的面子与里子

华为HarmonyOS 4.0将于8月4日发布或搭载AI大模型技术

最新推荐

猜你喜欢

热门推荐

相关资讯