Java面试必备加分八股文,美团动态线程池思路之web容器篇

大家好,这篇文章我们来介绍下动态线程池框架(DynamicTp)的adapter模块,上篇文章也大概介绍过了,该模块主要是用来适配一些第三方组件的线程池管理,让第三方组件内置的线程池也能享受到动态参数调整,监控告警这些增强功能。


DynamicTp项目地址

目前500多star,感谢你的star,欢迎pr,业务之余给开源贡献一份力量

gitee地址https://gitee.com/yanhom/dynamic-tp

github地址https://github.com/lyh200/dynamic-tp


系列文章

美团动态线程池实践思路,开源了:https://juejin.cn/post/7063408526894301192

动态线程池框架(DynamicTp)之监控及源码解析篇:https://juejin.cn/post/7069581808932749348


adapter已接入组件

adapter模块目前已经接入了SpringBoot内置的三大WebServer(Tomcat、Jetty、Undertow)的线程池管理,实现层面也是和核心模块做了解耦,利用spring的事件机制进行通知监听处理。

可以看出有两个监听器

  1. 当监听到配置中心配置变更时,在更新我们项目内部线程池后会发布一个RefreshEvent事件,DtpWebRefreshListener监听到该事件后会去更新对应WebServer的线程池参数。

  2. 同样监控告警也是如此,在DtpMonitor中执行监控任务时会发布CollectEvent事件,DtpWebCollectListener监听到该事件后会去采集相应WebServer的线程池指标数据。

要想去管理第三方组件的线程池,首先肯定要对这些组件有一定的熟悉度,了解整个请求的一个处理过程,找到对应处理请求的线程池,这些线程池不一定是JUC包下的ThreadPoolExecutor类,也可能是组件自己实现的线程池,但是基本原理都差不多。

Tomcat、Jetty、Undertow这三个都是这样,他们并没有直接使用JUC提供的线程池实现,而是自己实现了一套,或者扩展了JUC的实现;翻源码找到相应的线程池后,然后看有没有暴露public方法供我们调用获取,如果没有就需要考虑通过反射来拿了。


Tomcat内部线程池的实现

  • Tomcat内部线程池没有直接使用JUC下的ThreadPoolExecutor,而是选择继承JUC下的Executor体系类,然后重写execute()等方法,不同版本有差异。

1.继承JUC原生ThreadPoolExecutor(9.0.50版本及以下),并覆写了一些方法,主要execute()和afterExecute()

2.继承JUC的AbstractExecutorService(9.0.51版本及以上),代码基本是拷贝JUC的ThreadPoolExecutor,也相应的微调了execute()方法

注意Tomcat实现的线程池类名称也叫ThreadPoolExecutor,名字跟JUC下的是一样的,Tomcat的ThreadPoolExecutor类execute()方法如下:

public void execute(Runnable command, long timeout, TimeUnit unit) {
        submittedCount.incrementAndGet();
        try {
            super.execute(command);
        } catch (RejectedExecutionException rx) {
            if (super.getQueue() instanceof TaskQueue) {
                final TaskQueue queue = (TaskQueue)super.getQueue();
                try {
                    if (!queue.force(command, timeout, unit)) {
                        submittedCount.decrementAndGet();
                        throw new RejectedExecutionException(sm.getString("threadPoolExecutor.queueFull"));
                    }
                } catch (InterruptedException x) {
                    submittedCount.decrementAndGet();
                    throw new RejectedExecutionException(x);
                }
            } else {
                submittedCount.decrementAndGet();
                throw rx;
            }

        }
    }

可以看出他是先调用父类的execute()方法,然后捕获RejectedExecutionException异常,再去判断如果任务队列类型是TaskQueue,则尝试将任务添加到任务队列中,如果添加失败,证明队列已满,然后再执行拒绝策略,此处submittedCount是一个原子变量,记录提交到此线程池但未执行完成的任务数(主要在下面要提到的TaskQueue队列的offer()方法用),为什么要这样设计呢?继续往下看!

  • Tomcat定义了阻塞队列TaskQueue继承自LinkedBlockingQueue,该队列主要重写了offer()方法。
 @Override
    public boolean offer(Runnable o) {
        //we can't do any checks
        if (parent==null) return super.offer(o);
        //we are maxed out on threads, simply queue the object
        if (parent.getPoolSize() == parent.getMaximumPoolSize()) return super.offer(o);
        //we have idle threads, just add it to the queue
        if (parent.getSubmittedCount()<=(parent.getPoolSize())) return super.offer(o);
        //if we have less threads than maximum force creation of a new thread
        if (parent.getPoolSize()<parent.getMaximumPoolSize()) return false;
        //if we reached here, we need to add it to the queue
        return super.offer(o);
    }

可以看到他在入队之前做了几个判断,这里的parent就是所属的线程池对象

1.如果parent为null,直接调用父类offer方法入队

2.如果当前线程数等于最大线程数,则直接调用父类offer()方法入队

3.如果当前未执行的任务数量小于等于当前线程数,仔细思考下,是不是说明有空闲的线程呢,那么直接调用父类offer()入队后就马上有线程去执行它

4.如果当前线程数小于最大线程数量,则直接返回false,然后回到JUC线程池的执行流程回想下,是不是就去添加新线程去执行任务了呢

5.其他情况都直接入队

  • 因为Tomcat线程池主要是来做IO任务的,做这一切的目的主要也是为了以最小代价的改动更好的支持IO密集型的场景,JUC自带的线程池主要是适合于CPU密集型的场景,可以回想一下JUC原生线程池ThreadPoolExecutor#execute()方法的执行流程

1.判断如果当前线程数小于核心线程池,则新建一个线程来处理提交的任务

2.如果当前线程数大于核心线程数且队列没满,则将任务放入任务队列等待执行

3.如果当前当前线程池数大于核心线程池,小于最大线程数,且任务队列已满,则创建新的线程执行提交的任务

4.如果当前线程数等于最大线程数,且队列已满,则拒绝该任务

可以看出当当前线程数大于核心线程数时,JUC原生线程池首先是把任务放到队列里等待执行,而不是先创建线程执行。

如果Tomcat接收的请求数量大于核心线程数,请求就会被放到队列中,等待核心线程处理,这样会降低请求的总体处理速度,所以Tomcat并没有使用JUC原生线程池,利用TaskQueue的offer()方法巧妙的修改了JUC线程池的执行流程,改写后Tomcat线程池执行流程如下:

1.判断如果当前线程数小于核心线程池,则新建一个线程来处理提交的任务

2.如果当前当前线程池数大于核心线程池,小于最大线程数,则创建新的线程执行提交的任务

3.如果当前线程数等于最大线程数,则将任务放入任务队列等待执行

4.如果队列已满,则执行拒绝策略

  • Tomcat核心线程池有对应的获取方法,获取方式如下
    public Executor doGetTp(WebServer webServer) {
        TomcatWebServer tomcatWebServer = (TomcatWebServer) webServer;
        return tomcatWebServer.getTomcat().getConnector().getProtocolHandler().getExecutor();
    }
  • 想要动态调整Tomcat线程池的线程参数,可以在引入DynamicTp依赖后,在配置文件中添加以下配置就行,参数名称也是和SpringBoot提供的Properties配置类参数相同,配置文件完整示例看项目readme介绍
spring:
  dynamic:
    tp:
      // 其他配置项
      tomcatTp:       # tomcat web server线程池配置
        minSpare: 100   # 核心线程数
        max: 400        # 最大线程数

Tomcat线程池就介绍到这里吧,通过以上的一些介绍想必大家对Tomcat线程池执行任务的流程都很清楚了吧。


Jetty内部线程池的实现

  • Jetty内部线程池,定义了一个继承自Executor的ThreadPool顶级接口,实现类有以下几个

  • 内部主要使用QueuedThreadPool这个实现类,该线程池执行流程就不在详细解读了,感兴趣的可以自己去看源码,核心思想都差不多,围绕核心线程数、最大线程数、任务队列三个参数入手,跟Tocmat比对着来看,其实也挺简单的。
public void execute(Runnable job)
    {
        // Determine if we need to start a thread, use and idle thread or just queue this job
        int startThread;
        while (true)
        {
            // Get the atomic counts
            long counts = _counts.get();

            // Get the number of threads started (might not yet be running)
            int threads = AtomicBiInteger.getHi(counts);
            if (threads == Integer.MIN_VALUE)
                throw new RejectedExecutionException(job.toString());

            // Get the number of truly idle threads. This count is reduced by the
            // job queue size so that any threads that are idle but are about to take
            // a job from the queue are not counted.
            int idle = AtomicBiInteger.getLo(counts);

            // Start a thread if we have insufficient idle threads to meet demand
            // and we are not at max threads.
            startThread = (idle <= 0 && threads < _maxThreads) ? 1 : 0;

            // The job will be run by an idle thread when available
            if (!_counts.compareAndSet(counts, threads + startThread, idle + startThread - 1))
                continue;

            break;
        }

        if (!_jobs.offer(job))
        {
            // reverse our changes to _counts.
            if (addCounts(-startThread, 1 - startThread))
                LOG.warn("{} rejected {}", this, job);
            throw new RejectedExecutionException(job.toString());
        }

        if (LOG.isDebugEnabled())
            LOG.debug("queue {} startThread={}", job, startThread);

        // Start a thread if one was needed
        while (startThread-- > 0)
            startThread();
    }
  • Jetty线程池有提供public的获取方法,获取方式如下
    public Executor doGetTp(WebServer webServer) {
        JettyWebServer jettyWebServer = (JettyWebServer) webServer;
        return jettyWebServer.getServer().getThreadPool();
    }
  • 想要动态调整Jetty线程池的线程参数,可以在引入DynamicTp依赖后,在配置文件中添加以下配置就行,参数名称也是和SpringBoot提供的Properties配置类参数相同,配置文件完整示例看项目readme介绍
spring:
  dynamic:
    tp:
      // 其他配置项
      jettyTp:       # jetty web server线程池配置
        min: 100     # 核心线程数
        max: 400     # 最大线程数

Undertow内部线程池的实现

  • Undertow因为其性能彪悍,轻量,现在用的还是挺多的,wildfly(前身Jboss)从8开始内部默认的WebServer用Undertow了,之前是Tomcat吧。了解Undertow的小伙伴应该知道,他底层是基于XNIO框架(3.X之前)来做的,这也是Jboss开发的一款基于java nio的优秀网络框架。但Undertow宣布从3.0开始底层网络框架要切换成Netty了,官方给的原因是说起网络编程,Netty已经是事实上标准,用Netty的好处远大于XNIO能提供的,所以让我们期待3.0的发布吧,只可惜三年前就宣布了,至今也没动静,不知道是夭折了还是咋的,说实话,改动也挺大的,看啥时候发布吧,以下的介绍是基于Undertow 2.x版本来的

  • Undertow内部是定义了一个叫TaskPool的线程池顶级接口,该接口有如图所示的几个实现。其实这几个实现类都是采用组合的方式,内部都维护一个JUC的Executor体系类或者维护Jboss提供的EnhancedQueueExecutor类(也继承JUC ExecutorService类),执行流程可以自己去分析

  • 具体的创建代码如下,根据外部是否传入,如果有传入则用外部传入的类,如果没有,根据参数设置内部创建一个,具体是用JUC的ThreadPoolExecutor还是Jboss的EnhancedQueueExecutor,根据配置参数选择

  • Undertow线程池没有提供public的获取方法,所以通过反射来获取,获取方式如下
    public Executor doGetTp(WebServer webServer) {

        UndertowWebServer undertowWebServer = (UndertowWebServer) webServer;
        Field undertowField = ReflectionUtils.findField(UndertowWebServer.class, "undertow");
        if (Objects.isNull(undertowField)) {
            return null;
        }
        ReflectionUtils.makeAccessible(undertowField);
        Undertow undertow = (Undertow) ReflectionUtils.getField(undertowField, undertowWebServer);
        if (Objects.isNull(undertow)) {
            return null;
        }
        return undertow.getWorker();
    }
  • 想要动态调整Undertow线程池的线程参数,可以在引入DynamicTp依赖后,在配置文件中添加以下配置就行,配置文件完整示例看项目readme介绍
spring:
  dynamic:
    tp:
      // 其他配置项
      undertowTp:   # undertow web server线程池配置
        coreWorkerThreads: 100  # worker核心线程数
        maxWorkerThreads: 400   # worker最大线程数
        workerKeepAlive: 60     # 空闲线程超时时间

总结

以上介绍了Tomcat、Jetty、Undertow三大WebServer内置线程池的一些情况,重点介绍了Tomcat的,篇幅有限,其他两个感兴趣可以自己分析,原理都差不多。同时也介绍了基于DynamicTp怎么动态调整线程池的参数,当我们做WebServer性能调优时,能动态调整参数真的是非常好用的。

再次欢迎大家使用DynamicTp框架,一起完善项目。

下篇文章打算分享一个DynamicTp使用过程中因为Tomcat版本不一致导致的监控线程halt住的奇葩问题,通过一个问题来掌握ScheduledExecutorService的原理,欢迎大家持续关注。


联系我

欢迎加我微信或者关注公众号交流,一起变强!

公众号:CodeFox

微信:yanhom1314

#Java##学习路径#
全部评论

相关推荐

#面经##饿了么#暑期实习,4.16一面,面完即挂项目动态线程池项目主要的内容做了什么为什么需要动态修改线程池的参数,业务场景是什么动态修改主要修改了哪些参数Jdk原生的threadpool有哪几种实现coresize和maxsize的含义什么时候有效线程突破coresize怎么实现修改参数,Set方法修改之后会立马生效吗?executor的set方法好像修改之后不会立马起作用?不同的业务需求不同,比如有些适合singleThreadPool&nbsp;有些需要fixedThreadPool,&nbsp;这个组件怎么来适应他们的情况Java线程和操作系统线程是什么关系,为什么是一对一的关系如果是一对一的关系,那每次使用线程都需要去操作系统那里创建不是很费时间吗线程的生命周期调用start()方法后,jvm做了什么Java怎么解决并发问题Synchronized的实现原理,修时普通私有方法和静态方法有什么区别锁升级怎么实现(偏向锁、轻量级锁和重量级锁)动态线程池项目具体的应用场景最大线程数量怎么设置,根据不同的任务场景(计算密集型)监控线程池的状态包括哪些?&nbsp;哪些指标可以用来判断线程池的运行状态是否良好怎么计算任务等待的时间定时打印功能是怎么实现的,轮询?调用哪个方法?介绍第二个项目,主要做了哪些功能订单类设计到哪些表,表怎么设计怎么进行防重复提交ID是怎么做的讲一下mvc, 为什么要划分为三层 项目中哪些地方利用到IOC控制层、业务层和持久层哪一个需要用单例模式这个项目的核心挑战答了并发访问,并发访问跟前面防重复提交不是矛盾了吗,怎么解决了解Java过数据结构吗ArrayList和LinkedList的区别,实现堆栈用哪个效率比较高反问,业务营销部门,券和券的核销
点赞 评论 收藏
分享
04-24 00:04
中南大学 Java
更新:饿了么给我流程全结束了,这次面评到底有多差4.2#饿了么#自我介绍意料之外的闲聊环节:1.为什么没有考虑继续深造(提到他面了十几个同学,只有我一个是本科)2.职业规划3.对后面实习还是就业的城市,公司,业务有什么了解4.没有考虑去国企吗项目环节:1.项目是在校期间的练手项目吗,是一个人完成的吗2.这个项目是什么时候开始做的,有什么渠道进行这方面的学习3.介绍项目+最有挑战性的点(那肯定是秒杀环节)(以下均为秒杀)4.redis里用的什么数据结构(听成存的哪些数据了)5.问我如果用的map(但这键值对就是键值对,没搞懂),怎么进行优惠券数量扣减6.原子性操作会不会出现aba问题(当时已经有点红了,没反应过来)7.上分布式锁是怎么上的8.对一个缓存key上锁会不会导致效率变低,用户体验怎么办当时忘了redis单线程的事情,也没有想到限流的问题,然后我就开始抽风了9.怎么保证redis和mysql的数据是一致的10.如果mysql回滚怎么办,业务逻辑的回滚,优惠券数量还能不能退回11.本地事务效率低,有没有其他保证一致的办法12.为了防止redis挂掉,用哪种持久化方式开放性问题:基于redis给我出了一个场景题排行榜,类似微博,关键点:1.参与元素非常多,有十几万&nbsp;2.榜单实时刷新,高并发场景&nbsp;3.&nbsp;在0点有开榜的动作然后我大概从redis的zset层面简单回答了问题,被吐槽没有考虑其他方面的问题(包括前端或者其他中间件)反问:1.排行榜怎么设计:解法很多,要关心高并发、实时、大数据样,然后自己想就行(666)2.业务(我说的过程中,差点给我打断了)3.建议:要多学习,不能只在网上学习,要体系化的思考和学习(我请问去哪体系化)依旧秒挂/.
查看20道真题和解析
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客企业服务