线程池 详解
- 1. 线程池是什么
- 2. 标准库中的线程池
- 3. 实现线程池
- 4. 面试题
1. 线程池是什么
虽然线程的创建和销毁的开销比较小, 但还是有的, 如果频繁的创建和销毁线程, 开销还是比较大的.解决: 线程池或者协程, 本文主讲线程池.
线程池: 把线程提前创建好, 放到池子里, 后面需要用到线程直接从池子里面取, 不必从系统申请,
线程用完, 不是还给系统, 而是放到池子里面, 必备下次使用, 这样就减去了频繁创建销毁线程的开销.
举个栗子:
- 一家快递店,店里没有雇人,而是每次有业务来了,就现场找一名同学过来把快递送了,然后解雇同学。这个类比我们平时来一个任务,起一个线程进行处理的模式。
- 很快老板发现问题来了,每次招聘 + 解雇同学的成本还是非常高的。
- 老板还是很善于变通的,于是决定最多雇10个人, 并且雇了 10 个人之后不再解雇, 当一个任务来时, 老板就看如果还没有雇到 10 个(就算已经雇的人是闲着的, 只要没雇到 10 个就会雇新人), 就雇 1 个人去送快递, 否则只是把业务放到一个本本上,等这 10 个快递人员有空闲的时候去处理。
这个就是我们要带出的线程池的模式。
线程池最大的好处就是减少每次启动、销毁线程的损耗。
为什么线程放到池子里面就比从系统申请释放更快 ?
这就涉及到操作系统的用户态与内核态:
自己写的代码运行在用户态, 有些代码需要通过调用操作系统的 API, 进一步的逻辑会在内核中执行.
比如 System.out.println, 本质上需要经过 write 系统调用进入到内核中, 在内核里面会执行一些逻辑, 在内核中运行的代码称为 “内核态” 运行的代码.
创建线程本身需要内核的支持, 创建线程本身就是在操作系统内核中创建 PCB, 调用 Thread.start 也要进入内核态运行.
而把创建好的线程放到 “池子里”, 由于 “池子” 是用户态实现的, 放到池子里/从池子里取这个过程不需要涉及到内核态, 用纯粹的用户代码就能完成, 一般认为纯用户态的操作效率比经过内核态处理的操作效率更高.
为什么 ?
不是说内核处理的效率一定真的低, 而是说代码进入内核态之后运行就不可控了, 你不知道此时内核背负了多少任务, 内核什么时候执行我们的任务, 什么时候运行完就不知道了, 有时快有时慢, 所以是不可控的.
2. 标准库中的线程池
- ThreadPoolExecutor
构造方法:
public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,BlockingQueue<Runnable> workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler) {
- corePoolSize: 核心线程数 (正式员工数量)
- maximumPoolSize: 最大线程数 (正式员工 + 临时工数量)
- keepAliveTime: 闲置的线程数超过corePoolSize时, 临时工多长时间后被销毁
- unit: 时间的单位 (s, ms, us)
- workQueue: 任务队列, 通过 submit 方法将任务放到任务队列中
- threadFactory: 线程工厂, 线程是怎么创建出来的
- handler: 拒绝策略, 任务队列满了怎么办? 1. 忽略最新任务 2. 阻塞等待 3. 丢弃最老的任务 4. 抛异常…
- Executors
标准库中简化版本的线程池, 本质是针对 ThreadPoolExecutor 进行封装, 还提供一些默认参数.
- 使用 Executors.newFixedThreadPool(10) 能创建出固定包含 10 个线程的线程池.
- 返回值类型为 ExecutorService
- 通过 ExecutorService.submit 可以注册一个任务到线程池中.
ExecutorService pool = Executors.newFixedThreadPool(10);pool.submit(new Runnable() {@Overridepublic void run() {System.out.println("hello");}});
Executors 创建线程池的几种方式:
- newFixedThreadPool: 创建固定线程数的线程池
- newCachedThreadPool: 创建线程数目动态增长的线程池.
- newSingleThreadExecutor: 创建只包含单个线程的线程池.
- newScheduledThreadPool: 设定 延迟时间后执行命令,或者定期执行命令. 是进阶版的 Timer.
- newSingleThreadScheduledExecutor: 创建一个单个线程带有定时器的线程池.
- newWorkStealingPool: 创建一个任务抢占式的线程池.每个线程都有自己的任务队列, 当把自己的任务全执行完了, 就去其他线程的任务队列中 “窃取” 任务进行执行.(在日常生活中的话就是指帮助别人干一些工作)
所以加上 ThreadPoolExecutor 共有 7 种创建线程池的方法
3. 实现线程池
- 核心操作为 submit, 将任务加入线程池中
- 使用 Worker 类描述一个工作线程. 使用 Runnable 描述一个任务.
- 使用一个 BlockingQueue 组织所有的任务
- 每个 worker 线程要做的事情: 不停的从 BlockingQueue 中取任务并执行.
- 指定一下线程池中的最大线程数 maxWorkerCount; 当当前线程数超过这个最大值时, 就不再新增线程了.
class MyThreadPool {//任务直接用Runnable,不用另外创建类了//用阻塞队列来组织任务private BlockingQueue<Runnable> queue=new LinkedBlockingQueue<>();//用来描述线程的类static class Worker extends Thread{private BlockingQueue<Runnable> queue=null;//利用构造方法获取任务队列public Worker(BlockingQueue<Runnable> queue){this.queue=queue;}@Overridepublic void run() {while(true){try {//如果队列为空则阻塞Runnable runnable=queue.take();runnable.run();} catch (InterruptedException e) {throw new RuntimeException(e);}}}}//用数组来当作池存储线程List<Thread> list=new ArrayList<>();//构造方法中创建若干线程放到线程池中public MyThreadPool(int n){for(int i=0;i<n;i++){Worker worker=new Worker(this.queue);//注意不要忘记startworker.start();//加入线程池中list.add(worker);}}//提交任务public void submit(Runnable runnable) {try {this.queue.put(runnable);} catch (InterruptedException e) {throw new RuntimeException(e);}}public static void main(String[] args) {MyThreadPool pool=new MyThreadPool(10);for(int i = 1;i <= 100;i++){int n = i;//submit了100次,相当于100个任务进入了任务队列,每个线程分一些,很快就执行完了pool.submit(new Runnable() {@Overridepublic void run() {System.out.println("myThreadPool: " + n);}});}}
}
4. 面试题
有一个程序, 这个程序需要并发的完成一些任务, 如果使用线程池的话, 线程池中的线程数设置为多少合适 ?
回答:
- 我们要通过性能测试, 才能找到合适的值.
- 例如写一个服务器程序, 服务器通过线程池处理用户请求, 就可以针对这个服务器进行性能测试, 比如构造一些请求发送给服务器, 要进行性能测试的话, 请求就要构造很多, 比如 每秒发送 500/1000/2000 个, 可以根据实际业务场景构造一个合适的值
- 然后根据线程池中不同的线程数, 观察任务的处理速度, 程序持有的 CPU 占有率, 一般线程数越多, 执行速度越快, 但是 CPU 占有率越高, 需要找到一个程序速度能接收且 CPU 占有率也合理的平衡点.
为什么不让 CPU 占有率 过高 ?
对于线上服务器, 一定要留有一定的冗余以便随时应对可能的突发情况, 例如请求暴涨, 若本身就把 CPU 快占完了, 这是突然来了一波请求高峰,此时服务器可能直接就挂了.
总结: 自己实现线程池
- 能够描述任务 (Runnable)
- 能够组织任务 (BlockingQueue)
- 能够描述工作线程
- 组织线程
- 线程从任务队列中取任务执行