.net中使用Task可以方便地编写异步程序,为了更好地理解Task及其调度机制,接下来模拟Task的实现,目的是搞清楚:
- Task是什么
- Task是如何被调度的
基本的Task模拟实现
从最基本的Task用法开始
Task.Run(Action action)
这个命令的作用是将action作为一项任务提交给调度器,调度器会安排空闲线程来处理。
我们使用Job来模拟Task
public class Job
{private readonly Action _work;public Job(Action work) => _work = work;public JobStatus Status { get; internal set; }internal protected virtual void Invoke(){Status = JobStatus.Running;_work();Status = JobStatus.Completed;}public void Start(JobScheduler? scheduler = null)=> (scheduler ?? JobScheduler.Current).QueueJob(this);public static Job Run(Action work){var job = new Job(work);job.Start();return job;}
}public enum JobStatus
{Created,Scheduled,Running,Completed
}
这里也定义了同Task一样的静态Run方法,使用方式也与Task类似
Job.Run(() => Console.WriteLine($"Job1, thread:{Thread.CurrentThread.ManagedThreadId}"));
作为对比,使用Task时的写法如下,多了await关键字,后文会讨论。
await Task.Run(()=>() => Console.WriteLine($"Task1, thread:{Thread.CurrentThread.ManagedThreadId}"));
调用Job.Run方法时,会基于给定的Action创建一个Job,然后执行job.Start(), 但Job没有立即开始执行,而是通过QueueJob方法提交给了调度器,由调度器来决定Job何时执行,在Job真正被执行时会调用其Invoke方法,此时给定的Action就会被执行了,同时会对应修改Job的状态,从Running到Completed。简单来说,.net的Task的基本工作过程与这个粗糙的Job一样,由此可见,Task/Job代表一项具有某种状态的操作。
基于线程池的调度
但Task/Job的执行依赖与调度器,这里用JobScheduler来模拟,.net默认使用基于线程池的调度策略,我们也模拟实现一个ThreadPoolJobScheduler
首先看下JobScheduler,作为抽象基类,其QueueJob方法将有具体的某个调度器(ThreadPoolJobScheduler)来实现:
public abstract class JobScheduler
{public abstract void QueueJob(Job job);public static JobScheduler Current { get; set; } = new ThreadPoolJobScheduler();
}
ThreadPoolJobScheduler实现的QueueJob如下:
public class ThreadPoolJobScheduler : JobScheduler
{public override void QueueJob(Job job){job.Status = JobStatus.Scheduled;var executionContext = ExecutionContext.Capture();ThreadPool.QueueUserWorkItem(_ => ExecutionContext.Run(executionContext!,_ => job.Invoke(), null));}
}
ThreadPoolJobScheduler会将Job提交给线程池,并将Job状态设置为Scheduled。
使用指定线程进行调度
JobScheduler的Current属性默认设置为基于线程的调度,如果有其它调度器也可以更换,但为什么要更换呢?这要从基于线程的调度的局限说起,对于一些具有较高优先级的任务,采用这个策略可能会无法满足需求,比如当线程都忙的时候,新的任务可能迟迟无法被执行。对于这种情况,.net可以通过设置TaskCreationOptions.LongRunning来解决,解析来先用自定义的调度器来解决这个问题:
public class DedicatedThreadJobScheduler : JobScheduler
{private readonly BlockingCollection<Job> _queues=new();private readonly Thread[] _threads;public DedicatedThreadJobScheduler(int threadCount){_threads=new Thread[threadCount];for(int index=0; index< threadCount; index++){_threads[index] =new Thread(Invoke);}Array.ForEach(_threads, thread=>thread.Start());void Invoke(object? state){while(true){_queues.Take().Invoke();}}}public override void QueueJob(Job job){_queues.Add(job);}
}
在启动DedicatedThreadJobScheduler时,会启动指定数量的线程,这些线程会不停地从队列中取出任务并执行。
接下来看看.net的TaskCreationOptions.LongRunning怎么用:
await Task.Factory.StartNew(LongRunningMethod, TaskCreationOptions.LongRunning);static void LongRunningMethod()
{// Simulate a long-running operationConsole.WriteLine("Long-running task started on thread {0}.", Thread.CurrentThread.ManagedThreadId);Thread.Sleep(10000);Console.WriteLine("Long-running task finished on thread {0}.", Thread.CurrentThread.ManagedThreadId);
}
任务顺序的编排
在使用Task时,经常会使用await关键字,来控制多个异步任务之间的顺序,await实际上是语法糖,在了解await之前,先来看看最基本的ContinueWith方法。
var taskA = Task.Run(() => DateTime.Now);
var taskB = taskA.ContinueWith(time => Console.WriteLine(time.Result));
await taskB;
模仿Task,我们给Job也添加ContinueWith方法。
public class Job
{private readonly Action _work;private Job? _continue;public Job(Action work) => _work = work;public JobStatus Status { get; internal set; }internal protected virtual void Invoke(){Status = JobStatus.Running;_work();Status = JobStatus.Completed;_continue?.Start();}public void Start(JobScheduler? scheduler = null)=> (scheduler ?? JobScheduler.Current).QueueJob(this);public static Job Run(Action work){var job = new Job(work);job.Start();return job;}public Job ContinueWith(Action<Job> tobeContinued){if (_continue == null){var job = new Job(() => tobeContinued(this));_continue = job;}else{_continue.ContinueWith(tobeContinued);}return this;}
}
这个ContinueWith方法会将下一个待执行的Job放在_continue,这样多个顺序执行的Job就会构成一个链表。
在当前Job的Invoke方法执行结束时,会触发下一个Job被调度。
使用示例:
Job.Run(() =>
{Thread.Sleep(1000);Console.WriteLine("11");
}).ContinueWith(_ =>
{Thread.Sleep(1000);Console.WriteLine("12");
});
进一步使用await关键字来控制
要像Task一样使用await,需要Job支持有GetAwaiter方法。任何一个类型,只要有了这个GetAwaiter方法,就可以对其使用await关键字了。
c#的Task类中可以找到GetAwaiter
public TaskAwaiter GetAwaiter();
然后TaskAwaiter继承了ICriticalNotifyCompletion接口
public readonly struct TaskAwaiter<TResult> : System.Runtime.CompilerServices.ICriticalNotifyCompletion
照猫画虎,也为Job添加一个最简单的JobAwaiter
public class Job
{...public JobAwaiter GetAwaiter() => new(this);
}
JobAwaiter的定义如下:
public struct JobAwaiter : ICriticalNotifyCompletion
{private readonly Job _job;public readonly bool IsCompleted => _job.Status == JobStatus.Completed;public JobAwaiter(Job job){_job = job;if (job.Status == JobStatus.Created){job.Start();}}public void GetResult() { }public void OnCompleted(Action continuation){_job.ContinueWith(_ => continuation());}public void UnsafeOnCompleted(Action continuation)=> OnCompleted(continuation);
}
添加了await后,前面的代码也可以这样写:
await F1();
await F2();static Job F1() => new Job(() =>
{Thread.Sleep(1000);Console.WriteLine("11");
});static Job F2() => new Job(() =>
{Thread.Sleep(1000);Console.WriteLine("12");
});
总结
回顾开头的两个问题,现在可以尝试给出答案了。
- Task是什么,Task是一种有状态的操作(Created,Scheduled,Running,Completed),是对耗时操作的抽象,就像现实中的一项任务一样,它的执行需要相对较长的时间,它也有创建(Created),安排(Scheduled),执行(Running),完成(Completed)的基本过程。任务完成当然需要拿到结果的,这里的Job比较简单,没有模拟具体的结果;
- Task是如何被调度的,默认采用基于线程池的调度,即创建好Task后,由线程池中的空闲线程执行,具体什么时候执行、由哪个线程执行,开发者是不用关心的,在具体执行过程中,
但由于.net全局线程池的局限,对于一些特殊场景无法满足时(比如需要立即执行Task),此时可以通过TaskCreationOptions更改调度行为;
另外,await是语法糖,它背后的实现是基于GetAwaiter,由其返回ICriticalNotifyCompletion接口的实现,并对ContinueWith做了封装。