前言
老黄前段时间遇到了一个数据清洗的需求,其实就是每天凌晨把昨天的数据清洗一遍,归归类。
这是一个比较典型的定时任务的处理场景。
定时任务可以说就一把利器,几乎每个公司都离不开,它的应用场景也不在少数,比如:
生成前一天的统计数据
每隔几天清理一次日志
定期处理失效的单据
...
对于定时任务,常见的解决方案有下面几种
quartz.net
hangfire
xxl-job
saturn
...
对于1和2,无疑是要投入学习成本的,要习惯它们的用法,不好的地方就是不能让开发人员集中精力去处理业务上面的内容。
对于3和4,这两个算是分布式任务调度的平台,很好的与业务解耦了,可以通过HTTP的接口来触发任务的执行。
3和4想在生产环境高可用,离不开集群部署,在资源紧张的时候其实想部署这么一套东西其实还是挺不容易的。
对于上面的几种方案,老黄都没有采用,取而代之的是k8s的cronjob。
为什么选择cronjob
上面提到的几种方案,也已经表达了不选用的原因了,无非就是成本和复杂度,下面来讲讲选择k8s的cronjob的原因吧。
首先k8s的cronjob本身就可以当作是一个任务调度的平台了,调度的时候会创建一个POD来执行我们的任务。
其次的话,没有复杂的依赖关系,只要编写一个简单的控制台程序就好了。
还有一个是成本问题,老黄公司用的k8s是serverless的,没有实实在在的服务器资源,交付的只是镜像,执行这些定时任务,都是按时间计费的。
1C2G的配置只要0.00006126块钱一秒,假设你的任务执行要3分钟,那这一次任务只要1毛钱就可以了。
选择什么配置,最后要看的还是你业务的需要。
说了这么多,来个伪例子吧。
简单例子
要先准备一下我们的任务内容,其实就是写个简单的控制台程序。
using System;internal class Program
{private static void Main(string[] args){// 写这个定时任务要处理的内容Console.WriteLine($"Hello World! {a}");}
}
这里有一个要注意的是,不要出现 Console.ReadLine
, Console.ReadKey
之类的东西,不然是run不起来的。
Dockerfile就不写了,只要能把这个控制台程序打包成一个镜像,可以run起来就可以了。
后面就是写cronjob的配置了。
apiVersion: batch/v1beta1
kind: CronJob
metadata:labels:etl: diagnosisname: xyzxyznamespace: prod
spec:# 禁止并发运行concurrencyPolicy: ForbidfailedJobsHistoryLimit: 1jobTemplate:metadata: {}spec:# 指定存活时长activeDeadlineSeconds: 1200# 指定失败时可以重试2次backoffLimit: 2completions: 1parallelism: 1template:spec:containers:- env:- name: DOTNET_RUNNING_IN_CONTAINERvalue: 'true'- name: TZvalue: Asia/Shanghaiimage: >-xxxxx:5000/xxxxx:versionimagePullPolicy: IfNotPresentname: xyzxyzports:- containerPort: 80protocol: TCPresources:# 这里只用了0.25C 0.5Grequests:cpu: 250mmemory: 512MiterminationMessagePath: /dev/termination-logterminationMessagePolicy: FilednsPolicy: ClusterFirstrestartPolicy: NeverschedulerName: default-scheduler# cron表达式,schedule: 22 4 1/1 * ?# 成功job历史显示个数successfulJobsHistoryLimit: 1
里面的配置其实还是挺多的,对老黄的场景来说,上面的配置足够了,对更多的配置,可以参考k8s的官网。
执行kubectl apply -f xxx.yml
就可以创建定时任务了,后面就会自动调度执行对应的任务了。
这里就不执行了,直接拿线上正在跑的三个定时任务给大家参考一下。
点详情可以看到具体的执行情况。
写在最后
定时任务这个问题的答案有很多种解法,可以选择适合公司的最优解。
因为每种解法都有它好或者不好的地方,k8s的cronjob也是有它不足的地方的,最为明显的就是cron表达式第1位是分钟而不是秒,也就是说最小粒度只到分钟,如果你的应用需要到秒的,可能就没办法支持到了。