1 前言
在Seata 中提供了一个全局锁注解@GlobalLock,字面意思是全局锁,搜索相关文档,发现资料很少,所以分析下它的应用场景和基本原理,首先看下源码中对该注解的说明:
// 声明事务仅在单个本地RM中执行
// 但事务需要确保要更新(或选择更新)的记录不在全局事务中
// 在上述情况下,使用此注解而不是@GlobalTransaction将有助于提高性能。
// @see io.seata.spring.annotation.GlobalTransactionScanner#wrapIfNecessary(Object, String, Object)用于TM、GlobalLock和TCC模式的扫描器
// @see io.seata.spring.annotation.GlobalTransactionalInterceptor#handleGlobalLock(MethodInvocation)@GlobalLock的拦截器
// @see io.seata.spring.annotation.datasource.SeataAutoDataSourceProxyAdvice#invoke(MethodInvocation) GlobalLockLogic和AT/XA模式的拦截器
@Retention(RetentionPolicy.RUNTIME)
@Target({ElementType.METHOD,ElementType.TYPE})
@Inherited
public @interface GlobalLock {/*** 自定义全局锁重试间隔(单位:毫秒)* 您可以使用它覆盖“client.rm.lock.retryInterval”的全局配置,默认10* 注意:0或负数将不起作用(这意味着返回到全局配置)*/int lockRetryInternal() default 0;/*** 自定义全局锁重试次数* 您可以使用它覆盖“client.rm.lock.retryTimes”的全局配置,默认30* 注:负数无效(这意味着返回全局配置*/int lockRetryTimes() default -1;
}
源码注释大概意思:对于某条数据进行更新操作,如果全局事务正在进行,当某个本地事务需要更新该数据时,需要使用@GlobalLock确保其不会对全局事务正在操作的数据进行修改。
2 问题场景
我们参考下图,搭建一个测试案例:
2.1 编写代码
首先编写一个全局事务,调用订单服务下订单,扣除余额-1。
@GlobalTransactional(rollbackFor = Throwable.class, timeoutMills = 300000)public void test() throws InterruptedException {log.info("Assign Service Begin ... xid: " + RootContext.getXID() + "\n");//1.创建账户 扣款AccountTbl accountTbl = accountTblMapper.selectById(11111111);AccountTbl accountTbl1 = accountTbl.setMoney(accountTbl.getMoney() - 1);accountTblMapper.updateById(accountTbl1);//2.创建订单orderClint.insert(accountTbl.getUserId() + "", "iphone11", 1 + "");// 休眠5秒TimeUnit.SECONDS.sleep(5);int i = 5 / 0;//模拟异常}
在编写一个本地@Transactional事务,直接扣除余额-1。
@GetMapping("/GlobalLock")@Transactionalpublic Object GlobalLock() {AccountTbl accountTbl = accountTblMapper.selectById(11111111);AccountTbl accountTbl1 = accountTbl.setMoney(accountTbl.getMoney()-1);accountTblMapper.updateById(accountTbl1);return "成功执行!!!";}
2.2 测试
数据库修改余额为100 元,然后测试全局事务接口,发现异常时能正常全局回滚。
在执行全局事务的过程中,调用GlobalLock接口,修改数据,因为全局事务接口中休眠了5秒,所以需要在访问全局接口打印全局事务日志后,快速访问GlobalLock接口。
这个时候会发现,全局事务第二阶段回滚失败,并一直在重试:
原因分析: 因为在全局事务执行的过程中,一阶段会直接提交本地事务,其他本地事务可直接修改该数据,所以会导致全局事务二阶段回滚时,发现数据被修改过,认为数据已经脏了,回滚失败。
2.3 解决方案
-
手动处理:锁表,然后直接将数据修改为正常状态,但是这种比较麻烦,需要梳理脏数据的原因,也影响业务实际运行
-
提前预防:使用@GlobalLock,在执行本地事务时,去获取该数据的全局锁,如果获取不到,说明该数据正在被全局事务执行,可以进行重试获取。
在本地修改事务上加上@GlobalLock,配置重试间隔为100ms,次数为100次,说明在10S内会不断重试获取全局锁,如果该记录在全局事务中,则会失败:
@GlobalLock(lockRetryInternal = 100, lockRetryTimes = 100)@GetMapping("/GlobalLock")@Transactionalpublic Object GlobalLock() {AccountTbl accountTbl = accountTblMapper.selectById(11111111);AccountTbl accountTbl1 = accountTbl.setMoney(accountTbl.getMoney() - 1);accountTblMapper.updateById(accountTbl1);return "成功执行!!!";}
2.4 注意事项
在使用@GlobalLock注解的时候,我们需要更新之前,在查询方法中添加排它锁,比如根据ID 查询时,需要如下SQL 书写:
<select id="selectById" parameterType="integer" resultType="com.hnmqet.demo01.entity.AccountTbl">SELECT id,user_id,money FROM account_tbl WHERE id=#{id} FOR UPDATE</select>
这是因为,只有添加了 FOR UPDATE,Seata 才会进行创建重试的执行器,这样事务失败时,会释放本地锁,等待一定时间再重试。如果不添加,则会一直占有本地锁,全局事务回滚需要本地锁,则全局事务就只能等@GlobalLock事务超时失败才能拿到本地锁释放全局锁,造成@GlobalLock永远获取不到全局锁。
3 源码分析
3.1 进入拦截器
之前分析过GlobalTransactionScanner(全局事务扫描器)会扫描@GlobalLock、@GlobalTransactional注解标识的方法,并为其添加GlobalTransactionalInterceptor(全局事务拦截器)。
所以@GlobalLock标注的方法执行时,会进入到GlobalTransactionalInterceptor的invoke方法,获取@GlobalLock注解,然后进入到handleGlobalLock方法处理。
handleGlobalLock方法会创建一个GlobalLockExecutor匿名内部类,然后调用GlobalLockTemplate 的execute方法:
Object handleGlobalLock(final MethodInvocation methodInvocation, final GlobalLock globalLockAnno) throws Throwable {return this.globalLockTemplate.execute(new GlobalLockExecutor() {public Object execute() throws Throwable {return methodInvocation.proceed();}public GlobalLockConfig getGlobalLockConfig() {// 获取@GlobalLock 注解上的配置GlobalLockConfig config = new GlobalLockConfig();config.setLockRetryInternal(globalLockAnno.lockRetryInternal());config.setLockRetryTimes(globalLockAnno.lockRetryTimes());return config;}});}
GlobalLockTemplate模板类只有一个方法,处理逻辑也很简单,就是将注解配置塞入线程中,结束后清理:
public Object execute(GlobalLockExecutor executor) throws Throwable {boolean alreadyInGlobalLock = RootContext.requireGlobalLock();if (!alreadyInGlobalLock) {RootContext.bindGlobalLockFlag();}// 将注解配置塞入ThreadLocal中GlobalLockConfig myConfig = executor.getGlobalLockConfig();GlobalLockConfig previousConfig = GlobalLockConfigHolder.setAndReturnPrevious(myConfig);try {// 调用内部类的执行方法执行业务逻辑return executor.execute();} finally {//仅当这是根调用者时解除绑定。//否则,外部调用方将丢失全局锁标志if (!alreadyInGlobalLock) {RootContext.unbindGlobalLockFlag();}//如果前面的配置不是空的,我们需要将其设置回原来的配置//这样外部逻辑仍然可以使用它们的配置if (previousConfig != null) {GlobalLockConfigHolder.setAndReturnPrevious(previousConfig);} else {GlobalLockConfigHolder.remove();}}}
3.2 进入数据源代理
在执行业务逻辑时,因为配置了数据源代理,SQL 操作都会进入到代理数据源中,大概流程为PreparedStatementProxy.execute=>ExecuteTemplate.execute=>Executor.executor。
因为我们根据ID 查询数据时加了 FOR UPDATE(排它锁),所以执行器为SelectForUpdateExecutor,在这个执行方法中,就会进行全局锁的获取,这个时候会遇到以下几种情况:
-
获取到全局锁,则正常执行,因为加了排它锁,其他事务都会被隔离,得等待当前事务执行完成
-
被全局事务占有全局锁和排它锁,则会等待全局一阶段事务提交释放本地锁,GlobalLock获取到本地锁后,等待全局事务提交,释放全局锁后,再执行,
-
如果全局失败,回滚时需要排它锁,这个时候,GlobalLock因为没有获取到全局锁抛出异常,会在异常中进行事务回滚,休眠一定时间,这个时候会让出排它锁,全局获取到排它锁后再进行全局回滚成功释放全局锁,GlobalLock在重试过程中,获取到全局锁,则成功执行,做到了很好的事务隔离性。
@Overridepublic T doExecute(Object... args) throws Throwable {// 1. 获取数据库连接Connection conn = statementProxy.getConnection();// 2. 获取数据库元数据DatabaseMetaData dbmd = conn.getMetaData();T rs;Savepoint sp = null;boolean originalAutoCommit = conn.getAutoCommit();try {if (originalAutoCommit) {/** 为了在全局锁检查期间保持本地数据库锁* 如果原始自动提交为true,则首先将自动提交值设置为false*/conn.setAutoCommit(false);} else if (dbmd.supportsSavepoints()) {/** 为了在全局锁冲突时释放本地数据库锁* 如果原始自动提交为false,则创建一个保存点,然后使用此处的保存点释放db* 如有必要,在全局锁定检查期间锁定*/sp = conn.setSavepoint();} else {throw new SQLException("not support savepoint. please check your db version");}// 3. 创建一个锁重试控制器LockRetryController lockRetryController = new LockRetryController();ArrayList<List<Object>> paramAppenderList = new ArrayList<>();// 4. SELECT id FROM account_tbl WHERE id = ? FOR UPDATE// String selectPKSQL = buildSelectSQL(paramAppenderList);while (true) {try {// #870// rs = statementCallback.execute(statementProxy.getTargetStatement(), args);// 尝试获取选定行的全局锁// 获取主键列及值TableRecords selectPKRows = buildTableRecords(getTableMeta(), selectPKSQL, paramAppenderList);// 构建全局锁Key :account_tbl:11111111String lockKeys = buildLockKey(selectPKRows);if (StringUtils.isNullOrEmpty(lockKeys)) {break;}if (RootContext.inGlobalTransaction() || RootContext.requireGlobalLock()) {// 在@GlobalTransactional或@GlobalLock下做同样的事情// 这里只检查全局锁statementProxy.getConnectionProxy().checkLock(lockKeys);} else {throw new RuntimeException("Unknown situation!");}break;} catch (LockConflictException lce) {// 如锁被占用,会抛出锁冲突异常 :LockConflictException// 直接回滚,释放本地锁if (sp != null) {conn.rollback(sp);} else {conn.rollback();}// 触发重试,线程睡眠设置的时间,超过重试此时,则会抛出LockWaitTimeoutException 异常lockRetryController.sleep(lce);}}} finally {if (sp != null) {try {if (!JdbcConstants.ORACLE.equalsIgnoreCase(getDbType())) {conn.releaseSavepoint(sp);}} catch (SQLException e) {LOGGER.error("{} release save point error.", getDbType(), e);}}if (originalAutoCommit) {conn.setAutoCommit(true);}}return rs;}
3.3 更新数据
在通过 FOR UPDATE 查询到数据后,再更新当前数据,因为查询和修改在一个@Transactional方法里,所以他们是一个事务,在查询的时候添加了排它锁,并且获取到了全局锁,才会执行到更新方法。
FOR UPDATE 获取到全局锁后,进入到业务的更新操作,这里和一阶段执行本地事务完全一致,之前分析过,就不赘述了。