闲鱼如何保障交易链路质量

简介: 闲鱼交易质量自动化

背景

闲鱼作为一款垂直交易社区APP,拥有复杂多样的业务场景:涉及c2c、回收寄卖、租房租赁、见面交易、验货担保等,复杂多变的交易模式。比如验货流程:
  • 涉及39个状态机节点
  • 横跨10+应用系统
  • 涉及6个业务部门的合作
  • 涉及接口几十个

需要保证每个接口、每个场景切实可行,稍微有一点点问题,就会涉及到人民币的味道,实际工作中,我们遇到各种各样的问题,比较棘手的问题如下:


问题

业务先赢的快速迭代模式下,全靠人工主力进行测试验证,测完新功能,还得回归老功能,一个小需求也须要好几个人日,版本PTM也要回归好几遍,ROI并不乐观,以下2个问题比较突出:

  1. 交易业务强依赖中台,沟通成本高,跨团队协作难,迭代效率低,测试环境下如何自洽?
  2. 复杂多样交易模式下,如何支撑需求稳步迭代上线以及日常回归验证?



测试策略-自动化

闲鱼质量基建正在快马加鞭进行中,针对闲鱼多样的交易模式,全靠人力是不可行的,累不说,改动、风险漏评估也时有发生。对此,我们根据接口->链路的策略,探索对比了几个不同的方案,在保证每个接口OK的基础上,保障全链路。
交易自动化策略.png

接口层

对于每一个大型应用程序来说,接口数量会不断增加,代码变更频率越来越大、系统不定期重构,这个接口的质量怎么来保障?传统编写脚本来进行的方式,投入的人力、时间成本过大,在实际的测试过程中我们探索了一些接口测试的新想法。目前业界公认的有效方式是基于引流回放的自动化测试,实现方案业内众说纷纭各有其词,但万变不离其中,引用下面这段总结,简单明了

一种是黑盒测试思路,它在线上接口请求时采集线上流量(主要是请求参数和结果),然后使用和线上环境相同的环境(数据库共用等)下用采集到的流量重新触发请求,然后断言被请求的返回值是不是和录制时的一致。这种方法比较适合对Get类型的接口进行测试,而对于写操作的请求容易造成数据污染,再加上所采集流量的数据状态(数据时效性)、环境依赖性(各种中间件、接口内部请求的RPC调用)等因素,所以这种测试方式具有一些局限性,不能满足实际测试场景中复杂的需求。


另一种思路相对白盒,主要是通过智能化的Mock手段,流量采集时采集代码运行过程中所依赖的外部中间件或者RPC调用的返回结果,当流量回放时,能够Mock本机程序对外的依赖中有可能产生变化的内容,使测试更关注本地接口的代码逻辑。

阿里集团内部,基于流量回放的思想,主要实现了2种不同的流量录制回放方案,一种是基于doom的天启/暴雪,一种是基于JVM-Sandbox的凤凰,两种实现都借力于JVM AOP。

  • 天启/暴雪

    天启/暴雪,其底层采用的是doom进行流量录制,其原理如下
    doom框架图.png
    doom原理图
    主要流程是:

  1. 通过Java agent挂在JVM中的client以ASM的AOP方式采集主调用(采集或回放时的入口方法)的入参、返回值、子调用(应用执行过程中的一次方法调用,采集机器会采集该方法的入参和返回值用于回放时执行到该方法进行mock)的入参和返回值,然后将采集到的数据上传至server (离线模式);
  2. 回放时,client收到接口回放请求后,会执行该接口的本地逻辑,对于子调用则用采集的入参和结果进行mock;
  3. 将采集的流量和回放的结果数据进行对比。

doom方式,业务应用系统需要引入Jar包,修改启动类,修改JVM挂载agent,有部分的业务侵入性。

  - 凤凰凤凰,也是采用JVM AOP实现的流量录制方案,理念和doom差不多,凤凰整体架构底层基于JVM-Sandbox(阿里开源的一款 JVM 平台非侵入式运行期 AOP 解决方案,通过字节码增强实现方法级别的AOP功能)输出模块原子能力。录制时,记录了发生调用的方法,入参、返回值和调用发生的顺序,以链式数据结构存储,回放时进行接口逻辑执行和子调用mock。<br />![凤凰录制回放.png](https://gw.alicdn.com/imgextra/i2/O1CN01m49rqS1rsh7EMIakW_!!6000000005687-2-tps-442-331.png)<br />凤凰录制回放<br />凤凰无需代码侵入修改,不需要修改应用启动参数,相对来说,对业务代码影响小,但是有应用结构要求。考虑成本和风险,以及我们的应用结构,闲鱼采用基于Sandbox的凤凰流量录制回放进行保障,变更上线流程卡点。<br />研发过程中,也会遇到各种各样的流量回放问题,比如用例过期,需要人工清楚重新录制。我们现在是采用定时任务自动清除重新录制的方式解决。<br />下面是我们的一个场景例子:<br />![image.png](https://gw.alicdn.com/imgextra/i3/O1CN01bR7Yqe1qfaA29uZCx_!!6000000005523-2-tps-1318-418.png)<br />​<br />

链路层

在基于流量录制、回放比对的接口测试过程中,我们发现这种机制对于单应用的质量保障比较实用,但是对于跨应用的链路验证、核心写操作、外调用,以及系统重构类、方案改造等大需求就有些不足,链路级的解决解决方案接踵而至。

  • Thub + 微服务

测试环境下,对于全链路上下游的强依赖,措施之一是开发测试服务化能力,建立自洽能力,测试环境下解藕对于外界诸如交易中台、菜鸟裹裹的依赖,测试环境能进行全链路闭环。
落地首要任务是梳理业务全链路节点:

  - 主干链路上的每一个MTOP接口,以及接口的上下游依赖- 内部应用、中台应用、外部商家的依赖- 数据流以及TDDL梳理

image.png
业务梳理完整,进行测试服务化接口开发。下面是我们截取的一部分链路case:
image.png
同时,诸如测试环境由于依赖方测试环境不稳定block测试的情况,我们提供测试服务化接口进行封装,暴露成下单、验货等服务化能力内置于闲鱼质量平台,用于开发、测试在研发过程中使用。

  • 天算平台

天算平台,利用影子库,全链路压测的模式,线上业务数据和测试数据隔离,测试库copy线上库一部分数据。主要实现的方式是将线上的场景进行固化仿真,全链路执行,并且在执行的过程中进行所有数据变更的比对,用户可以选择任何代码版本的基线和变更版本进行对比。
大致流程
image.png
天算能力基本能满足闲鱼的交易链路,闲鱼建立了主链路相关影子库,影子链路正在调试中,用于交易服务端的全链路巡检。 同时,影子链路有诸如业务变更导致影子数据过期的问题,这个方案则主要是用于业务比较稳定的业务,新业务或者不断迭代更新的业务并未all in这个方案。

总结

综上,目前闲鱼交易,接口层用基于jvm-sandbox的流量录制方案, 日常巡检利用影子链路,研发过程自测、链路自动化用业务编排服务化能力。

doomjvm-sandboxThub+微服务影子链路
Release是(github已开源)
代码侵入
应用要求
稳定性一般一般一般一般
全链路测试

展望

在基建完善的基础上,我们将继续探索flutter以及服务端的全端智能化方向的测试解决方案,希望让更多技术小二从重复劳动中释放出来,从治、防、控,三层质量网,保障闲鱼交易,让用户在闲鱼放心的卖卖卖、买买买。期待和大家一起交流业内的不同测试方案!同时感谢doom、sandbox、凤凰、天启、暴雪、全链路压测、Thub等团队提供的能力支持!

原文链接
本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/513003.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DevOps发布策略简介

简介&#xff1a; DevOps追求更短的迭代周期、更高频的发布。但发布的次数越多&#xff0c;引入故障的可能性就越大。更多的故障将会降低服务的可用性&#xff0c;进而影响到客户体验。所以&#xff0c;为了保证服务质量&#xff0c;守好发布这个最后一道关&#xff0c;阿里逐步…

存储引擎 boltdb 的设计奥秘?

作者 | 奇伢来源 | 奇伢云存储etcd 的存储etcd v3 是使用的持久化存储来存储它的 kv 数据&#xff0c;etcd 存储的是非常核心的元数据信息&#xff0c;所以最重要的是稳定。使用的是 boltdb 。下面说道说道这个 boltdb 。boltdb 是什么&#xff1f;boltdb 是一个非常出名的存储…

提升你的职场竞争力——“低代码开发师”来了!

简介&#xff1a; 最近&#xff0c;钉钉发布了低代码开发师能力图谱&#xff0c;引发业界的广泛关注 。现在低代码开发师&#xff08;初级&#xff09;认证已经启动。 最近&#xff0c;钉钉发布了低代码开发师能力图谱&#xff0c;引发业界的广泛关注 。 所谓的低代码开发其实…

mapreduce复制连接的代码_我的 Hive 为什么跑不起来/跑得慢?看看是不是少了这几行代码?...

《饮食男女》开头说&#xff1a;“人生不能像做菜&#xff0c;把所有的料都准备好了才下锅。”但做大数据挖掘不一样&#xff0c;MapReduce 不同于人生&#xff0c;一定要把准备工作做好了&#xff0c;才能顺利运行后面的步骤。如果你的 HiveQL 代码没毛病&#xff0c;却一运行…

数字化转型的路上,手握一张地图,但路还得自己走

简介&#xff1a; 本文作者来自于中国人寿保险股份有限公司研发中心&#xff0c;对企业数字化转型、云原生实践有比较资深的经验。以下内容整理自作者对最新出版的《阿里云云原生架构实践》的读后感。 作者&#xff5c;肖晟 ​ 本文作者来自于中国人寿保险股份有限公司研发中…

tp 数据库查询排序_怎么进行数据库分库分表?

一&#xff0c;数据切分关系型数据库本身比较容易成为系统瓶颈&#xff0c;单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后&#xff0c;由于查询维度较多&#xff0c;即使添加从库、优化索引&#xff0c;做很多操作时性能仍下降严重。此时就要考虑对…

流利说统一可观察性平台实践

简介&#xff1a; 流利说利用日志服务SLS构建统一可观察性平台最佳实践 在线教育行业现状 随着 90 年代互联网的引入&#xff0c;在线教育产品也依托于互联网诞生。随着互联网技术的发展&#xff0c;在线教育产品也开 始了出现新的模式。在线教育从最初单纯的文字形式&#xf…

“CSDN 2021年度IT技术影响力之星评选”正式开启报名!

2021年&#xff0c;数字化转型正磅礴兴起&#xff0c;大批传统企业正在拥抱数字化&#xff0c;云计算、大数据、AI、5G应用能力正在变成企业的核心竞争力&#xff1b;核心技术正在崛起&#xff0c;在操作系统、数据库&#xff0c;依靠开源的力量&#xff0c;众多开发者背后的行…

java log4j logback jcl_Java 日志二三事

前言Java 拥有功能和性能都非常强大的日志库&#xff0c;但另一方面&#xff0c;Java 日志库依赖看起来丰富的让人眼花缭乱。相信大家或多或少都有这样的疑问&#xff0c;Log4j&#xff0c;SLF4J&#xff0c;Logback&#xff0c;Log4j2 这些日志框架我该如何选择&#xff1f;它…

一文了解EPaxos核心协议流程

简介&#xff1a; EPaxos&#xff08;Egalitarian Paxos&#xff09;作为工业界备受瞩目的下一代分布式一致性算法&#xff0c;具有广阔的应用前景。但纵观业内&#xff0c;至今仍未出现一个EPaxos的工程实现&#xff0c;甚至都没看到一篇能把EPaxos讲得通俗一点的文章。EPaxos…

低代码发展系列专访之五:低代码的最大价值点是“技术平民化”吗?

话题&#xff1a;低代码专访编辑 | LLBin前言&#xff1a;2019年开始&#xff0c;低代码爆火。有人认为它是第四代编程语言&#xff0c;有人认为它是开发模式的颠覆&#xff0c;也有人认为是企业管理模式的变革……有很多声音&#xff0c;社区讨论很热烈。CSDN随后展开低代码平…

梦幻跨服购买需要登录服务器未响应,梦幻西游8月4日定期维护公告:跨服购买限制放宽...

核心提示&#xff1a;法宝”系统新增“多套法宝切换”功能。亲爱的玩家朋友&#xff1a;为保证服务器的运行稳定和服务质量&#xff0c;《梦幻西游2》所有服务器将于2015年8月4日上午8:00停机&#xff0c;进行每周例行的维护工作。预计维护时间为上午8:00&#xff5e;9:45。如果…

深度技术揭秘 | 大促狂欢背后,如何有效评估并规划数据库计算资源?

简介&#xff1a; 经过“双11”、“618”这类互联网促销活动的验证&#xff0c;越来越多的互联网公司采用不定期营销活动来刺激消费&#xff0c;达到提升营收能力的目标。然而&#xff0c;在每一次业务狂欢的背后&#xff0c;如何科学地为促销活动准备相应的计算资源就变成了困…

学画画软件app推荐_今日推荐:拍照摄影APP之稀缺软件篇

你也许热衷拍摄或喜欢摄影&#xff0c;那么日常的拍摄主要的工具离不开手机&#xff0c;好的拍照摄影APP当然也必不可少。一个好的拍照软件更加重要&#xff0c;有时候市面上常用的拍照软件不能满足你特殊的拍摄手法&#xff0c;经常需要重新编辑或修改才能达到效果&#xff0c…

干货|一文读懂阿里云数据库Autoscaling是如何工作的

简介&#xff1a; 阿里云数据库实现了其特有的Autosaling能力&#xff0c;该能力由数据库内核、管控及DAS&#xff08;数据库自治服务&#xff09;团队共同构建&#xff0c;内核及管控团队提供了数据库Autoscaling的基础能力&#xff0c;DAS则负责性能数据的监测、Scaling决策算…

jq动态渲染后获取不到元素高度_浏览器的渲染机制

面试肯定会问到这个吧~So&#xff1a;再一次的屡屡浏览器的渲染机制~在渲染一开始会先从网络层获取请求文档&#xff08;HTML、XML&#xff09;的内容&#xff0c;然后再进行以下基本流程3.1 解析HTML 》 DOM树从HTML文本解析到HTML语法树&#xff0c;再解析到文档对象树&#…

数字时代的抉择,金蝶 EBC 的破局

今年 10 月&#xff0c;Gartner 发布了企业在 2021 年需要关注的重要战略科技趋势&#xff0c;其中“可组装的企业”一词引起热议。Gartner 认为原本为了提高效率而建立的静态业务流程很脆弱&#xff0c;在疫情的冲击下容易变得支离破碎&#xff0c;因此企业应具有不断重组与改…

自己动手从0开始实现一个分布式RPC框架

简介&#xff1a; 如果一个程序员能清楚的了解RPC框架所具备的要素&#xff0c;掌握RPC框架中涉及的服务注册发现、负载均衡、序列化协议、RPC通信协议、Socket通信、异步调用、熔断降级等技术&#xff0c;可以全方位的提升基本素质。虽然也有相关源码&#xff0c;但是只看源码…

deb 中标麒麟_「图」百度网盘Linux版放出deb包客户端:新增支持Ubuntu 18.04 LTS

6月中旬发布的百度网盘Linux版本中&#xff0c;首先适配了中标麒麟桌面操作系统软件(兆芯版)V7.0。而今天Ubuntu官方推特最新微博表示&#xff0c;继发布Linux rpm包客户端之后&#xff0c;官方今天又推出了deb包客户端&#xff0c;新增支持Ubuntu 18.04 LTS。目前百度网盘已经…

KubeVela 成为 CNCF 沙箱项目,让云端应用交付更加简单

简介&#xff1a; KubeVela 就是这样一个面向用户的上层平台项目。对于业务开发者来说&#xff0c;KubeVela 简单、易用&#xff0c;它可以让开发者以极低的心智负担和上手成本在 Kubernetes 上定义与部署应用... 但更重要的是&#xff0c;对于平台团队来说&#xff0c;KubeVel…