做ToB软件质量保障的这两年

简介:自己算是阿里的老兵了,从实习开始一直投身在 toB 业务的质量保障领域内,不能说是资深的专家,但所经历的、感受的业务特点和体会还是具有一定的代表性,希望能通过这篇文章,总结一下过往,并能和已经躬身进入这个业务领域,以及将要进入的同学们产生一些共鸣。

眼中的ToB业务

自己算是阿里的老兵了,从实习开始一直投身在 toB 业务的质量保障领域内,不能说是资深的专家,但所经历的、感受的业务特点和体会还是具有一定的代表性,希望能通过这篇文章,总结一下过往,并能和已经躬身进入这个业务领域,以及将要进入的同学们产生一些共鸣。

服务专有钉客户的这两年,更像是场战斗,只有躬身入局的胜利者才能这个竞争激烈的市场上存活。专有钉的深度用户已经将专有钉作为日常工作的一部分,跟我们使用钉钉一样,是生产力工具;再小的体验问题,再小概率出现的偶发问题,在大规模日活下,都极易被放大和激化。

即便都是协同办公的业务诉求,也会因为客户行业特性不同而大相径庭。所带来的定制化需求量会随着不同行业客户的增加出现指数上升,这对产品架构的适配、产品研发交付服务链路上的资源投入均带来巨大的挑战。

虽然服务这些不同行业的头部客户很艰难,但是一旦认可我们,口碑就会在这些行业内迅速传播,带动客户的增长。

结合跟 ToC 产品的对比,我眼中 ToB 业务特别明显的特点有如下几个:

质量保障的难度

2年的建设,专有钉已经成为国内第一大政务协同办公平台产品。对于这份答卷很骄傲,组织也给予了认可,但同时,焦虑、压力也在持续积累,因为这个业务实在是太难做了。

1  客户对质量容忍度极低

专有钉在钉钉产品矩阵中,所承担的责任是服务好政府客户、行业头部大型企业客户。这些客户最大的特点,对数字化是有较深的理解和应用,并非小白客户。我们需要展现出较他们更强的专业性,较之前他们所使用产品更好的体验,他们才能接受我们,认可我们,把我们当成数字化改革的同路人。

原先做公司内部产品,在项目周期紧张的情况下,最先想到的解决方案就是保障主干业务,但做专有钉不能固化这样的意识,因为有 VIP 客户这种角色存在。他们是决策者,但也是一个个人,不同人的产品使用路径、所认为的核心产品功能均不同,但有一个相同点,就是对质量的容忍度都极低,客户认为,已经为产品买单了,高质量就应该是标配。这带来的结果是“主干业务”的定义变得边界模糊,在有限的项目周期内,如何做到测全?

另一个特点,是出现问题时,有人可能会质疑,这明显是你们系统运行指标监控没做好。但公有云上常规的系统指标监控方案在专有云环境下,通常无法运转。问题排查难度大,造成口碑积累的难度也极大。

2  安全生产难做

专有钉跑在专有云环境中,资源、数据、产品,所有的一切都属于客户所有,做安全生产,一要严守用户信息安全,二要严控方案所消耗的资源成本。专有云网络基础设施复杂,目前尚无成熟的全链路问题排查工具,且不同客户环境的云底座、中间件差异大,方案复用度低。

组织协同配合困难,安全生产会涉及产研、交付、一线运维、二线运维、三方isv,且后四者在不同的项目也通常会由不同的公司组织来承接。能力参差不齐,职责清晰的难度大。

3  测试技术融入研发过程的迫切性高

专有钉产品在极其有限的版本周期内,既要实现 70~80 个业务需求,又要严格遵守质量门禁,压力极大。质量团队在坚守质量原则的基础上,需要在研发自测阶段提供给研发效率高、覆盖广的测试能力,以此将质量风险消灭在项目前期。

开放生态的背景下,大规模的isv产出物将融入专有钉产品,质量团队需要做质量兜底。将 isv 纳入到质量保障体系中,任重而道远。

4  云原生适配难度大

专有云发展了多年,市场上不乏竞品。客户看中专有钉的专业性,但要让他替换昂贵的云底座成阿里云飞天底座,可能就会迎难而退,发展云原生是出路之一。 当前云原生产品缺少标准化,这对测试工作就是场灾难。辛苦完成了测试,由于客户现场部署架构不同,所用的云原生产品规格不同,导致 bug 频出,打脸的同时也无奈。非标下,测试结论无法复用,甚至显得无意义。

当前缺少成熟的安全生产、质量保障的云原生产品,线上可运维性差,稳定性保障能力不足,巧妇难为无米之炊。

5  测试工作具有专业性难度

除了要攻克专有云的技术屏障,在其之上测试功能、性能、安全生产能力建设外,还需要针对核心业务做业务专项测试,比如 IM、音视频、文档等。

略有成效的方法

上述难点有些是做专有钉产品第一天就要面对的,比如专有云的技术屏障,而有些是在业务发展中逐渐出现,比如云原生的适配难度。应对这些难点的策略方法也同样并非一蹴而就,在攻克老问题,迎接新问题的反复中,专有钉质量团队也沉淀了一套适配当前 ToB 业务的质量保障体系,体系取名“定坤”。

1  数据为基础

专有钉产品从诞生便以推动政企客户数字化改革为己任,高质量、高稳定、优体验是这个产品必有的特性,保障体系从建设之初便和产品本身一样,以数字化来驱动,把所有可定义的过程、结果均尽可能地做了结构化,并在其基础上做加工、分析、决策、驱动。

数字化驱动质量风险防控

质量/过程风险数据的结构化,需要标准化的研发流程、缺陷流转规则做匹配,让离散的数据通过规则分析,具备决策和驱动能力。专有钉的研发流程将集团产品 Aone 的能力用到了极致,需求管理、版本管理、缺陷管理全部标准化执行,完全可以作为 Aone 的样板工程存在。

数字化推动研发测试能效提升

专有钉的客户对数据极其敏感,数据安全等级极高,引流回放等的获取均存在天然屏障,如何获取尽可能多的脱敏数据,用到质量保障策略和方案中,是急需但必须谨慎对待的课题。

线上客户数据获取困难,但线下每一个功能用例的执行流量却蕴含着价值,流量基于 jvm-sandbox 获取。可以从中挖掘出sql执行、缓存使用等过程中的性能隐患;也可以沉淀出业务调用链路,基于此,结合故障等级定义、监控覆盖情况、预案覆盖情况,形成产品安全生产能力视图和工作台,直观、高效地开展安全生产工作。下图就是其中一条流量,存在缓存重复调用的性能隐患。

数字化推动产品体验提升

专有钉产品以客户端作为用户体验的前沿阵地,集团提供了较为成熟、丰富的移动端专项评测能力,我们在此基础上完善了整体调度、自动触发执行,以及自动生成竞品报告等能力,用竞品分析数据来推动客户端体验的提升。专有钉在 PC 端有着更加广泛的应用前景,科创端是当前国家大力发展的方向,而集团缺少相应的专项评测能力,我们采取了自建的模式,目前已具备端稳定性、端性能的PC端专项评测能力。  

2  风险防控为基调

由于客户的容忍度低下,交付周期又极短,无法通过长时间的灰度或者靠出现问题后做改进的方式来提升产品稳定性,而必须在转交付前做好充足的测试、防控工作。

高可用测试防控稳定性风险

阿里云飞天底座相对成熟,但云原生不同,商用刚开始,尚未经受过磨炼,在交付前

必须进行高可用测试。这里要给阿里云 ADP 团队做个广告,他们已有相对成熟的平台来进行中间件的高可用测试,业务团队只需整理出基于业务的测试场景即可。

故障演练防控安全生产能力不足带来的风险

最理想的状态是在每个版本转交付前,将增量业务的故障等级定义做完善,同时梳理出增量业务的全链路,并进行故障演练,推动完善安全生产能力,包括监控、故障降级/恢复预案、强弱依赖治理等等(当然现实比较残酷,项目周期过于紧张,无法每个版本都进行常态化演练)。专有云上缺少免费的演练平台支持(富裕的可以参考下AHAS),我们采用专有化chaosblade的方案来实现能力,同时搭建平台用来沉淀演练场景,便于常态化高效执行。

容量规划防控机器资源风险

专有云上的容量规划完全是理想很美好,现实很残酷的工作。最早做容量规划的时候,过于单纯,将“具备线性扩容”能力认为是云上机器的标配能力。但现实十足的打脸,实际测试下来完全不具备线性扩容能力,这导致在实验室环境测试下来的容量需求,做推算后和实际不符,必须在每个专有云环境下做真实的性能压测,成本和可行性都备受挑战。当前虽然用了各种算法来做尽可能接近的估算,但依然无法减少真实压测这一环节的资源消耗。

项目研发过程质量风险管理

基于质量、风险数据,结合标准化的研发、交付、服务流程,制定了全生命周期软件质量分体系,覆盖了版本研发阶段、交付阶段以及上线使用阶段整个生命周期,分成准入准出标准和质量分两个载体。当前版本研发阶段的质量分和标准相对成熟,质量分用于事后总结,做后续版本的问题规避,而标准则代表着能否进入集成回归,能否转交付。

要达到标准,获得质量高分,均是有前人总结的方法论,结合这些方法论,并融合质量分数据现状,“在合适的时机智能化地提供解决方案,规避风险”,这是当前建设中的质量风险管理能力的目标。

3  研发效能做加持

2年,我们一直在为业务奔跑,但只要有间隙,提升研发效能必定被提上日程,因为我们坚信这是提升幸福感的出路之一。

自测工作台提升自测效能

要做好开发自测,首先要做的是联合开发,跟PM争取到固定的、合适的自测时间。我们提供了开发主动要求的功能自动化、测试用例,同时提供了专有云下的服务链路调试、版本前后链路对比、测试数据工厂、服务MOCK、基于流量数据的性能隐患识别、性能问题初步筛查等增值能力。“越早发现 bug,修复成本越低”,这乃亘古不变的道理。未来要思考的是,即使自测时间被榨干,也能在提测前充分自测。

分层自动化提升测试效能

自动化从来没有像当前如此被需要,测试团队需要,研发团队也需要,交付团队更需要,根本还是业务特性和当前所处阶段决定。互联网产品搬的迭代周期,军工级的产品品质要求。通过自动化做越多的内容,就有越多的人力出来覆盖那些原本无人力、无技术覆盖的部分。自动化测试我们认定分层的理念,不同层就应该用合适的自动化手段。

专有云服务端低代码自动化平台具备支持 LWP、HSF、HTTP接口测试的能力,同时能支持服务端SDK的自动化测试。之所以叫“低代码”,是因为这个平台从孕育开始(在宜搭出现之前)就开始秉承“低代码”的理念,让所有想做接口自动化的同学能上手,无关编码能力,目前提供了简单配置实现、流量自动生成两种用例生成方式。下图是配置页面:

客户端不仅采用了 UI 自动化做端到端的功能覆盖,同时对 JSAPI、端上 SDK支持自动化测试。UI自动化还需要考虑一码多端适配,即一套代码能在不同的端稳定运行,端越多,自动化发挥的价值就越显著,节省的人工投入就越可观。

自动化不仅仅体现在功能测试上,在性能测试、客户端体验专项测试,均是优先考虑通过自动化来实现。一站式性能测试平台实现从执行、结果分析、瓶颈定位、基线控制的闭环自动化。客户端体验的大多数专项测试均能自动触发执行,自动生成竞品对比分析报告。在产品版本质量保障过程中,自动化也无所不在,自动生成质量日报、自动生成转交付申请、自动生成版本质量报告、每天定时自动播报风险......

质量标准提升组织协同效能

钉钉希望携手合作伙伴一起投入数字化改革的浪潮中,随着生态开放,钉钉提供底层能力,让 ISV 在上面随意畅享,实现他们的梦想。梦想的实现不能务虚,而是需要实实在在的协同机制、约定来保障,质量就是所需要保障的其中一块。专有钉的开放平台上连接了数千个 ISV 产出的应用、数量庞大的 SDK 和 API,为了保护自己,也更好的协助 ISV 提供高质量的产品,测试团队制定了ISV 产物的质量准入标准,同时逐步将我们用的成熟的测试能力提供给 ISV,让质量保障更加的容易,更加的公平。

结语

专有钉产品当前的质量保障体系势必需要应对更深层次的挑战,以持续保障我们的专有钉以军工级的质量来帮助到我们的客户,始终让体系的名字“定坤”实至名归。

原文链接

本文为阿里云原创内容,未经允许不得转载。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/510839.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

成本节省 50%,10 人团队使用函数计算开发 wolai 在线文档应用

简介:人们关注 wolai 独特的功能和舒适的用户的用户体验,更关注实现这些背后的技术架构。在一个晴朗下午,我们邀请了 wolai.com 的创始人马锐拉,跟我们聊聊 wolai 背后的 Serverless 架构。 作者:马锐拉 | wolai.com …

前端质量|基于业务驱动的前端性能有效实践案例

简介:前端的本质价值是什么?作者认为是给用户创造良好的交互体验和抵达率优化应该在转化率之前。那么本文就将和大家分享基于业务驱动的前端性能有效实践案例。 作者 | 钱文玲(悠酱) 来源 | 阿里开发者公众号 一、背景 1.1.前端性能优化的业务意义 前…

走进RDS|说说关系型数据库与Serverless

简介:看到如今Serverless在云计算行业喷薄欲出的态势,像极了《星星之火,可以燎原》中的描述:虽然不能预测未来的发展和变化,但对于云计算来说这是个相对确定的方向。本文将和大家说说关系型数据库与Serverless。 作者 …

六年团队Leader实战秘诀|程序员最重要的八种软技能

简介:笔者在带团队的六年中发现,程序员们在职场都有一个共同的困扰:“好像写代码都没什么问题了,日常工作基本上都是应付业务需求的开发,好像找不到其他的更大的附加价值了,我应该找一些什么样的发力点才能…

宜搭小技巧|学会这一招,数据收集收放自如

简介:应用的「启用」「停用」功能还可以这样用 >> 团建的日子眼看就要到了,为了掌握参加的人数,提前进行车票、房间、餐食的预定,宜小搭计划在周五下班前停止对报名信息的收集。 如何停止我们的应用进行数据收集呢&#x…

阿里云总裁张建锋:“未来不懂低代码就像二十年前不会用word”

11月3日,阿里云智能总裁张建锋在2022云栖大会公布,钉钉上的低代码应用数突破500万,低代码开发者超过380万。张建锋表示,未来80%的应用会由业务人员通过低代码开发。 张建锋提到,一线业务人员通过低代码的方式&#xf…

平行云CEO 李岩:CloudXR ,开启通往元宇宙的通道

简介:一端是算力无穷的云,这也是 CloudXR 的精髓所在。 图:2022阿里云视觉计算私享会现场 5月11日,在“2022阿里云视觉计算私享会”上,平行云CEO李岩为大家带来了题为《CloudXR,开启通往元宇宙的通道》的主…

阿里10年沉淀|那些技术实战中的架构设计方法

简介:上周我写的一篇文章《关于技术能力的思考和总结》引起了大家的关注,好多读者的评论“以写代想、以想促真、以讲验真”,大家的感受很深刻,基于上次的文章,这篇文章我其实更想跟大家聊聊一些常用的思考方法&#xf…

阿里巴巴云数据仓库 MaxCompute 数据安全最佳实践

简介:MaxCompute作为企业级SaaS模式云数据仓库,正在为客户业务及其数据提供持续的安全保护。 MaxCompute 近期对产品的安全能力进行了全面升级 ,结合数据生命周期,针对数据误用、数据滥用、数据泄露、数据丢失等典型数据风险场景&…

阿里平头哥发布RISC-V高能效处理器玄铁C908,打造端云一体生态

11月3日,在2022云栖大会上,阿里平头哥发布全新RISC-V高能效处理器玄铁C908。玄铁C908计算能效全球领先,较业界同性能处理器能效提升超20%,更能满足低碳时代的算力需求,可广泛用于智能交互、多媒体终端、AR/VR、无线通讯…

MaxCompute 公共云多租户设计的技术要点详解及产品实现特色

简介:公共云大数据平台在多租户的设计和实现方式上有所差异。本文主要介绍在公共云大数据平台的多租实现方案中需要考虑的问题和挑战,重点介绍了MaxCompute在计算和存储多租实现上的特点。期望通过这些介绍来让大家了解大数据云平台多租方案需要关注的技…

技术解读 | 智能开放搜索CTR预估模型

简介:本文介绍开放搜索CTR预估模型在个性化排序中的应用与实践 如何评价搜索排序效果? 搜索是用户触达信息最简单直接的方式,是APP、网页必备的功能。如何评价并提升搜索效果一直是搜索领域的常见问题。 一方面,可以基于用户体…

阿里云能耗宝助力华聚公司实现产品绿色升级

客户公司:杭州华聚复合材料有限公司 公司类型:制造业 案例简介:能耗宝“碳足迹在线服务”助力华聚公司产品绿色升级,能耗管理助力厂区实现年度节电17万度,约等于减碳排量120多吨。 2020年9月,国家提出了2…

无影云应用核心技术解读

简介:本文整理自阿里云无影高级技术专家付志超,在阿里云EMR StarRocks无影云应用线上发布会的分享。本篇内容主要分为三个部分: 1. 无影云应用产品简介 2. 无影云应用技术架构 3. 总结&展望 了解更多无影云内容:无影云应用重…

计算就是创造力!阿里云与FIRST影展设立“无影创作奖”

11月3日在云栖大会技术主论坛上,阿里巴巴集团首席市场官董本洪与FIRST影展创始人宋文共同发起了“无影创作奖”。云计算从支持大制作渲染,走向了更多类型片的创作领域。 按计划,无影创作奖将在FIRST惊喜影展上揭晓,为类型片创作者…

一个好的网站logo设计长这样

简介:一个好的网站logo,不仅让用户一眼知道网站品牌传递的信息,还能提高网站专业度和丰富度,增加SEO搜索排名。今天分享下如何设计一款实用的网站logo。阿里云智能logo设计,在线免费体验logo制作:https://l…

怀同行之心,筑信任之基,践数智之行

行路过半,道阻且长 十几年前,许多人还不知道"云"为何物;而现在,我们的日常生活与云计算技术的发展轨迹越发重合。从“双十一”全民购物狂欢日的海量交易支持,到春运铁路网络购票的海量承载,再到…

面向WEB3.0提升存储性能,蚂蚁鲸探底层区块链存储引擎正式对外开放

11月3日,蚂蚁集团数字科技在云栖大会上宣布,其历经4年的关键技术攻关与测试验证的区块链存储引擎LETUS(Log-structured Efficient Trusted Universal Storage),首次对外开放。该产品主要用于可信数据在区块链上的存储&…

如何写出一篇好的技术方案?

近期在写某个项目的技术方案时,来来回回修改了许多版,很是苦恼。于是,将自己之前写的和别人写的技术方案都翻出来看了几遍,产生了一些思考,分享给大家。 我们为什么需要写技术方案?总结下来无非是几点&…

从“预见”到“遇见”| SAE 引领应用步入 Serverless 全托管新时代

近年来,企业的数字化随着互联网的普及发展越来越快,技术架构也是几经更迭,尤其是在线业务部分。从最初的单体应用到分布式应用再到云原生应用,出现了进阶式的变化。但带来便利的同时,也给企业带来了一定的复杂度&#…