摘要: 一个专注人脸识别技术长达11年的程序媛。
程序媛、AI、算法、人脸识别、阿里安全图灵实验室……这些标签任何一个都极具话题性,但如果一个女子同时拥有这些标签,那会是怎样的存在?
在见到于鲲之前,我的脑子里是各种的想象,萌妹纸?御姐?还是?尽管于鲲说话语速有点快,但干脆利落,逻辑清楚,所以“干练”是她留给我的最深的印象。
阿里安全图灵实验室的AI算法程序媛于鲲
在阿里巴巴这几年的锤炼,于鲲已经成长为国内人脸核心算法领域的顶级专家。作为阿里安全图灵实验室的核心成员,研发了业界顶级水准的人脸识别技术和算法,无论是1:1人脸比对还是1:N人脸搜索的算法,效果都在业内处于优势地位。目前,线上的人脸比对核心算法模型,就是于鲲和小伙伴们一起训练和开发的。
不仅如此,于鲲还出色地紧贴业务场景,将技术成果完美落地。她主导了新零售(如未来美家、银泰百货、盒马等)和其他1:N线下业务(包括园区门禁,菜鸟快递取件柜等)的人脸比对算法;同时,还协同了1:1实人认证(手淘扫脸登录等)和1:N敏感人脸检测(内部和绿网)等重要业务算法的研发。
与用户直接互动“很刺激”
2014年,于鲲接触到阿里巴巴,然后被深深地吸引。
“我觉得实人认证和内容管控是非常有前景的,而且可以和终端用户直接互动。”于鲲说,“这对于做技术的人来说,是非常有吸引力的,也挺有成就感的。”
于鲲认为,像是实人认证这种,如果技术层面没有做好,就会导致体验下降。但不管是技术原因还是业务原因,导致客户的流程没有走下去,用户就会给到最为直接的反馈。比如扫脸登录,用户的反应是最为直观的,用户所能接受的极限时间为2秒钟,这对技术提出了极高的要求。
“对于技术人员来说,来自于用户的直接反馈是一种最为难得的体验。“于鲲强调。
由于算法是偏后端的,所以和前台用户的互动,让于鲲觉得是一种“很刺激“的体验。
在于鲲眼中,阿里巴巴这种大平台确实很吸引人。比如实人认证,规模很大,有数亿人在使用。对于绝大多数技术人员来说,这并不是一个很容易得到的机会。
在阿里巴巴是一种全新的体验
从2007年到现在,于鲲一直在做人脸识别技术的研究和开发。
从技术层面来看,于鲲算是轻车熟路,但这并不意味着前面是一片坦途。“对我来说,其实还是蛮挑战的,因为需要角色有巨大的转变。”于鲲说。
于鲲介绍,她之前一直在传统企业做人脸技术的研发,但是到了阿里巴巴这种头部互联网公司后,需要对自己进行革新。包括企业的文化、工作的流程等,这些对于鲲都是全新的体验。
“总体感觉是阿里的节奏非常快,开始还有些不太适应。”于鲲说。她觉得自己每天都是在小跑着前进,面对的业务比较复杂,对接的团队也很多。每天多数时间都在开会中度过,基本上晚饭后的时间才是属于自己的,此时才会坐下来做一些事情。“基本上,白天不是在开会就是在去开会的路上。“于鲲笑称。
万事开头难。但通过不断的交流和磨合,于鲲和小伙伴们越来越有默契,沟通越来越顺畅,对业务也越来越了解,项目推动起来也就“得心应手”了。两年之后,于鲲完全适应了这里,适应了快节奏,适应了新环境。心里也就自然而然地认为,“本来就应该是这样的。”
“现在,如果是慢节奏,我反而不习惯了,会觉得是在浪费时间,浪费生命。”于鲲说,“工作就应该是这样的。”
于鲲告诉我,她觉得到了阿里巴巴就是打开了新的一页,体会到了不同的人生。
程序媛并不是一种独特的存在
阿里安全图灵实验的研究方向非常稳定,就是专注于计算机视觉、自然语言处理、机器学习和深度学习;其聚焦的业务也非常稳定,就是为手淘、天猫、支付宝、闲鱼、优酷土豆、UC、阿里妈妈等核心业务线提供技术支撑,并对外输出AI能力。因此,整个团队也非常稳定。
阿里安全图灵实验室的部分技术同学
这几年,于鲲一直在阿里安全图灵实验室。据她介绍,整个团队有5个程序媛,3个Base杭州,2个Base北京。“我们团队的氛围特别好,大家在一起就是‘哥们儿’,会互相分享好的idea,像一家人似的。”于鲲说,“所有人同心协力,朝着同一个方向,同一个目标发力。”
于鲲认为,大家在团队大目标之下,只有分工的不同,小伙伴们更多的是相互补位和背靠背的方式进行协作。“这个事情交给你,这个事情到此为止。就是这么简单的逻辑。”于鲲说。
于鲲笑着说,她之所以留着长发只是想保留自己女生的特征,但干活儿从来没有把自己当成一个特殊的存在,要享受特殊待遇。相反地,她认为自己从业的时间比较长,所以应该更多地去承担一些事情。
有想法就尽情去发挥
团队稳定与否,Leader很重要。这是于鲲的观点。
在她眼中,阿里安全图灵实验室的负责人奥创是一个很有想法,有大局观的人。正因为如此,整个团队的氛围很和谐,也没有什么职级之分。
于鲲还记得,某年的中秋节,奥创拎着大闸蟹来到公司,然后分给团队的小伙伴们。“Leader有什么事情,都会想到团队成员,这非常棒!”于鲲说。
对比传统企业和互联网公司,于鲲也谈了自己对于技术团队的一些理解。她认为,团队好不好,要看Leader有没有远见,有没有前瞻性。传统企业的技术团队,Leader把任务拿来,然后给到团队成员去落实,这是一种自上而下研发模式。但是在阿里巴巴不一样,这里是一种自下而上的模式,也就是说,组织的目标就在那里,每个团队成员都能看到,每个人能为这个目标做什么?团队成员是自发的,也就是阿里巴巴一直强调的自组织、自驱动,每个人都内心驱动。
“整个团队都是这样的,整个阿里也是这样的。”于鲲说,“虽然有KPI的考核,但每个团队都在思考还可以做些什么?每个人也在想我可以做些什么?这个力量是无穷的。”
于鲲认为,自上而下的指令,很多时候只是Leader一个人的思考,所以具体落地的时候可能结果并不好;但如果是自下而上,那么每个人的想法都能得到充分发挥,每个人都会贡献自己的智慧去为大目标做有益的工作,这是一种积少成多的力量。
“阿里巴巴的工作模式就是,有想法就尽情去发挥。”于鲲说。
算法人靠“数字”说话
在阿里巴巴西溪园区,刷脸设备已经替代了传统的刷卡门禁,这就是于鲲和团队小伙伴们的杰作。实际上,这是经过了内部激烈的技术PK之后,最终被阿里安全图灵实验室拿下的。
于鲲和小伙伴研发的人脸识别技术应用于阿里巴巴门禁系统
“算法人是要靠数字说话的,谁的准确率高,谁就上。”于鲲告诉我,阿里安全图灵实验室研发的人脸识别系统在准确率方面拔得头筹,因此才拿下了园区的门禁刷脸项目。
不仅在内部取得不俗的成绩,在与外部友商的竞争中,阿里安全图灵实验室也顺利拿下了某机场的安检项目,而实验室还通过阿里云上的“实人认证”和“内容安全”两大产品,服务了数万家企业客户。
“我们的业务都依托于我们的技术,因此,我们的技术并不是为了在某个竞赛得奖而进行研发的,而是为了充分保障业务的顺畅应用,为用户提供极致的体验。”于鲲告诉我,阿里安全图灵实验室实际上也经常会在一些大赛上斩获殊荣,但通常情况下,这些都不过是技术小伙伴们做好业务项目之余的“副业”而已。
于鲲告诉我,阿里安全图灵实验室的目标是要做最顶尖的算法团队,并保持领先的地位。
用技术改变生活
于鲲向我普及了一下人脸识别技术的发展简史。
90年代初,手机还未普及,关于人脸识别的应用还非常初级,通常都是简单的特征分类,比如几何或者灰度特征。
2003年到2004年的时候,人脸识别技术开始转向图像领域的传统特征,那时,更多的是需要看工程师对图像的理解,是非常挑战的。不过,已经有一些比较初级的商业应用,比如一些考勤机。
到了2012年,深度学习进入到爆发期。随着这一波的大发展,人脸识别也是获益最为典型的应用之一。那个时候,不管是数据还是算法,人脸识别都已经准备好了,可以随时“起飞”。
最近的两三年,人脸识别主要是在做用户习惯的培养,毕竟还是有很多人不太能够接受,但这个现状正在发生着巨变。比如扫脸支付、扫脸转账等,它们具备的便捷性是以往任何一种技术都无法比拟的。
于鲲告诉我,在人脸识别技术方面,中国是非常领先的,在用户习惯的培养方面也是领先的。每年,国家在这一领域的科研投入,比如论文数量或专利数量在全球来看都是处于前列。
事实上,于鲲从事人脸识别技术的研究与开发已经11年,因此很多人都会奇怪她会不会厌烦了?或者说是否需要换一个方向?她并没有这样的想法。她认为,人脸识别并不是一个单点的技术,而是一整套的解决方案,除了方案本身,它底层的技术也是复合型的。
“人脸一直会在持续的变化,比如化妆、比如美容、比如衰老,比如光照等,这些都会导致人脸的变化。这些变化,远比其他模型要复杂得多。这对于机器来说,是极大的挑战。”于鲲说,“正因为人脸识别所具备的复杂性,所以才会有这么长时间,这么多人去研究。”
于鲲觉得,人脸识别是一个非常好的点,应用场景非常多,商业的可能性也很多,所以它能够成为当前的热点。
“这几年人脸的应用越来越广,其实并不是我们站在这个风口,而是说整个行业站在了这个风口。资本疯狂追逐,各大公司也巨额投入,这些都说明其市场前景巨大。”于鲲表示。
“我想能够用技术服务大众,真正的用技术改变生活,用技术去除恶扬善,这是我的梦想,相信也是每个技术人的梦想。”于鲲说。
原文链接