写1行代码影响1000000000人,这是个什么项目?

不带钱不带卡,只带手机出门就能畅行无阻,这已是生活的常态。益普索发布的《2019第一季度第三方移动支付用户研究》报告显示,移动支付在手机网民中的渗透率高达95.1%,截至今年1月,支付宝全球用户数已经突破10亿。你或许每天都会打开支付宝,付款购物、领取权益、享受服务……但你或许不知道的是,在这个方便、快捷、智能化的APP背后,有一群年轻的技术人,用智慧和创新让它每天都变得更“聪明”一点。

2014年,第一届天池大数据竞赛落下帷幕,一支做个性化推荐项目的团队从7000多支参赛队伍中脱颖而出,摘得桂冠,并一举获得高达100万元的奖金。

马健就是这个冠军团队的一员,当年他还在攻读硕士。这个参赛项目不仅帮他赢得了大奖,也奠定了他日后的职业方向。两年之后的2016年,他闯过六轮面试,拿到了“阿里星”的Offer,进入支付宝人工智能部,主攻业务算法。

“阿里星”计划起源于2011年,旨在吸引最年轻最顶级的技术人才加入,选拔标准严苛,每年通过者不过寥寥数人。但在支付宝的业务算法技术部中,马健遇到了好几位“阿里星”:同校同实验室的师弟王盛,同年入职的江少华,连江少华所带的两位实习生,也都先后成为了“阿里星”。

这些万里挑一的年轻技术人不约而同地聚集在了这里。“想做大事,想做能够影响更多人的事。”马健这样描述自己初出校门时的梦想。

作为梦想的舞台,支付宝无疑是足够大的。截至今年1月,支付宝全球用户数已经突破10亿,这意味着支付宝的技术人敲下的每一行代码,所影响的都是数以亿计的用户。从另一个侧面来说,在每一个用户习以为常的扫码付款、领取红包、使用小程序服务等便捷操作背后,也是成千上万的优秀技术人共同筑起的智能平台作为支撑。

端智能:支付宝上绑了很多卡,但唯独不能“卡”

2017年,王盛在南京大学读完人工智能方向的硕士,加入了支付宝。

那正是支付宝的服务快速丰富的时期,除了扫码付款之外,生活缴费、社会服务、理财保险、吃喝玩乐……越来越多的服务都可以在支付宝APP中一站式获取。但服务多了,加载时就难免发生“堵车”,“卡”,成了用户体验的瓶颈。

王盛所在的团队面对的一大挑战,就是找出让支付宝在提供海量服务的同时还能 “不卡” 的方法。


支付宝算法专家 王盛

如果要对每一个服务的加载都进行优化,性价比很堪忧,于是团队改变了思路:用户每次打开支付宝APP时,一般只会用到数量很有限的服务,如果可以只加载要用的服务,用不到的就不加载,就能极大地提升使用的流畅度。

然而问题来了:如何预先知道用户可能要用哪些服务?

“猜”用户的心思,这就是人工智能和机器学习的长项了。

支付宝业务算法团队训练了一个“智能预加载”的模型,当你打开支付宝,这个模型就开始预测你更可能使用什么服务,并依此决策是否加载某些模块。“这项技术的关键难点,就在于如何既减少加载量,又能保证更多的人准确获得所需的服务。”王盛说。

这不仅需要精深的技术,还需要对业务的深刻理解。比如,预加载开始的时间点并不是越早越好,很多时候用户打开支付宝APP只是为了扫码付款,如果此时开始预加载,就会影响扫码的响应速度。因此,预加载程序在用户打开APP一段时间之后才开始运行。

有了智能预加载之后,支付宝模块加载量和卡顿率都减少了20%以上,服务准确率却得到了进一步的提升。同样的思路也被用在推送免打扰功能上,“用模型优化计算之后,推送的总量和对用户的打扰都减少了,但点击量没降。”王盛表示,这说明模型计算能比运营规则更精准地命中用户的需求。

欧拉流控:告别“拍脑袋”,算法帮忙做决策

每到支付宝大促活动时,用户领权益领得很高兴,运营同学却很紧张。因为支付宝提供的权益种类丰富,数量各不相同,要以什么样的节奏发放权益,如何才能尽可能地让更多用户受益,这是个高深的技术活儿。

以前,节奏的把控全靠运营同学的经验和判断。一到大促,运营必须时刻紧盯数据,连厕所都不敢去。即使如此,靠“拍脑袋”做出的决策颗粒度仍然较粗,资源分配的曲线波动频繁。

“这种在线资源分配,可以在算法上转化成一个线性规划的问题,再使用数学工具来做优化。”支付宝算法专家马健说。


支付宝算法专家 马健

深入理解业务的特性、将之抽象成数学问题去解决,充满挑战但富有乐趣。他所在的团队,针对在线资源分配问题,花了半年多的时间开发了一套算法,涉及复杂的数学原理,团队用著名数学家欧拉的名字为它命名,叫做“欧拉流控”。


“欧拉流控”技术架构

2019新春五福刮刮卡上线时,这一算法代替运营控制权益发放的节奏,精度细致到秒,整个过程平稳丝滑,用户几乎不会感知到权益池的波动。在模块化和组件化之后,今后各种涉及在线资源分配的营销业务都可以直接调用这个算法组件。

此外马健还设计了一套算法,这种算法能自动学习很复杂的特征组合,不仅是特征的简单组合叠加,还可以在高VC维,进行特征之间各种复杂算子的高阶组合,整个过程不依赖于梯度。“而且它能生成复杂的公式,这公式本身可能就描述了一定的业务含义,能让业务同学获得新的灵感,从而对业务逻辑进行优化。”马健说。

智能文案:让人工智能为你做创意

相比于马健和王盛,江少华的工作看上去更“诗意”一些,他主要做的是打造一个蚂蚁的首席AI文案创作官,利用人工智能来写文案。

“不止一位运营同学跟我说,想文案想到发际线后退。”江少华说,说起文案,每位运营可能都有一段血泪史。他们迫切地需要一种技术来帮他们拓展思路,并且为投放决策作出参考。“支付宝小二、金融、财富号、线下商家等,都对智能文案有需求。”


支付宝高级算法专家 江少华

然而中文是一种博大精深的语言,措辞的些微变化就能带来天差地别的效果,外国人学习起来都不轻松,AI能学会吗,效果会好吗?

在正式接手智能文案项目之前,江少华用了两年的时间做技术沉淀,第一年支持财富线做信息feeds流推荐,第二年潜心研究NLP的技术创新,第三年一开始,就经历了几场大促:人传人红包,15天到店瓜分15亿红包,团队一边为运营提供支持,一边将这些大促活动作为练兵场,积累下的经验都沉淀成了平台能力。

到了2018年底,新的挑战来了:2019新春五福刮刮卡项目找上了他们,和之前发红包的活动不同,五福刮刮卡涵盖了多种权益,现金、优惠券、会员卡……而且广泛覆盖电商、餐饮、文娱等各条业务线,需要根据业务的不同特性生成不同的文案,对于一直主要在“学”金融业务的智能文案平台来说,这个任务有点“超纲”,同时对生成模型的通用性提出了很大挑战。

“10月接到任务,新年就要上线,总共只有不到三个月时间。”江少华回忆起当时的情形,业务算法团队联合AI团队一起做能力升级,花了一个多月,在文案生成模型方面取得了很大的进展。最终效果而言,点击率提升15%,核销率提升20多个点。


智能文案应用在“新春五福”

“技术要赋能业务,最重要还是给业务带来改变、带来效果。”江少华说,起先运营同学多少有些顾虑,会不会过多占用系统性能?实际效果怎么样?但在看到效果之后,“大家就其乐融融了。”

几经实战大考,现在智能文案平台的生成能力已经可以覆盖到几乎所有的类别:旅游出行、保险、娱乐、餐饮等等。各业务线的运营可以“自助”地在平台上生成文案,无需技术同学专门调试配置。更神奇的是,这个平台不仅会写文案,还能写出不同的风格,同一语义可以生成五条不同风格的文案,任君选择。目前它正在“学”做图像创意,一键生成图文并茂的未来已经不远了。

人工智能:一种理解世界的视角

“互联网的各项技术发展一直很快,而其中,机器学习是跑得最快的。”马健说。之所以快,是因为有效,在推荐、搜索、营销等场景下,机器学习都带来了相当大的飞跃,五年前难以想象的刷脸支付,也在机器视觉技术一日千里的飞速发展之下变成了现实。

实际需求不断出现,技术的发展不断提供解决方案,但解决业务需求和提升业务指标,绝不仅是技术唯一的任务。“算法的目标不仅是完成业务的指标需求,而且能从更高更深的层面理解业务特性,发现一些非平凡的模式和信息,对业务设计以及决策产生正向的、重要的影响。”马健说,这才是技术的深层价值。

“技术人不能仅盯着眼前的问题,要有更高的视角和更广的视野。”三位“阿里星”不约而同地提到这一观点,“人工智能不仅是解决问题和优化服务的工具,更是创新的源泉,许多当下无法想象的能力,都会经由它们来创造。它们蕴藏着面向未来的无限可能。”


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517423.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高德客户端及引擎技术架构演进与思考

2019杭州云栖大会上,高德地图技术团队向与会者分享了包括视觉与机器智能、路线规划、场景化/精细化定位、时空数据应用、亿级流量架构演进等多个出行技术领域的热门话题。现场火爆,听众反响强烈。我们把其中的优秀演讲内容整理成文并陆续发布出来&#x…

免费直播:主流深度框架对比:总有一款适合你~

常常有小伙伴在后台反馈:想了解深度学习该怎么学?自学难度大又没有效果,该怎么办?CSDN为了解决这个难题,联合唐宇迪老师为大家带来了一场精彩的直播【一节课掌握深度学习必备框架】。本次直播将带大家了解在开始深度学…

Swift 在 GAIA 平台云端一体化的探索

作者|姜沂(倾寒) 出品|阿里巴巴新零售淘系技术部 S1 阶段在使用 SwiftUI 编写集团内部使用的 SOT APP 时,有幸参与到 GAIA (FaaS)平台云端一体化的探索,从头到尾实现了一套基于 Swift 语言实现的遵守 GAIA…

微信小程序实现刷脸登录

🎨领域:Java后端开发🔥收录专栏: 系统设计与实战 🐒个人主页:BreezAm 💖Gitee:https://gitee.com/BreezAm ✨个人标签:【后端】【大数据】【前端】【运维】 文章目录&am…

SOFAStack的前世今生

十二年前,为了解决支付宝第一代架构在迅猛发展的业务面前捉襟见肘的困境,蚂蚁金服技术团队开启了一次前所未有的尝试。创新都是被逼出来的,今天高速发展的SOFAStack同样如此。 十二年时间,几代蚂蚁技术人参与攻坚,SOFA…

从浪漫走向坚韧:开源数据库的演变

图:Peter Zaitsev作者 | Adrian Bridgwater译者 | 火火酱,责编| Carol“最初,所有的软件都是开源的。”——这是Percona首席执行官彼得扎伊采夫(Peter Zaitsev)在其公司今年虚拟年度用户/客户峰会上的开场白。如果我们…

中国数据库OceanBase登顶之路

今年天猫双11当天,OceanBase数据库再次刷新数据库处理峰值,达6100万次/秒,创造了新的世界纪录。 在此之前一个月,据权威机构国际事务处理性能委员会TPC披露:蚂蚁金服的分布式关系数据库OceanBase,打破美国…

github 访问慢,一键加速,完美访问

文章目录1. 下载dev-sidecar2. 安装3. 开机启动4. 安装证书5. 开启增强模式6. 重新启动dev-sidecar7. 测试验证1. 下载dev-sidecar https://gitee.com/docmirror/dev-sidecar/releases/v1.6.1 2. 安装 这里windows环境演示 双击安装 3. 开机启动 4. 安装证书 5. 开启增强…

给 AI 讲故事,如何教它脑补画面?

阿里妹导读:视觉想象力是人与生俱来的, AI 能否拥有类似的能力呢?比如:给出一段故事情节,如何让机器展开它的想象力,“脑补”出画面呢?看看阿里AI Labs 感知实验室的同学们如何解决这个问题。 …

产业数字化升级进入深化期,腾讯智慧出行释放“数字底座”核心能力

6月24日,腾讯智慧出行举办线上年度新品发布会。本次发布会以“创造出行新价值”为主题,发布了生态车联网产品TAI 3.0、全新一代自动驾驶虚拟仿真平台TAD Sim 2.0,以及汽车云数字营销解决方案、智慧交通解决方案,从深度和广度上展示…

MySQL与Redis的双写一致性解决方案

文章目录一、解决方案1.1 先更新缓存,再更新数据库1.2 先删除缓存,再更新数据库1.3 先更新数据库,再更新缓存二、总结一、解决方案 1.1 先更新缓存,再更新数据库 💣 问题: 数据库更新成功了,但是由于异常…

解密双十一小程序云背后毫秒级伸缩的Serverless计算平台:函数计算

自2017年第一批小程序上线以来,越来越多的移动端应用以小程序的形式呈现。小程序拥有触手可及、用完即走的优点,这大大减少了用户的使用负担,使小程序得到了广泛的传播。在阿里小程序也被广泛地应用在淘宝/支付宝/钉钉/高德等平台上&#xff…

RuoYi-Cloud 进阶篇_01( Seata 单机环境搭建)

文章目录一、部署单机 TC Server1. 下载Seata2. 解压缩3. 启动4. 监听日志5. 启动命令讲解一、部署单机 TC Server 1. 下载Seata 在https://github.com/seata/seata/releases 这里找到对应的版本软件包进行下载 注:单机模式只适用于学习或者本地测试阶段&#xf…

Logtail 混合模式:使用插件处理文件日志

作为一个服务百万机器的日志采集 agent,Logtail 目前已经提供了包括日志切分、日志解析(完整正则、JSON、分隔符)、日志过滤在内的常见处理功能,能够应对绝大多数场景的处理需求。但有些时候,由于应用的历史原因或是本…

腾讯车联发布TAI3.0:三步实现汽车智能进化,2个月快速上车

6月24日,“2020腾讯智慧出行新品发布会”在线上举行,全新升级的TAI3.0生态车联网正式亮相,并在新款哈弗F7上进行了真实驾车场景的功能展示。 据介绍,TAI3.0包含两个车载APP——腾讯随行和腾讯爱趣听,以及一个生态开放…

RuoYi-Cloud 进阶篇_02( Seata 高可用集群与 Nacos 注册中心整合)

文章目录二、安装步骤1. 创建数据库2. 修改配置文件3. 调整数据库驱动4. 修改配置中心二、 启动和验证2.1. 启动nacos2.2. 启动TC Server2.3. 启动第二个节点2.4. 验证高可用二、安装步骤 1. 创建数据库 创建名称为ry_seata的数据库,并初始化ry_seata_20210128.sql脚本 2.…

腾讯TAD Sim2.0领跑自动驾驶仿真市场 双擎驱动构建新一代仿真平台

随着自动驾驶领域硬件、算法等方面的快速发展,虚拟仿真技术在自动驾驶研发和测试领域的应用日渐广泛,成为自动驾驶量产应用的必备工具,城市智慧交通调度管理和相关法规制定的有力辅助。 在这片行业竞争新高地上,腾讯自动驾驶仿真…

RuoYi-Cloud 部署篇_03(windows环境 Oracle + nginx版本)

请参考RuoYi-Cloud 分布式部署_03(linux环境 Mysqlnginxredis版本)

为了实现在线库的复杂查询,你还在双写吗?

一、在线库不支持在线复杂查询 做在线业务的开发者经常会碰到这样的难题:在线数据库上面运行稍微复杂点的查询,在线业务就挂了!不管是单机数据库如MySQL、PG,还是分布式数据库,HBase、MongoDB、Cassandra都有这个问题…

JUC 中断线程的3种方式

文章目录介绍中断方式一中断方式二中断方式三源码解析总结介绍 三个方法: 1、public boolean isInterrupted()判断线程是否被中断,如果此线程已被中断,则为true ;否则false 。 2、public void interrupt()中断线程 3、public …