揭秘!信息检索技术高端玩法

《SIGIR 顶会论文解读》重磅发布

由 7 位阿里巴巴技术专家精心打造,内容覆盖推荐系统 、成交转化模型 、 回音室效应 、 全空间多任务转化率预估建模 、 DeepMatch 召回模型 、 跨领域冷启动用户推荐网络 、 表示学习模型等信息检索领域新技术。

精彩内容抢先看

 

1、对抗推荐系统


回顾推荐系统的发展,离不开模型、数据、训练方式三个维度的创新。模型层面,基于内容的推荐系统到协同过滤的矩阵分解,以及神经网络带来的序列化建模,使得用户表征和商品表征刻画越来越精细;数据层面,长短期行为的切分,基于session 的推荐 [1],跨场景行为的引入,数据的丰富和建模为用户兴趣的挖掘提供更多的可能;训练方式上,分布式训练框架,在线学习,高维稀疏特征处理,优化器设计,从而支撑商业化推荐系统。然而,性能提升的同时,我们也看到推荐系统的可解释性逐渐变成黑盒。用户的兴趣偏好如何表征,兴趣如何演变,不同时间点的历史行为由哪种因素主导,这一系列的问题都对现代化推荐系统的解释提出了挑战。


2、GMCM基于微观行为图的成交转化模型


电商推荐系统帮助用户寻找感兴趣的商品。在这个系统中,两个任务扮演了至关重要的角色,点击率预估(CTR Estimation)和成交转化率预估(CVREstimation)。顾名思义,点击率是商品从被曝光到被点击的概率,成交转换率是商品从被点击到被购买的概率。


虽然学界和业界在 CVR预估方面做了不少有意义的工作,但是工业应用中的 CVR预估仍然是个有挑战性的任务。


3、属性二部图的表示学习


网络数据是一种常见的数据表示形式,可以用来建模现实世界中的多种应用场景。网络表示学习(又称作图嵌入学习),作为一种建模网络数据的模型,近年来受到学界和工业界的广泛重视,得到了极大发展。网络表示学习旨在把复杂的网络图数据结构嵌入到低维的连续向量空间中,并且使每一个节点的特征信息在低维空间中得到反馈。近年来,大量的网络表示学习方法和模型被不断提出并且在链路预测、节点分类、网络可视化等相关的实际任务上有很好的表现指标。


4、了解电子商务中的回音室效应


个性化推荐系统在为用户带来更精准商品的同时,也对消费者的兴趣偏好和行为造成影响,例如回音室效应。回音室是指用户不断接受相似的信息和内容, 从而使得他们的兴趣或者态度被不断强化。这种现实通常出现在社交媒体和网络平台,也同样可能出现在电子商务等推荐系统中。我们的研究集中在电子商务的推荐系统对用户兴趣的影响,利用淘宝的大规模用户数据检验是否存在回音室效应。


5、基于post-click行为分解的全空间多任务转化率预估建模


随着移动互联网的兴起,从海量的数据中挖掘出有价值的信息并呈现给用户,已成了电商、社交、新闻等主流应用的核心功能,推荐系统正是在这样的背景下诞生的。在电商领域,高质量的推荐系统能为用户提供精准、及时、甚至带有一定惊喜性的个性化服务,进而有效地增加了用户与系统之间的黏性,同时也能为平台带来一定的收入。一般说来,电商领域 ( 如淘宝 ) 的推荐系统架构主要包括两个阶段:系统决策和用户决策。


6、一种挖掘用户评论文本的跨领域冷启动用户推荐网络


在大型推荐场景中,存在着众多类目(例如亚马逊平台中的书籍、影视推荐等)。用户往往只与其中部分类目有过交互,对于其他类目,由于缺少相应的历史行为记录,协同过滤方法会遭遇冷启动问题。


为了缓解冷启动问题,一类可行的方法为利用用户在其他类目上的历史交互记录进行知识迁移(跨领域推荐),比如,给喜欢武侠小说的用户推荐古装电影。同时,为了更细致地刻画用户形象,参考用户的历史评论进行辅助推荐也能起到促进作用。


近年来,跨领域推荐和基于评论的个性化推荐均取得了不俗的进展,却鲜有工作将二者结合。这类工作主要存在以下挑战:

1)用户在不同类目下的关注点是不同的,且只有少量稀疏特性存在关联,导致模型较难发现此类隐式关联;

2)对于在当前类目下无历史记录的冷启动用户,若直接利用其他类目下该用户的评论文本,则会不可避免地带来用户特征的抽取误差,例如,喜欢粗糙质地工艺品的用户,不一定会喜欢粗糙材质的衣物。鉴别不同类目间评论文本的语义差异,也是一个不小的挑战。


针对以上问题,本文提出了一种挖掘用户在不同类目下的评论关联,进而对冷启动用户进行推荐的深度模型,称作CATN


7、全局自适应模块:为召回模型装上第三只眼


DeepMatch在搜索、推荐和广告等系统都大量应用,是一种重要的召回方式。通常将用户 ( 搜索场景下包含 Query) 和商品通过深度模型编码成向量,线上通过向量近邻查找 top K 个商品作为召回结果。

 

原文链接:https://developer.aliyun.com/article/768517?utm_content=g_1000163102
本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/515362.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VSCODE远程连接服务器,远程开发。

在开发中有时需要远程开发,需要远程连接服务器,所以需要学习一下如何远程连接。 1、安装vscode的插件:Remote-ssh 需要看清楚,是这个插件不要安装错了 2、安装好后打开命令行,快捷键 CtrlShiftp,输入ssh查…

【技术史】数据中台的前世今生

数据中台自14年至今,已然成为了2B、2G业务最热门的话题,政府机构、企事业单位、互联网公司等进行着数字化、数据化、智能化转型。市场普遍认为,阿里巴巴将自身数据中台建设能力对外赋能是拉起本轮数据中台浪潮的根本所在。 本文将带你全面了…

抖音实战~密码找回

文章目录1. 密码找回流程图2. 前端源码3. 后端1. 密码找回流程图 2. 前端源码 /*** 密码找回*/updatePassword() {var me this;var mobile me.mobile;// 提交前,手机号校验var reg /^1[0-9]{10,10}$/;if (!mobile || !reg.test(mobile)) {uni.showToast({title: …

排队五小时才能吃上一口的Popeyes,要借阿里云数据中台10年内开足1500家门店

几个月前,还没多少国人了解美国炸鸡品牌Popeyes,但现在,Popeyes却成为上海滩最火爆的网红店:5月在上海市淮海中路开出首家门店当天,早上7点半,第一条队伍就已排出了半条街。 面对良好的开局,Po…

干货!Redis集群工作原理解析

作者 | 张小盼头图 | 下载于东方IC出品 | CSDN云计算(ID:CSDNcloud)Redis 缓存因其访问性能高、可靠性更高,作为缓存工具在各大互联网公司中广泛使用。今天我们就来看看Redis Cluster 的实现原理。集群建立Redis集群是由多个Redis…

让小程序在自有App中启动的技术来了:mPaaS小程序架构深度解析

本文将围绕支付宝在移动端架构的演进逐步展开,分享我们在“App 动态性”“提升研发效率”等方面所做的思考和具体实践。同时,针对 mPaaS 小程序能力的开放,也将展开介绍我们如何实现“小程序代码只写一次,多端投放”,而…

抖音实战~分布式文件存储~SpringBoot集成MinIO

文章目录1. 引入依赖2. yml配置3. 客户端配置4. 工具类5. 需求实战6. 效果图1. 引入依赖 <!-- MinIO --><dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.2.1</version></dependency>…

笑联 x mPaaS | 12 个模块,全面小程序化,如何打造真正的一次开发复用多端?

这篇故事围绕着一款 App 基于 mPaaS 小程序进行改造娓娓展开。 作为国内校园服务场景最丰富的平台&#xff0c;笑联 App 已覆盖国内 130 所高校&#xff0c;服务近百万高校学生。 截止目前&#xff0c;笑联 App 内的 12 个业务模块目前已顺利实现小程序化。不仅获得媲美原生应用…

万字长文梳理:从0开始,步入Service Mesh微服务架构的世界

来源 | 无敌码农责编 |贾凯强头图 | 下载于视觉中国新一代微服务架构——Service Mesh已经引发了诸多关注。在微服务架构盛行的今天&#xff0c;像Spring Cloud这样的微服务框架大家已然耳熟能详 &#xff0c;因为大部分互联网公司都在此基础上构建过第一代微服务体系&#xff…

开放下载!《大促背后的前端核心业务实践》

《大促背后的前端核心业务实践》电子书重磅发布! 2020年618大促已经过去&#xff0c;作为淘系每年重要的大促活动&#xff0c;淘系前端在其中扮演着什么样的角色&#xff0c;如何保证大促的平稳进行&#xff1f;又在其中应用了哪些新技术&#xff1f;淘系技术联合阿里云开发者…

33个常见问题!超全Windows排查手册

无论你是新手还是老手&#xff0c;你的Windows系统都会遇到不容易诊断的问题。而当发生这种情况时&#xff0c;你会怎么做&#xff1f;希望本书可以在系统出现问题但是又不知道到底发生了什么以及问题出现在哪里时&#xff0c;为大家提供解决思路和方法&#xff0c;高效的解决问…

上市之后,青云存储平台QingStor也要“进军”云原生

作者 | 陈利鑫头图 | 下载于东方IC出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;3 月 16 日&#xff0c;北京青云科技股份有限公司&#xff08;以下简称“青云科技”&#xff09;登录科创板&#xff0c;昔日里频频出现在公众视野的云计算企业&#xff0c;…

抖音实战~发布短视频流程梳理

文章目录一、传统文件上传1. 上传流程2. 上传时序图二、CDN文件上传2.1. 上传流程2.2. 上传时序图2.3. 方案评估一、传统文件上传 1. 上传流程 2. 上传时序图 二、CDN文件上传 2.1. 上传流程 2.2. 上传时序图 2.3. 方案评估 第一种文件上传&#xff0c;消耗带宽2次&#xff…

Docker中级篇|深入探究Docker

简介&#xff1a; 深入探究Docker Docker镜像理解 Docker镜像是什么 镜像是一种轻量级、可执行的独立软件包&#xff0c;用来打包软件运行环境和基于运行环境开发的软件&#xff0c;它包含运行某个软件所需的所有内容&#xff0c;包括代码、运行时库、环境变量和配置文件 D…

掌门教育微服务体系 Solar | 阿里巴巴 Nacos 企业级落地中篇

联席作者&#xff1a;吴毅挺 任浩军 童子龙 郑重鸣谢&#xff1a;Nacos - 彦林&#xff0c;Spring Cloud Alibaba - 小马哥、洛夜&#xff0c;Nacos 社区 - 张龙&#xff08;pader&#xff09;、春少&#xff08;chuntaojun&#xff09; 掌门教育自 2014 年正式转型在线教育以…

经典永不过时!重温设计模式

导语&#xff1a;在软工程中&#xff0c;设计模式&#xff08;design pattern&#xff09;是对软件设计中普遍存在&#xff08;反复出现&#xff09;的各种问题&#xff0c;所提出的解决方案。这个术语是由埃里希伽玛&#xff08;Erich Gamma&#xff09;等人在1990年代从建筑设…

抖音实战~项目关联UniCloud

文章目录一、云存储1. 登录UniCloud2. 创建服务空间3. 详情查看二、项目关联UniCloud2.1. 创建云开发环境2.2. 关联云服务空间2.3. 效果验证一、云存储 1. 登录UniCloud 链接&#xff1a;https://unicloud.dcloud.net.cn/login 云存储空间&#xff1a;https://unicloud.dcl…

Flutter+FaaS一体化任务编排的思考与设计

作者&#xff1a;闲鱼技术-古风 FlutterServerless三端一体研发架构&#xff0c;客户端不仅仅是编写双端的代码&#xff0c;而是扩展了客户端的工作边界&#xff0c;形成完整的业务闭环。在新的研发模式落地与实践的过程中&#xff0c;一直在思考如何提高FaaS端研发体验与研发…

抖音实战~实现App端视频上传、发布、落库

文章目录一、API阅读1. 选择或拍摄视频2. 云函数API~文件上传3. 视频截帧二、App端视频上传流程2.1. 上传流程图2.2. 流程简述三、前端源码实战3.1. 选择/拍摄短视频3.2. 短视频上传3.3. 进度条页面3.4. 补充短视频内容3.5. 视频发布3.6. 视频预览四、后端源码实战4.1. 短视频发…

从微服务到 Serverless | 开源只是开始,终态远没有到来

开源只是开始&#xff0c;终态远没有到来。 从微服务开源&#xff0c;到 Serverless 开源&#xff0c;我们正持续将阿里沉淀的技术能力进行开放。 只是这一次不同的地方在于&#xff0c;借助 Serverless 能力的释放&#xff0c;将帮助前端进入一个崭新的时代&#xff0c;只需…