从信息检索顶会CIKM'20看搜索、推荐与计算广告新进展

文 | 谷育龙Eric

源 | 搜索推荐广告排序艺术


我是谷育龙Eric,研究方向有深度学习、搜索推荐,喜欢为大家分享深度学习在搜索推荐广告排序应用的文章。CIKM作为信息检索、数据挖掘等领域的国际一流会议,每年都有很多搜索推荐广告领域的精彩论文。近日,CIKM 2020于10月19-23日在线上召开,工业界搜索推荐广告的算法又取得了什么新进展呢?本文和大家分享下Alibaba, JD, Tencent, Baidu, Huawei, Amazon, Google, Microsoft, LinkedIn, Yahoo等互联网公司的线上算法技术。

公众号【夕小瑶的卖萌屋】后台回复 【CIKM2020】 可打包下载本文相关paper和CIKM论文集。

Matching (召回)

[1] 2020 (Microsoft) (CIKM) TwinBERT: Distilling Knowledge to Twin-Structured Compressed BERT Models for Large-Scale Retrieval

作者:Wenhao Lu, Jian Jiao and Ruofei Zhang

在召回阶段,如何根据Query、用户状态等,召回最相关的item?Microsoft在这篇论文里提出基于知识蒸馏和Bert的检索模型,来解决大规模召回问题。

[2] 2020 (JD) (CIKM) Decoupled Graph Convolution Network for Inferring Substitutable and Complementary Items

作者:Yiding Liu, Yulong Gu, Zhuoye Ding, Junchao Gao, Ziyi Guo, Yongjun Bao and Weipeng Yan

相似相关关系挖掘,是推荐系统召回阶段最重要的问题。GNN在挖掘图中的节点关系任务上取得了state-of-the-art的效果,但一般的GNN为每个节点学习一个embedding,无法很好的建模节点的多种特性、节点间的多种关系。JD这篇论文里,提出为每一个节点学习两个embedding,同时建模、联合学习相似相关两种关系,巧妙地解决了这个问题。

[3] 2020 (Amazon) (CIKM) P-Companion : A Principled Framework for Diversified Complementary Product Recommendation

作者:Junheng Hao, Tong Zhao, Jin Li, Xin Luna Dong, Christos Faloutsos, Yizhou Sun and Wei Wang

互补(或相关)商品推荐在电商中具有重要的作用,Amazon这篇论文提出基于GNN的模型,同时建模考虑了互补商品推荐时的相关性和多样性问题。

Ranking (排序)

[4] 2020 (JD) (CIKM) Deep Multifaceted Transformers for Multi-objective Ranking in Large-Scale E-commerce Recommender Systems

作者:Yulong Gu, Zhuoye Ding, Shuaiqiang Wang, Lixin Zou, Yiding Liu and Dawei Yin

在排序阶段,用户多种行为序列如何更精细化地建模、多任务如何更好的共同学习、如何解决Bias问题?JD这篇论文给出了工业界实用高效的解决方案。

相似的排序模型,在淘宝搜索、推荐 [37] 等场景,同样取得了很好的线上效果。搜索和推荐排序模型,共同的特性是:给定user和context (搜索中主要关注query, 推荐中主要关注长短期行为),给待排序item打分,不同点在于:在推荐中通常使用待排序item做target attention,在搜索中通常使用user和query做target attention,而且搜索中行为序列构造时可以只需要选取和query预测类目相同的历史行为。

[5] 2020 (Alibaba) (CIKM) Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction

作者:Qi Pi, Xiaoqiang Zhu, Guorui Zhou, Yujing Zhang, Zhe Wang, Lejian Ren, Ying Fan and Kun Gai

CTR预测中通常考虑用户近期的行为,Alibaba介绍了如何通过从用户长期行为搜索最相关的行为,来更完整地建模用户的兴趣。

[6] 2020 (Alibaba) (CIKM) MTBRN : Multiplex Target-Behavior Relation Enhanced Network for Click-Through Rate Prediction

作者:Yufei Feng, Fuyu Lv, Binbin Hu, Fei Sun, Kun Kuang, Yang Liu, Qingwen Liu and Wenwu Ou

CTR模型在建模用户行为序列时,通常使用序列行为建模embedding信息。Alibaba的这篇论文,介绍了如何利用item-item相似关系图、知识图谱等信息,来更好地建模item间更丰富多样的关系。

[7] 2020 (Alibaba) (CIKM) Deep Time-Aware Item Evolution Network for Click-Through Rate Prediction

作者:Xiang Li, Chao Wang, Bin Tong, Jiwei Tan, Xiaoyi Zeng and Tao Zhuang

已有的论文通常考虑user下item的行为序列,Alibaba这篇论文里,介绍了如何考虑每个item下最近交互的用户和时间信息,来更好地建模item的动态变化特性(例如新款爆品),实现CTR预测。

[8] 2020 (Alibaba) (CIKM) Personalized Flight Itinerary Ranking at Fliggy

作者:Jinhong Huang, Yang Li, Shan Sun, Bufeng Zhang and Jin Huang

旅行网站搜索如何做?Alibaba这篇论文介绍了飞猪搜索排序中如何利用attention机制,建模context信息、输入间的关系以及同时考虑个人和群组的行为。

[9] 2020 (Linkedin) (CIKM) Efficient Neural Query Auto Completion

作者:Sida Wang, Weiwei Guo, Huiji Gao and Bo Long

Query自动补全,作为搜索的入口,对用户体验至关重要。Linkedin这篇论文,介绍了如何在召回和排序中建模context信息、query的深度语义信息。

[10] 2020 (Twitter) (CIKM) Relevance Ranking for Real Time Tweet Search

作者:Yan Xia, Yu Sun, Tian Wang, Juan Manuel Caicedo Carvajal, Jinliang Fan, Bhargav Mangipudi, Lisa Huang and Yatharth Sar

相关性是搜索中的重要任务,Twitter场景下时效性很强,query和item变化都非常迅速,加大了相关性任务的挑战性。这篇论文介绍了Twitter多阶段相关性排序的系统。

[11] 2020 (Huawei) (CIKM) Ensembled CTR Prediction via Knowledge Distillation

作者:Jieming Zhu, Jinyang Liu, Weiqi Li, Jincai Lai, Xiuqiang He, Liang Chen and Zibin Zheng

Huawei这篇论文介绍了在知识蒸馏中,使用多个Teacher网络,学习得到更好的student CTR模型。

[12] 2020 (LinkedIn) (CIKM) DeText : A Deep Text Ranking Framework with BERT

作者:Weiwei Guo, Xiaowei Liu, Sida Wang, Huiji Gao, Ananth Sankar, Zimeng Yang, Qi Guo, Liang Zhang, Bo Long, Bee-Chung Chen and Deepak Agarwa

BERT是非常强大的文本建模模型,但对于线上要求低延迟的场景来说模型过于复杂。LinkedIn这篇论文介绍了如何构造一个有效的基于BERT的搜索排序模型。

Post-ranking(重排序)

重排序阶段,如何考虑多样性等问题,生成更好的Top-K结果?

[13] 2020 (Alibaba) (CIKM) EdgeRec: Recommender System on Edge in Mobile Taobao

作者:Yu Gong, Ziwen Jiang, Yufei Feng, Binbin Hu, Kaiqi Zhao, Qingwen Liu and Wenwu Ou

推荐系统如何做到在端上实时响应用户反馈,对结果重排序?Alibaba这篇Awesome的论文给出了非常精彩的解决方案,在线上取得了很好的效果。

[14] 2020 (Huawei) (CIKM) Personalized Re-ranking with Item Relationships for E-commerce

作者:Weiwen Liu, Qing Liu, Ruiming Tang, Junyang Chen, Xiuqiang He and Pheng Ann Heng

对于重排序问题,Huawei这篇论文将item的表示成一个异构图,提出一个基于GNN的框架,来建模item的关系、用户的个性化意图等信息。

Graph Neural Networks

[15] 2020 (Tencent) (CIKM) Graph Neural Network for Tag Ranking in Tag-enhanced Video Recommendation

作者:Qi Liu, Ruobing Xie, Lei Chen, Shukai Liu, Ke Tu, Peng Cui, Bo Zhang and Leyu Lin

腾讯微信在这篇文章提出基于GNN的tag排序模型,将user, video, tag关系建模为一个异构图,然后在基于transformer, GraphSAGE和FM进行节点聚合,在微信看一看视频推荐中取得了很好的效果。

Transfer Learning

[16] 2020 (Google) (CIKM) Zero-Shot Heterogeneous Transfer Learning from Recommender Systems to Cold-Start Search Retrieval

作者:Tao Wu, Ellie Ka-In Chio, Heng-Tze Cheng, Yu Du, Steffen Rendle, Dima Kuzmin, Ritesh Agarwal, Li Zhang, John Anderson, Sarvjeet Singh, Tushar Chandra, Ed Chi, Wen Li, Ankit Kumar, Xiang Ma, Alex Soares, Nitin Jindal and Pei Cao

如何借助推荐系统的物品间的关系,解决搜索中的冷启动、长尾问题?Google的这个工作,是搜索、推荐共同学习的一个很好的起点。

[17] 2020 (Alibaba) (CIKM) MiNet : Mixed Interest Network for Cross-Domain Click-Through Rate Prediction

作者:Wentao Ouyang, Xiuwu Zhang, Lei Zhao, Jinmei Luo, Yu Zhang, Heng Zou, Zhaojie Liu and Yanlong Du

实际推荐系统中,通常有多个域,跨域推荐系统如何共同学习?Alibaba这篇论文给出了实用巧妙的解决方案,获得了best paper的提名。

[18] 2020 (Alibaba) (CIKM) Improving Multi-Scenario Learning to Rank in E-commerce by Exploiting Task Relationships in the Label Space

作者:Pengcheng Li, Runze Li, Qing Da, An-Xiang Zeng and Lijun Zhang

搜索系统中,通常有多个场景。Alibaba这篇论文提出了在跨境电商中,基于MMoE思想,学习一个通用的模型,同时服务多个场景的搜索,取得了更好的效果,同时具备方便部署、减少成本的优势。

[19] 2020 (Rakuten) (CIKM) Learning to Profile : User Meta-Profile Network for Few-Shot Learning

作者:Hao Gong, Qifang Zhao, Tianyu Li, Derek Cho and Duykhuong Nguyen

Rakuten在这篇论文里,提出了基于Few-shot Learning的用户画像学习,用于电商场景。

Reinforcement Learning

[20] 2020 (Baidu) (CIKM) Whole-Chain Recommendations

作者:Xiangyu Zhao, Long Xia, Lixin Zou, Dawei Yin, Jiliang Tang and Hui Liu

这篇MSU和Baidu的论文,介绍了如何利用基于multi-agent的强化学习来优化推荐系统的多个场景,实现整体最优,对强化学习在推荐系统中的应用具有很好的启示作用。

[21] 2020 (Amazon) (CIKM) Learning to Rank in the Position Based Model with Bandit Feedback

作者:Beyza Ermis, Patrick Ernst, Yannik Stein and Giovanni Zappella

Amazon在这篇论文扩展了经典的contextual bandit算法,考虑了位置点击模型解决bias问题,来优化个性化推荐。

User Profiling (用户画像)

[22] 2020 (Tencent) (CIKM) Learning to Build User-tag Profile in Recommendation System

作者:Su Yan, Xin Chen, Ran Huo, Xu Zhang and Leyu Lin

用户画像是搜索推荐广告的重要基石,腾讯微信在这篇论文中,将用户的tag profiling问题看成一个multi-label分类问题,并使用multi-head attention和改进的基于FM特征交叉模型,应用到微信看一看。

更多精彩内容

[23] 2020 (Alibaba) (CIKM) A Deep Prediction Network for Understanding Advertiser Intent and Satisfaction. Liyi Guo, Rui Lu, Haoqi Zhang, Junqi Jin, Zhenzhe Zheng, Fan Wu, Jin Li, Haiyang Xu, Han Li, Wenkai Lu, Jian Xu and Kun Gai

[24] 2020 (Alibaba) (CIKM) Multi-Channel Sellers Traffic Allocation in Large-scale E-commerce Promotion. Shen Xin, Yizhou Ye, Martin Ester, Cheng Long, Jie Zhang, Zhao Li, Kaiying Yuan and Yanghua Li

[25] 2020 (Alibaba) (CIKM) Spending Money Wisely : Online Electronic Coupon Allocation based on Real-Time User Intent Detection. Liangwei Li, Liucheng Sun, Chenwei Weng, Chengfu Huo and Weijun Ren

[26] 2020 (Didi) (CIKM) Masked-field Pre-training for User Intent Prediction. Peng Wang, Jiang Xu, Chunyi Liu, Hao Feng, Zang Li and Jieping Ye

[27] 2020 (eBay) (CIKM) Intent-Driven Similarity in E-Commerce Listings. Gilad Fuchs, Yoni Acriche, Idan Hasson and Pavel Petrov

[28] 2020 (Huawei) (CIKM) U-rank : Utility-oriented Learning to Rank with Implicit Feedback. Xinyi Dai, Jiawei Hou, Qing Liu, Yunjia Xi, Ruiming Tang, Weinan Zhang, Xiuqiang He, Jun Wang and Yong Yu

[29] 2020 (LinkedIn) (CIKM) Incorporating User Feedback into Sequence to Sequence Model Training. Michaeel Kazi, Weiwei Guo, Huiji Gao and Bo Long

[30] 2020 (Meituan) (CIKM) Query-aware Tip Generation for Vertical Search. Yang Yang, Junmei Hao, Canjia Li, Zili Wang, Jingang Wang, Fuzheng Zhang, Rao Fu, Peixu Hou, Gong Zhang and Zhongyuan Wang

[31] 2020 (Microsoft) (CIKM) AutoADR : Automatic Model Design for Ad Relevance. Yiren Chen, Yaming Yang, Hong Sun, Yujing Wang, Yu Xu, Wei Shen, Rong Zhou, Yunhai Tong, Jing Bai and Ruofei Zhang

[32] 2020 (Netease) (CIKM) Personalized Bundle Recommendation in Online Games. Qilin Deng, Kai Wang, Minghao Zhao, Zhene Zou, Runze Wu, Jianrong Tao, Changjie Fan and Liang Chen

[33] 2020 (Pingan) (CIKM) Learning Effective Representations for Person-Job Fit by Feature Fusion. Junshu Jiang, Songyun Ye, Wei Wang, Jingran Xu and Xiaosheng Luo

[34] 2020 (Yahoo) (CIKM) Learning to Create Better Ads : Generation and Ranking Approaches for Ad Creative Refinement. Shaunak Mishra, Manisha Verma, Yichao Zhou, Kapil Thadani and Wei Wang

[35] 2020 (Yahoo) (CIKM) Prospective Modeling of Users for Online Display Advertising via Deep Time-Aware Model. Djordje Gligorijevic, Jelena Gligorijevic and Aaron Flores

[36] CIKM 2020完整论文集合:https://dl.acm.org/doi/proceedings/10.1145/3340531。

[37] Chen, Qiwei, Huan Zhao, Wei Li, Pipei Huang, and Wenwu Ou. "Behavior sequence transformer for e-commerce recommendation in alibaba." DLP-KDD 2019.

我是谷育龙Eric,研究方向有深度学习、搜索推荐,喜欢为大家分享深度学习在搜索推荐广告排序应用的文章。欢迎大家到我的公众号“深度学习排序艺术”进行更多交流。

公众号【夕小瑶的卖萌屋】后台回复 【CIKM2020】 可打包下载本文相关paper和CIKM论文集。

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

有顶会审稿人、大厂研究员、知乎大V和妹纸

等你来撩哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479643.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

复杂风控场景下,如何打造一款高效的规则引擎

| 在互联网时代,安全已经成为企业的命脉。美团信息安全团队需要采用各种措施和手段来保障业务安全,从而确保美团平台上的用户和商户利益不会受到侵害。 本文主要介绍了美团在打造自有规则引擎Zeus(中文名“宙斯”)的过程中&#x…

Android消息队列图片记录

很早之前为了给学生讲明白整个消息队列是怎么个情况,于是大概阅读了一下消息队列的整个工作过程,鉴于网上大部分都是文字说明,没有一个图例,于是做出了下面这张图,权当作以后复习之用,也供大家学习参考&…

Git使用教程:最详细、最傻瓜、最浅显、真正手把手教!

原文连接:https://blog.csdn.net/u011535541/article/details/83379151 转载自 Git使用教程 预警:因为详细,所以行文有些长,新手边看边操作效果出乎你的预料)一:Git是什么? Git是目前世界上最先…

主动学习入门篇:什么是主动学习?有哪些具体应用

文 | 淘系技术部 初类来源 | 知乎在大数据和算力的助力下,深度学习掀起了一波浪潮,在许多领域取得了显著的成绩。以监督学习为主的深度学习方法,往往期望能够拥有大量的标注样本进行训练,模型能够学到更多有价值的知识&#xff08…

LeetCode 59. 螺旋矩阵 II LeetCode 54. 螺旋矩阵

文章目录1. 题目信息2. LeetCode 59 解题3. LeetCode 54. 螺旋矩阵4.《剑指Offer》面试题291. 题目信息 给定一个正整数 n,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的正方形矩阵。 示例:输入: 3 输出: [[ 1, 2, 3 ],[ 8, 9, 4 ],[ 7…

如何查看Activity任务栈以及dumpsys_activity命令的简要使用及介绍

今天看到淘宝客户端的某个页面效果,效果是在两个Activity中做动画,为了知道究竟是不是在同一个Activity中做的效果,就必须采取一种手段来知道是不是同一个Activity.描述一下这个动画效果:列表页面点击图片,图片会滑动到…

论文浅尝 | 基于微量资源的神经网络跨语言命名实体识别

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。来源:EMNLP 2018链接:https://www.aclweb.org/anthology/D18-1034问题背景与动机本文关注小语种/资源匮乏语言的跨语言命名实体识别问题&#xff0…

美团命名服务的挑战与演进

| 本文根据美团基础架构部技术专家舒超在2019 ArchSummit(全球架构师峰会)上的演讲内容整理而成。 命名服务主要解决微服务拆分后带来的服务发现、路由隔离等需求,是服务治理的基石。美团命名服务(以下简称MNS)作为服务…

NeurIPS 2020 | 自步对比学习:充分挖掘无监督学习样本

文 | 葛艺潇源 | PaperWeekly本文介绍一篇我们发表于 NeurIPS-2020 的论文《Self-paced Contrastive Learning with Hybrid Memory for Domain Adaptive Object Re-ID》,该工作提出自步对比学习框架及混合记忆模型,旨在解决无监督及领域自适应表征学习中…

Postman安装与使用

原文链接:https://blog.csdn.net/fxbin123/article/details/80428216 一、Postman背景介绍 用户在开发或者调试网络程序或者是网页B/S模式的程序的时候是需要一些方法来跟踪网页请求的,用户可以使用一些网络的监视工具比如著名的Firebug等网页调试工具。…

LeetCode 35. 搜索插入位置(二分查找)

文章目录1. 题目信息2. 解题2.1 暴力遍历2.2 二分查找1. 题目信息 给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。 你可以假设数组中无重复元素。 示例 1:输入…

青年人在美团是怎样成长的?

2020年五四青年节,我们采访了美团技术团队9位青年代表,他们是来自清华大学、北京大学、中国科学院大学等国内高校的2位博士研究生和7位硕士研究生。在这个属于青年人的特别的日子里,我们请他们分享了自己在美团成长的故事。 道阻且长&#xf…

它来了它来了!2020深度学习硬核技术干货集锦!

这份干货来自于今天要给大家推荐的一个深度学习与计算机视觉领域知名公众号:「极市平台」。从2016年创立至今,极市平台深耕于DL与CV领域,输出300篇高质量原创文章,并积累了近10万名海内外专业算法开发者。极市平台公众号坚持每日更…

容器的使用和创建虚拟环境 vitualenv

xshell jupter容器的使用方法 #容器相当于子服务器 1 创建指定python版本的虚拟环境 方法1: 1.安装虚拟环境的第三方包 venv pip install venv 2.创建虚拟环境 cd 到存放虚拟环境的地址 在当前目录下创建名为env的虚拟环境: python -m venv env python…

Android中动态的更改selector中某张图片的属性

在我们平常开发的时候会有许多状态按钮,比如state_pressed,android:state_checked,或者就正常状态等等,我们做这样的效果通常需要三个文件,一张是按下的图片,一张是正常状态的图片,一张是管理它…

LeetCode 17. 电话号码的字母组合(回溯)

文章目录1. 题目信息2. 解题1. 题目信息 给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。 给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。 示例:输入:"23" 输出:[&…

细数一行代码改变结局的炼丹骚操作

文 | 陀飞轮&圈圈&年年的铲屎官源 | 知乎tips总结知乎答主:陀飞轮谈一下自己知道的。尽量避开优化器、激活函数、数据增强等改进。。先上完整列表:Deep Learning: Cyclic LR、FloodingImage classification: ResNet、GN、Label Smoothing、Shuff…

推荐收藏 | 美团技术团队的书单

4月23日对于世界文学而言是一个具有象征性意义的日子。1616年的这一天,塞万提斯、莎士比亚、印卡加西拉索德拉维加几位大师相继与世长辞。此外,这一天也是其他一些著名作家的出生和去世的日期,例如:莫里斯德吕翁、哈尔多尔K拉克斯…

论文浅尝 | 采用多层注意力机制的事件检测

笔记整理:杨帆,浙江大学计算机学院硕士,研究方向知识图谱。动机事件编码(event encoding)之前的工作集中在提取实体,检测触发单词以及匹配预定义的模板,这些方法存在以下缺点:首先它…

无需人工!无需训练!构建知识图谱 BERT一下就行了!

文:Sherry今天给大家带来的是一篇号称可以自动建立知识图谱的文章《Language Models are Open Knowledge Graphs》,文中提出了一个叫Match and Map(MAMA)的模型,无需人工!无需训练!只需语料和预…