数据驱动精准化营销在大众点评的实践

精准化营销一直以来都是互联网营销业务在细分市场下快速获取用户和提高转化的利器。在移动互联网爆发的今天,数据量呈指数增长,如何在移动和大数据场景下用数据驱动进行精准营销,从而提高营销效能,成为营销业务部门的主要挑战之一,同时也是大数据应用的一个重要研究方向。本文通过数据体系架构和技术实现案例,分享美团大众点评数据应用团队在这个方向上的一些尝试和实践经验。

在介绍数据体系和框架前,为了方便大家理解,先简单阐述一下O2O营销的基本组成:O2O营销是由营销发生的渠道(站内,站外)与营销的主题业务(流量,交易)两个维度组成的,其中产生了多种营销的形态,如精准化用户营销活动、DSP的精准投放、渠道价值排名和反作弊等,数据分析和挖掘在这些环节都能发挥很大的价值。本文主要阐述站内的精准化用户营销活动。

一个站内用户运营活动的生命周期大概可以归纳为:确定目标、选取活动对象、设计活动方案、活动配置与上线、线上精准营销与动态优化以及效果监控与评估六个环节。如下图所示。

![](https://awps-assets.meituan.net/mit-x/blog-images-bundle-2016/53da52cb.png)

在这个周期中,数据都有巨大的发挥空间与价值。我们在项目启动后与业务充分沟通,了解其业务痛点,确定一期主要尝试从数据上帮助运营和财务同事解决以下几个问题: ① 营销活动前:确定目标和选取活动对象 ② 营销活动中:效果监控和跟踪;用户和商户端策略的输出 ③ 营销活动后:效果评估和优化建议

对于①的目标确定,以前更多是拍脑袋决定,缺乏一套稳定的分析框架和模型。而活动对象,包括用户和商户/团单选取,需要业务和BI同学每次人工跑数据得出,效率低下。 而对②和③,更是缺乏一套公司的营销监控平台,时常出现预算花超不可控的情况。活动结束后,效果数据也是各个业务方自己给出,口径不一致导致难以整体评估效果。

基于上述的业务场景和需求,我们用分层的金字塔架构设计了一套营销数据系统和服务,有效满足了业务的诉求并具有很好的平台扩展性。

result

最底层是我们的数据仓库和模型层,这里又大致可以分为三个主题:画像,运营和营销,流量。这三个都是运营活动必不可少的数据组成部分。 对于画像,我们的做法是部分自主建设,同时集成业务方如搜索、广告和风控团队开发的画像标签,形成统一的画像宽表。目前我们的用户标签体系覆盖了包括:基本信息、设备信息、消费浏览以及特征人群等5个大类的180多个标签。在标签的实现上,我们也秉承从需求出发的原则逐步迭代,从最初的以统计和基本的营销模型如RFM为主,到现在在潜在用户挖掘和用户偏好上开始探索使用机器学习的挖掘方法。

result

在营销运营集市上,我们与财务和支付系统协作,开发了一套公司预算流水号系统。运营人员在配置活动时,从财务申请预算流水号,并在优惠后台配置与对应活动关联,用户享受优惠的每一笔订单都会在业务表中进行打点,做到在最细粒度上的预算监控。同时在用户、商品等维度建模后,形成了营销交易评估的指标体系:新用户成本,新老用户分布,7天、30天购买留存等。

活动评估的另一个维度就是流量:活动页的点击、转化漏斗、不同渠道来源等指标是运营人员无时无刻不关心的,这部分模型作为数据中心数据仓库中核心的一环。我们参考了其他公司的做法,建立了自己的PV、UV、Session以及路径树转化等模型,可以很好地满足运营需求。

在数据仓库之上,我们建立了数据服务层。在统一使用公司高性能的RPC框架之上,针对不同的应用选择了差异化的数据存储和查询引擎。比如在画像服务中,需求是满足线上业务系统的实时访问需求,要求毫秒级的并发和延迟,因此我们选用了Redis作为存储。而相较之下,分析类产品对并发和延迟要求相对较低,但对数据在不同维度上的聚合操作要求较高,在对比了Kylin、ElasticSearch(以下简称ES)、Druid后,我们决定使用ES作为存储和查询引擎,主要有2个理由:一是我们有留存等指标,需要重刷数据,而对于Kylin来说,无法使用其提供的自动增量cube机制,重建数据代价较大,同时ES在同样的维度上,空间膨胀度上比Kylin少近一半;二是ES整个系统设计和架构非常简洁,运维方案简单,也有专门的工具支持,对于当时没有专职运维的开发团队来说是一个捷径。

最上层是数据产品和应用,针对前面提到的运营活动的不同阶段提供数据平台和工具: * 人群分析平台(Hoek):用户可以通过选择画像服务提供的不同的标签组合快速创建人群包,创建的人群包可以提供给其他不同业务和形态的营销工具,如push,促销工具等。* 智能发券引擎(Cord):通过配置后台和Hoek平台,运营人员就可以完成定向活动受众和策略的配置,而无需开发接入。具体细节在后面的案例分享中再详细介绍。* 云图/星图:完成活动效果数据查询和分析的工具平台,构建基于ES的查询引擎,提供多维度的实时指标查询。

除了系统化的建设外,在运营活动的迭代中,我们与业务合作,进行了大大小小20多个专题分析,产出了包括闪惠预算动态分配、闪惠立减梯度优化、用户价值分以及免费吃喝玩乐选单等主题模型。帮助业务提高预算使用率30%,同时更好地评估拉新带来的用户价值。

整体的架构最终是为精准化营销服务,下面就结合两个案例具体介绍。

案例分享

外卖潜在用户挖掘

精准营销一个主要的方向就是潜在客户挖掘,特别是在点评这个平台上,目前已有包括美食、外卖、丽人、教育等近20个业务,如何在平台近一亿的活跃用户中挖掘垂直频道的潜在用户就成了精准化营销的一个很现实的问题。Facebook和腾讯的广告系统都提供类似的Lookalike功能,帮助客户找出和投放人群相似的用户群,其广告的点击率和转化率都高于一般针对广泛受众的广告。

目前常用的潜在用户挖掘方案主要就是基于画像或者关系链的挖掘,我们团队从需求出发,结合点评的画像体系从关联规则、聚类和分类模型三个算法上进行了探索。对比效果如下:

![](https://awps-assets.meituan.net/mit-x/blog-images-bundle-2016/c2159255.png)

未来我们除了在分类和聚类上进一步优化外,还计划利用点评好友关系,使用Spark的GraphX建立标签传播的算法进一步深挖高质量的相似用户。

微信红包精准优惠券引擎

另外一个精准营销的案例是智能发券引擎Cord,背景是点评会在微信群/朋友圈中用红包发各种优惠券,当好友来领券时,如何决定发哪个业务什么面值的券更容易转化。本质上是一个简化的推荐问题,我们也参照广告系统的架构设计了Cord引擎。主要包含分流模块(用于灰度发布和AB测试)、召回模块(负责从画像服务和优惠配置系统获取人和券的物料信息)、过滤模块(负责进行两者的匹配)、推荐模块(可以根据业务规则或者我们挖掘的策略对结果进行排序,返回給活动系统最合适的优惠券进行发放)。整个系统实现完全服务化和可配置化,外部的活动系统可以根据配置的开关启用或者在特殊场景下禁用Cord服务;而Cord内部,也可以根据配置中心的设置,动态调整推荐策略。在数据挖掘上,目前除了业务配置规则外,我们针对公司主流的运营方式,基于画像中的用户偏好和优惠敏感等标签进行综合打分,抽象了以GMV为目的和以拉新用户为目的的推荐策略。

精准营销是目前大数据落地的一个公认的场景,但随着移动互联网和O2O的发展,这一领域也会有新的问题和挑战出现。结合我们这一年多的实践经验,团队也归纳了一套数据系统架构的设计原则: * 在数据架构和建设上,从需求出发,建立准确和易用的数据底层模型,统一指标体系和口径。 * 在数据服务上,通过分层和SOA的思想,解耦与业务系统的逻辑。同时针对不同需求和场景选择适合的技术组件。

展望未来,在数据上如何快速地进行挖掘模型的开发,在架构和产品上满足更多场景,让数据在营销上发挥更大的价值,是下一步的重点方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478055.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1104. 二叉树寻路(数学位运算)

1. 题目 在一棵无限的二叉树上,每个节点都有两个子节点,树中的节点 逐行 依次按 “之” 字形进行标记。 如下图所示,在奇数行(即,第一行、第三行、第五行……)中,按从左到右的顺序进行标记&am…

再介绍一篇最新的Contrastive Self-supervised Learning综述论文

文 | 对白源 | 对白的算法屋自监督学习(Self-supervised learning)最近获得了很多关注,因为其可以避免对数据集进行大量的标签标注。它可以把自己定义的伪标签当作训练的信号,然后把学习到的表示(representation&#…

论文浅尝 | 重新审视语言模型与知识库的关系

笔记整理:陈卓,浙江大学在读博士,主要研究方向为低资源学习和知识图谱论文链接:https://arxiv.org/pdf/2106.09231发表会议:ACL 2021动机这篇文章类似于是批判性的文章,反驳的之前EMNLP2019的一篇文章knowl…

Spark在美团的实践

本文已发表在《程序员》杂志2016年4月期。 前言 美团是数据驱动的互联网服务,用户每天在美团上的点击、浏览、下单支付行为都会产生海量的日志,这些日志数据将被汇总处理、分析、挖掘与学习,为美团的各种推荐、搜索系统甚至公司战略目标制定提…

LeetCode 958. 二叉树的完全性检验(层序遍历)

1. 题目 给定一个二叉树,确定它是否是一个完全二叉树。 百度百科中对完全二叉树的定义如下: 若设二叉树的深度为 h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第 h 层所有的结点都连续集中在…

论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答

笔记整理:陈永锐,东南大学博士论文链接:https://arxiv.org/pdf/2101.03737.pdf概述该论文处理多跳知识库问答(KBQA)任务,主要关注训练过程在中间步骤缺乏监督信号的挑战。由于这一挑战,多跳 KBQ…

打破情感分类准确率 80 分天花板!更加充分的知识图谱结合范式

文 | SeverusNLP的研究者们一直都在尝试,怎么样让模型像人类一样,学会“知识”。而最直观的想法莫过于将人类已经总结出来供机器解读的“知识体系”,及其嵌入表示作为额外的特征添加到NLP模型之中。至少,从直觉上看,将…

分布式块存储系统Ursa的设计与实现

引言 云硬盘对IaaS云计算平台有至关重要的作用,几乎已成为必备组件,如亚马逊的EBS(Elastic Block Store)、阿里云的盘古、OpenStack中的Cinder等。云硬盘可为云计算平台带来许多优良特性,如更高的数据可靠性和可用性、灵活的数据快照功能、更…

LeetCode 919. 完全二叉树插入器(层序遍历队列)

1. 题目 完全二叉树是每一层(除最后一层外)都是完全填充(即,结点数达到最大)的,并且所有的结点都尽可能地集中在左侧。 设计一个用完全二叉树初始化的数据结构 CBTInserter,它支持以下几种操作…

开源开放 | 中文相对复杂词汇识别数据集RCWI-Dataset(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/rcwi-dataset开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:北京语言大学(阙孟溪、张宇飞、于东)1. 摘要中文领域的词汇复杂度评估资源较为匮乏&#x…

提升 NLP 实战技能的一点建议

作为最典型的 AI 领域之一,NLP 这些年也是越来越热门,基本上是各大厂必备了。随着 OpenAI 等技术的诞生、迁移学习等技术的成功应用,使得 NLP 技术在搜索、推荐、信息流、互联网金融、社交网络等领域不断发展壮大。与此同时,NLP 工…

深入FFM原理与实践

FM和FFM模型是最近几年提出的模型,凭借其在数据量比较大并且特征稀疏的情况下,仍然能够得到优秀的性能和效果的特性,屡次在各大公司举办的CTR预估比赛中获得不错的战绩。美团技术团队在搭建DSP的过程中,探索并使用了FM和FFM模型进…

LeetCode 993. 二叉树的堂兄弟节点(层序遍历)

文章目录1. 题目2. 解题2.1 层序遍历2.2 递归查找1. 题目 在二叉树中,根节点位于深度 0 处,每个深度为 k 的节点的子节点位于深度 k1 处。 如果二叉树的两个节点深度相同,但父节点不同,则它们是一对堂兄弟节点。 我们给出了具有…

论文浅尝 | IRW:基于知识图谱和关系推理的视觉叙事框架

笔记整理:孙悦,天津大学 链接:https://www.aaai.org/AAAI21Papers/AAAI-3382.XuC.pdf动机视觉叙事是生成一个短篇故事来描述有序图像流的任务。与视觉字幕不同,故事不仅包含事实描述,还包含未出现在图像中的想象概念。…

薅羊毛 Colab使用外部数据的7种方法!

文 | Coggle源 | Coggle数据科学Colab作为非常强大且优惠的计算平台,一直广受大家喜爱。可以随时随地使用,还有免费的GPU可以薅羊毛。那么如何在Colab中使用外部数据集,来完成竞赛呢,本文将给出几种常见的方法。方法1:…

高可用性系统在大众点评的实践与经验

背景 所谓高可用性指的是系统如何保证比较高的服务可用率,在出现故障时如何应对,包括及时发现、故障转移、尽快从故障中恢复等等。本文主要以点评的交易系统的演进为主来描述如何做到高可用,并结合了一些自己的经验。需要强调的是&#xff0c…

图灵奖大佬+谷歌团队,为通用人工智能背书!CV 任务也能用 LM 建模!

文 | ZenMoore编 | 小轶图灵奖大佬 Geoffrey Hinton 的团队和 Google Brain 团队近日发布新工作 Pix2seq,将 CV 经典任务 目标检测 转换为了语言模型的下游任务。这就很有意思了朋友们!因为这是一个很一般化的范式!也就是说,不光是…

论文浅尝 | 异构图 Transformer

笔记整理:许泽众,浙江大学博士在读论文链接:https://arxiv.org/abs/2003.01332本文主要提出一种处理异构图的方法,所谓异构图(Heterogeneous graph)是指在一个图中会出现不同类型的边和节点的图。早期对于图…

LeetCode 1145. 二叉树着色游戏(计算节点个数)

1. 题目 有两位极客玩家参与了一场「二叉树着色」的游戏。游戏中,给出二叉树的根节点 root,树上总共有 n 个节点,且 n 为奇数,其中每个节点上的值从 1 到 n 各不相同。 游戏从「一号」玩家开始(「一号」玩家为红色&a…

常见的时间序列预测模型python实战汇总

最完整的时间序列分析和预测(含实例及代码):https://mp.weixin.qq.com/s/D7v7tfSGnoAqJNvfqGpTQA 1 时间序列与时间序列分析 在生产和科学研究中,对某一个或者一组变量 x(t)x(t) ARIMA 模型对时间序列的要求是平稳型。因此&#x…