实时数仓Hologres首次走进阿里淘特双11

简介:这是淘特在阿里巴巴参与的第二个双11大促,大促期间累计超过上千万消费者在此买到心仪的商品,数百万家商家因为淘特而变得不同,未来,淘特也将会继续更好的服务于下沉市场,让惠民走近千万家。

2021年11月11日23:59:59,阿里巴巴淘特(淘宝特价版)的第二个双11完美落下帷幕。在双11大促期间,淘特历经多个大促爆发高峰,丰富的权限玩法,各类高性价比货品,大促期间累计超上千万人在淘特买到质美价廉的商品。本次双11大促中,淘特无论是流量、买家还是订单数都创下新的记录,交出了完美答卷,这也意味着,阿里巴巴在下沉市场开始斩露头角。

业务简介与面临的问题

淘特(原淘宝特价版)定位为消费者带来低价且有质量的源头好货,目前仍然处于用户快速增长的阶段,其中三方线上广告投放具有规模效应大,行业成熟度高等特点,是平台用户引流的重要渠道。

在淘特为期30多天的双促期间(双10,双11),市场竞争尤为激烈,渠道投放策略的及时优化调整是保障获量与控本的重要手段。同时针对下沉用户偏好简单的玩法独特区域性货盘的特点,平台需要创新研发各类简单易于理解的营销玩法,和相应的站内流量分发机制,促使更多的用户可以边玩边买。

由于本次大促具有时间长与高爆发两个特点,在这个过程中,我们面临这这么几个问题:

  1. 流量低价获客:线上广告创意规模大,但拉新拉活效果成本参差不齐。但因为不同时间波段流量差异大,如何通过探索式分析,快速定位问题广告或者挖掘新机会,为大促提供持续稳定的高质量流量成为了优化师们进行投放优化的首要问题。
  2. 极简营销玩法:大促新上各类营销玩法,营销玩法的效果需要实时监控。如何实时多维分析,帮助业务进行实现不同场景的不同效果分析,最终反哺业务实现大促交易目标。
  3. 货商高效汰换:货品是电商的核心,超长大促周期下,会场同学需要进行会场货品调优,行业同学需要通过货品类目进行供给调整,还有风控、商家管理等多个角色,均需要通过对单商单品的精准强控。其中如何通过实时聚合排序,及时对低效能货品的汰换,避免流量与转化效率的错配。

解决方案

围绕淘特双10&双11,基于上述在流量投放优化、营销玩法多维分析,品商实时排序等面临的业务问题下,我们构建了一套基于实时数仓Hologres的统一数据服务系统,从流量、玩法、货品全方面监控数据,支持业务在大促期间的精细化运营诉求。

下面分别从三方面内容讲述淘特在这一领域的实践。

淘特1.png

优化投放持续低价获客

场景介绍和特点:广告投放场景偏探索分析,具有查询频率中,查询复杂程度高,对延迟容忍度相对较高等特点。分析师需要从一纵一横两个视角进行投放优化,一横即可以从广告创意到广告组、计划、账户、代理、媒体等不同颗粒度。一纵即从展示、点击、消耗的前链路数据到激活、新登、唤端、下单、支付等后链路数据。再叠加时间维度进行分析与优化。

实现方案:考虑到上卷与下钻维度非常多,且查询不固定,无法采用预计算模式,因此我们选择围绕最细颗粒度广告创意进行加工,将各类维度属性冗余成标签,前后链路的效果作为指标,存储在Hologres上,将分析师在投放中心上的优化的查询逻辑转变为基于明细数据的再筛选、聚合、加工的方案。

挑战与优化:探索式灵活分析,复杂查询,对Hologres都会产生较大的性能压力,我们主要考虑了存储优化选择分布列索引优化三种种优化方式。

  1. 在存储方式上,由于外投中心的使用场景是以范围查询、单表聚合为主,所以选用列存的存储方式。
  2. 此外由于分布列将文件组分成不同shard,然后优先在各shard内执行join和group by操作,所以选用了常用的关联键和聚合维度account_id, campaign_id, adgroup_id, agent, creative_id。
  3. 在索引优化上,根据不同索引方式我们选用了不同的字段作为key来优化查询速度。首先是选用了creative_id作为聚簇列,适用于范围查询和筛选所用字段。使用比特编码索引在聚簇后进一步进行文件内位图索引,适用于等值查询条件,所以选择了creative_id, account_id, campaign_id, adgroup_id, agent等常用于等值查询的字段。最后是分段键,该索引是用于标识文件边界,常用的是非空时间戳,这里我们选择用的是stat_date。

通过上述系列优化使得最终98%以上的通过投放平台过来的探索式分析查询可以在3s内完成。

业务收益:该数据产品在目标三方广告投放运营、产品中覆盖度100%,运营通过该平台快速高效的定位并解决包括异常掉量、消耗过高等问题计划数日均几十+,使得投放侧的优化效率整体提升50%以上。同时还帮助运营能够快速的找到增量价值渠道等。

权益玩法促用户成交转化

场景介绍和特点:营销玩法投放在包含新人、互动、裂变等不同的场域中,玩法的引导效果还与货盘强相关,交叉模式以及看数用数指标相对固定,且相对比较高频。

实现方案:我们在实时计算Blink中通过直接产出CUBE表,写入Hologres中,基于该CUBE表搭建数据报表。

淘特2.png

业务收益:大促期间通过效果数据针对玩法进行了10+优化,如通过玩法X场域,为跨店满减会场新增购物车入口,快速满足用户的凑单需求;官方补贴的氛围链路透传提升转化率等,帮助行业顺利完成目标。

商品商家汰换高效分发流量

场景介绍与特点:运营小二为了能够在大促期间对商品与商家进行监控与汰换,就需要有细颗粒的查询监控,同时由于商品会关注在活动中的各个会场的特色指标表现,且部分活动存在跨多天的情况,所以多日累积的数据也是运营决策的重要参考。

实现方案:我们选择在实时计算Blink引擎中,完成对最细颗粒度的商品-人的计算,并将相关活动指标打横,写入Hologres。在报表层,根据运营的筛选条件进行跨天的汇总到商品、商家粒度的聚合排序。单个分区日志数据商品-人达到了2亿左右数据规模,通过索引、分布列等的优化基本可以满足单表的各类查询。

挑战与优化:实时离线的数据存在一定GAP,在多日的周期下,差异累积放大,导致影响业务的决策判断,另一方面大促期间人力开发资源紧张,如果用离线数据进行覆盖,成本额外增加一倍。在此背景下,引入了流批一体的技术方案,使用Hologres进行统一存储与计算,并且通过Blink Batch实现了实时离线共用同一套代码,计算逻辑统一,大幅度降低了重复开发与后续运维成本。

淘特3.png

业务收益:品/商多维度实时排行覆盖行业运营、会场运营小二,通过选品汰换在几百家会场帮助消费者买到心仪商品,并针对挖掘出的潜力商家,及时的给予流量扶持,整体大促期间超过几百万商家完成动销。

业务总结

这是实时数仓Hologres首次走进淘特的双11大促,在大促期间,Hologers在流量洪峰的压力下,以99.8%响应支撑力多个促销活动的顺利开展。数据同学只需要加工最明细数据,便能通过Hologres构建灵活多维的查询应用,整体的研发效率提升在40%以上(单场景平均5人日下降至3人日),同时部分原本需要由在线Blink作业的数据计算,转变为了查询时再计算的模式,整体计算资源预计有20%左右的减少

这是淘特在阿里巴巴参与的第二个双11大促,大促期间累计超过上千万消费者在此买到心仪的商品,数百万家商家因为淘特而变得不同,未来,淘特也将会继续更好的服务于下沉市场,让惠民走近千万家。

原文链接
本文为阿里云原创内容,未经允许不得转载。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511797.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cluster 集群能支撑的数据有多大?

作者 | 码哥字节来源 | 码哥字节本文将对集群的节点、槽指派、命令执行、重新分片、转向、故障转移、消息等各个方面进行深入拆解。目的在于掌握什么是 Cluster ?Cluster 分片原理,客户端定位数据原理、故障切换,选主,什么场景使用…

All in one:如何搭建端到端可观测体系

简介:一文看懂可观测! 作者:西杰 & 白玙 可观测的前生今世 系统的可观测与故障可分析作为系统运维中重要的衡量标准,随着系统在架构、资源单位、资源获取方式、通信方式演进过程,遇到了巨大挑战。而这些挑战&am…

链路分析 K.O “五大经典问题”

简介:链路分析是基于已存储的全量链路明细数据,自由组合筛选条件与聚合维度进行实时分析,可以满足不同场景的自定义诊断需求。 作者:涯海 链路追踪的 “第三种玩法” 提起链路追踪,大家会很自然的想到使用调用链排查…

Kubernetes 上容器的启动顺序如何把控?

作者 | AddoZhang来源 | 云原生指北为什么要做容器启动顺序控制?我们都知道 Pod 中除了 init-container 之外,是允许添加多个容器的。类似 TektonCD 中 task 和 step 的概念就分别与 pod 和 container 对应,而 step 是按照顺序执行的。此外还…

一文说清linux system load

简介:双十一压测过程中,常见的问题之一就是load 飙高,通常这个时候业务上都有受影响,比如服务rt飙高,比如机器无法登录,比如机器上执行命令hang住等等。本文就来说说,什么是load,loa…

KubeDL 0.4.0 - Kubernetes AI 模型版本管理与追踪

简介:欢迎更多的用户试用 KubeDL,并向我们提出宝贵的意见,也期待有更多的开发者关注以及参与 KubeDL 社区的建设! 作者:陈裘凯( 求索) 前言 KubeDL 是阿里开源的基于 Kubernetes 的 AI 工作负…

上云一时爽,遇坑泪两行

如今,企业的数字化转型进程已经进入了“快车道”,各行各业基于自身业务发展与变革的需要,为整体数字化转型带来了更多要求。企业纷纷依托云原生、低代码、大数据、人工智能等技术手段积极加入这场没有硝烟的战争。 对于传统企业而言&#xf…

读研期间一定得看论文吗_读研期间各阶段的目标和任务,你明确吗?

读研期间一般都要经历上课、论文材料的收集、论文的开题、发表小论文、毕业论文的答辩、找工作或考博士等几个关键环节。在校期间,我们不仅要完成以上的全部工作,还需要不断地学习正确的价值观和人生观,学会科学的思考。如何让自己的研究生生…

Spring Boot Serverless 实战系列“架构篇” | 光速入门函数计算

简介:如何以 Serverless 的方式运行 Spring Boot 应用? 作者:西流(阿里云函数计算专家) Spring Boot 是基于 Java Spring 框架的套件,它预装了 Spring 一系列的组件,开发者只需要很少的配置即可…

从 “香农熵” 到 “告警降噪” ,如何提升告警精度?

简介:ARMS 智能降噪功能依托于 NLP 算法和信息熵理论建立模型,从大量历史告警事件中去挖掘这些事件的模式规律。当实时事件触发后,实时为每一条事件打上信息熵值与噪音识别的标签,帮助用户快速识别事件重要性。 作者:…

AI 机器学习如何不被底层资源和数据“拉胯”,听听亚马逊云科技怎么说

编辑 | 宋慧 出品 | CSDN 云计算 在人工智能从爆火到普及应用之后,数据分析今年又一次被技术界广泛关注,热度再次到达高点。 分析与咨询机构也纷纷发表与数据相关的报告,德勤在刚刚发布的《 2022年度技术趋势 》中,第一个趋势即是…

Flow vs Jenkins 实操对比,如何将Java应用快速发布至ECS

简介:Jenkins 由于其开源特性以及丰富插件能力,长久以来都是中小企业搭建 CICD 流程的首选。不过 Jenkins 存在维护成本高、配置复杂等缺点,云效 Flow 较好地解决了这些问题。 本文从一个 Java 应用部署到云服务器(ECS&#xff09…

CSS 中的简写到底有多少坑?以后不敢了...

作者 | 零一来源 | 前端印象简写(语法糖)可能给我们编码带来了很多便利,但简写也会带来一些问题,今天来讨论一下 CSS 中的简写的"爱恨情仇"为什么说是爱恨情仇呢?因为简写给我们带来了很多的便利&#xff0c…

智能巡检云监控指标的实践

简介:在真实的企业生产中,对研发和运维的同学都会面临一个十分繁复且艰难的问题,就是对指标的监控和告警。具体我枚举一些特定的问题请对号入座,看看在算力爆炸的时代能否通过算力和算法一起解决! 背景介绍 在真实的…

新常态成型,飞连联手Forrester聚焦数字化办公新体验

随着互联网技术不断发展,在企业办公领域时间与空间的限制正在逐步消弭。但是,当企业面对内外部大量的不确定因素时,以往的办公模式无论是效率、安全性还是体验等各方面都将大打折扣。而在数字时代,混合办公模式则有望成为企业办公…

聊聊我们在业务链路升级中做的数据洞察

简介:关于数据相关的词条很多,虽然有不同的定义,但是本质上是相辅相成,通常结合使用才能拿到结果。类比词条诸如 数据分析,数据挖掘, 数据洞察。本文将聊聊我们在业务链路升级中做的数据洞察。 作者 | 金铎…

阿里云佘俊泉:创新探索不停,边缘云持续为客户创造价值

简介:在12月15日上午举办的分布式云领袖论坛中,阿里云边缘云产品负责人佘俊泉先生发表了《阿里云边缘云产品创新与场景探索》的主题演讲,分享了阿里云在边缘云领域的探索和思考,如何从产品演进、技术创新、场景应用等方面助力企业…

oracle 如何迁移到 mysql_怎么将数据库从Oracle迁移到SQL Server,或从Oracle迁移到MySQL...

有时候我们有迁移数据库的需求,例如从Oracle迁移到SQL Server,或者从MySQL迁移到Oracle。很多江湖好汉一时不知如何手工操作,所幸的是Navicat提供了迁移的自动化操作界面。当然,Navicat的数据库迁移无法做到完美,一些依…

深度解析单线程的 Redis 如何做到每秒数万 QPS 的超高处理能力!

作者 | 张彦飞allen来源 | 开发内功修炼服务器端只需要单线程可以达到非常高的处理能力,Redis 就是一个非常好的例子。仅仅靠单线程就可以支撑起每秒数万 QPS 的高处理能力。今天我们就来带大家看看 Redis 核心网络模块的内部实现,学习下 Redis 是如何做…

阿里云李克:边缘云技术发展与实践

简介:7年磨砺,阿里云边缘云的技术积累和沉淀哪了些?今年全面升级后的技术形态具有什么特性?它可以成熟地赋能哪些商业化技术应用场景?阿里云资深技术专家李克带来分享。 备受关注的2021全球分布式云大会深圳站于12月1…