数字营销行业大数据平台云原生升级实战

简介: 加和科技CTO 王可攀:技术是为业务价值而服务

王可攀.jpeg

王可攀 加和科技CTO

本文将基于加和科技大数据平台升级过程中面临的问题和挑战、如何调整数据平台架构以及调整后的变化,为大家介绍数字营销行业大数据平台云原生升级实战经验。主要分为以下三个部分。

  • 加和简介
  • 加和的大数据服务挑战
  • 加和大数据平台升级

一、加和简介

加和科技于2014年创立,2015年搭建自己的技术服务,整个的服务模式为品牌广告客户,现在也涉及到主要有营销需求的客户提供营销的技术解决方案。

(1)   加和服务模式

以下是加和科技对接的媒体方和数据方。

加1.png

加和服务模式是把所有的媒体流量形成一个管道,当客户需要在不同的媒体之间做联合的控频,比如说同一个用户在优酷上看到一个广告,在爱奇艺上又看到一次广告,客户希望用户只看到三次广告。加和科技可以做一个跨平台的管控,同时客户希望有第三方的挑选和监控,就和其他的服务商协作,为客户提供一个广告的服务。

(2)   加和数据规模

加和科技数据量级增长的非常迅速,最开始的时候流量可能还不如一个中小型的媒体,上个月峰值达到800亿的请求。数据的复杂度也比较高,每一个请求都带着相应的广告的信息,每一个请求里面有近百个相关的维度需要处理。每天日均触达的达到5亿+次,全年上线的活动5000+,服务100+品牌的客户。

加2.png

二、加和的大数据服务挑战

(1)   服务场景的挑战

随着体量的增大,遇到一些问题和痛点:

一是数据量级大,服务运算复杂。服务的量级很大,这个量级每天都要去实时,需要分析或者是查找。客户在一定的时间范围内做活动信息的归纳,或者是跨媒体的去重的处理。

二是客户需求多变,需求复杂度大。客户的需求也是多变的,服务的客户分析的数据的维度非常多,每一个媒体用户不同标签属性上去做拆分去重,并不是统一化的需求,所以需要在大数据的范围内对这些需求进行处理。

三是计算量起伏大,峰值难以预估。随着客户的需求而走,整个计算的量级起伏也会比较大。客户有一波紧急的投放,会导致很多的媒体的流量都包下来,导致在短期的流量峰值会非常高。如果客户这段时间没有下单,量级也会相应的有些下降,服务成本和能力之间需要一个弹性支持的。

四是服务保障要求高。从媒体到请求,把信息发给第三方或者是流量监控的平台,再回来,最终把决策好要给用户产生什么样的素材,整个过程在100毫秒之内完成,要考虑多次的网络延时和计算的延时。如果产生一些数据的错误,会对客户的服务造成很大的影响。

(2)   自建大数据架构

加和科技选择自建的服务平台,数量级没那么大的时候选择了一款商用数据库去做整体的数据的支持。加和科技的服务体系一直在阿里云上面,但是数据库选择了一个商用数据库。当时也是平衡人员成本和服务的性能的要求,在复杂的分析的体系之下,商用数据库的性能还是比自己搭建的集群要好很多,而且相应的服务器成本也会更低。

加3.png

当时的数据来源主要是从ECS获得的一些日志,对数据实时性要求不高,更多的是离线分析。所以一开始用的是把日志做压缩,然后定时汇总到的数据集群去做处理的方式。再利用Kafka收集合作方的相关数据的信息,整合到业务报表后给客户呈现。

历史数据是存在OSS 上面,另外一个自研的BI 是用于展示对应的复杂数据报表,结果支持一些自主自拖拽的分析。从成本考虑,简化了数据分析的部分,利用小时级别的这种离线数据,再加上Redis 的缓存数据,去做了在线统计的模块。

(3)   历史架构服务痛点

历史结构有很多痛点,随着业务增长、数据量增长,出现了越来越多的问题。

首先,是计算弹性差。数据量不大的情况下,商用数据群还是可以比较快的做一些扩缩容。负载越大越难扩展、 应对突发故障困难、增减资源耗时不可控整,就会对业务造成拖累。如果出现服务器发生故障,整体的业务就会产生很大的影响。

其次,是数据管理很复杂。历经多年后,形成了很多中间表,数据难以划分、调控复杂度高、业务之间依赖高、 任务资源争抢,中间的逻辑关系很难梳理的。在计算中又产生一些资源消耗,就进一步加剧了对弹性的需求。

再次,是特定场景效率低。服务的场景经常用到大规模的数据交集,涉及对大量数据交集的查询。单一的数据引擎在某些场景下很快的,但在一些特定场景下效率不高,因为把数据都放在同样的集群里面去,所以它的效率会受比较大的影响。

最后,是计算消耗难以预估。这个从业务角度考量,成本不可控、 计算任务难以和业务打通,很难为客户提供一个标准化、可视化服务。

三、 加和大数据平台升级

(1)   升级后架构

调整最重要的环节在整个计算引擎的部分,把数据搬迁到了MaxCompute的平台上面,用DataWorks去做数据的调度和管理。 MaxCompute的使用带来了大幅的灵活性提升。

使用云环境扩缩容是比较方便的,计算的资源和存储的资源都获得了保障。也可以把原来的数据表做更好的分区分表的管理,可以看清楚这些数据怎样用,在中间的关系是怎样的,可以做更好的业务流程的管理。

加4.png

在搬迁的时候,MaxCompute不支持这种开源的调度,后来是联合阿里云的一块开发,最终支持调用MaxCompute的任务的方式。变化比较大的是自研的BI2.0模块,之前的服务模块是自拖拽的一个产品,发现有的客户不会拖拽,这种方式也是难以接受的,现在改善成自动生成报表服务。这个服务目前看起来可以让客户大幅用起来,数据查询的数量会大幅的提升。

(2)   架构调整效果-数据方面

架构调整的效果,最显著的是数据方面。首先是日均用户数量有很大量的提升,从原来的每年的几百个实时的请求上升到几千个,一部分的耗时很高的任务通过MaxCompute也得到了解决。以前部分高耗时任务等待时间非常长,现在时间缩减5倍。以前整个资源的调整时间平均大概72小时左右,现在可能都不到半小时的时间,这是云带来的能力。

加5.png

(3)   云原生大数据平台对加和的价值总结

最后,做了架构调整之后带来的一些变化,从几个角度来说:

一是响应业务需求能力提升。业务需求服务能力大幅提升,单次服务成本降低。业务成本可预估,提升业务服务效率;

二是服务稳定性和韧性提升。大幅降低资源调整耗时和难度、特定计算场景的耗时大幅下降;

三是数据团队能力转型。一方面从业务运维转化为业务推动,另一方面从数据分析转向机器学习;

四是扩展新应用场景。流程自动化和任务管理自动化、技术栈和业务的服务的持续优化。

加6.png

总体来说,技术决策者,我们并没有用到很多复杂的开源技术,优化服务架构的时候,更多的考量是我们的业务弹性,和人员组成。作为技术决策者和技术从业者,更多关注技术供应链,依赖阿里云提供成熟的技术,我们的团队得以专注于解决业务问题,更多去灵活的组合市场上现有的技术,然后快速地支撑我业务的发展。这样专业化分工,专业的人做专业的事,让我们的团队可以更好地为客户服务。

原文链接
本文为阿里云原创内容,未经允许不得转载。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/512083.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

场景模型驱动自动化测试在盒马的探索及实践

简介: 盒马业务有如下几个特点:线上线下一体化、仓储配送一体化、超市餐饮一体化、经营作业一体化、多业态与平台化。在以上的种种原因,生鲜及物流体验是盒马的特点,但仓储配送一体化作业中,如何能更高效的提升测试效率…

基于 KubeVela 的 GitOps 交付

简介: KubeVela 是一个简单、易用、且高可扩展的云原生应用管理和交付平台,KubeVela 背后的 OAM 模型天然解决了应用构建过程中对复杂资源的组合、编排等管理问题,同时也将后期的运维策略模型化,这意味着 KubeVela 可以结合 GitOp…

BCS2022大会将提前至5月 网络安全产业空间扩容将成热门话题

年度网络安全的盛会即将开启。 2022年3月30日,2022年北京网络安全大会(BCS2022)新闻发布会在北京奇安信安全中心召开,宣布2022年北京网络安全大会“提档”至5月24日至26日,并与北辰集团国家会议中心达成战略合作&#…

基于 Istio 的全链路灰度方案探索和实践

简介: 本文介绍的基于“流量打标”和“按标路由” 能力是一个通用方案,基于此可以较好地解决测试环境治理、线上全链路灰度发布等相关问题,基于服务网格技术做到与开发语言无关。同时,该方案适应于不同的7层协议,当前已…

图像检索在高德地图POI数据生产中的应用

简介: 高德通过自有海量的图像源,来保证现实世界的每一个新增的POI及时制作成数据。在较短时间间隔内(小于月度),同一个地方的POI 的变化量是很低的。 作者 | 灵笼、怀迩 来源 | 阿里技术公众号 一 背景 POI 是 Poin…

Redis HyperLogLog 是什么?这些场景使用它~

作者 | 就是码哥呀来源 | 码哥字节在移动互联网的业务场景中,数据量很大,我们需要保存这样的信息:一个 key 关联了一个数据集合,同时对这个数据集合做统计。统计一个 APP 的日活、月活数;统计一个页面的每天被多少个不…

matlab三角形分割,MATLAB 2014b及以上版本中带有画家渲染器的三角形拆分补丁

在解决实际问题之前,这是一个值得怀疑的解决方法:对角线只是三角形之间的空白区域,所以我们看到的是补丁后面的白色空间.愚蠢的想法:让我们用匹配的颜色填充该空间而不是白色.为此,我们将复制所有对象,并通过一个tiiiiny位来抵消新对象.码:hi…

网易云音乐音视频算法的 Serverless 探索之路

简介: 网易云音乐最初的音视频技术大多都应用在曲库的数据处理上,基于音视频算法服务化的经验,云音乐曲库团队与音视频算法团队一起协作,一起共建了网易云音乐音视频算法处理平台,为整个云音乐提供统一的音视频算法处理…

小小的 likely 背后却大有玄机!

作者 | 张彦飞allen来源 | 开发内功修炼今天我给大家分享一个内核中常用的提升性能的小技巧。理解了它对你一定大有好处。在内核中很多地方都充斥着 likely、unlikely 这一对儿函数的使用。随便揪两处,比如在 TCP 连接建立的过程中的这两个函数。//file: net/ipv4/t…

阿里云马涛:因云进化的基础软件

简介: 基础软件的云原生化。 编者按:2021 年10 月20 日,在2021 云栖大会云计算产业升级峰会上,阿里云“因云而生”云原生心智大图正式发布,包含弹性计算、云网络、基础产品、基础设施、操作系统、云安全、开放平台等7个…

阿里云ECI如何6秒扩容3000容器实例?

简介: 2021年云栖大会现场,阿里云工程师演示了在6秒时间内成功启动3000个ECI,并全部进入到Running状态。本文将为你揭开阿里云ECI是如何做到极速扩容的。 引言 根据最新CNCF报告,有超过90%的用户在生产环境使用容器,…

巧用友盟+U-APM 实现移动端性能优化—启动速度

简介: 移动端性能对用户体验、留存有着至关重要的影响,作为开发者是不是被这样吐槽过,“这个 APP 怎么这么大?”、“怎么一直在 APP 封面图转悠,点不进去”、“进入详情效果有些卡”、“用 4G 使用你们的 APP&#xff…

第25版 OpenStack Yoga 已发布

OpenStack社区今日正式发布第25版-Yoga,该版本通过支持先进的硬件技术如SmartNIC DPUs,优化与云原生软件如Kubernetes、Prometheus等的集成以及减少技术债等方式来保持OpenStack内核的稳定性与可靠性。 OpenStack作为开源基础设施即服务(Iaa…

项目实战总结以及接入U-APM

简介: 导致 App 性能低下的原因有很多,除去设备硬件和软件的外部因素,其中大部分是开发者错误地使用线、系统函数、编程范式、数据结构等导致的。即便是较有经验的程序员,也很难在开发时就能避免所有导致性能低下的“坑”&#xf…

oracle redo 200mb,Oracle的redo log在各场景下的恢复

Oracle的redo log非常重要,redo log损坏将导致数据库开法开启或数据丢失,针对redo log在各种场景下如何打开或恢复数据库,特别模拟测试说明:各场景包括如下(共6个场景):场景一.非归档下inactive状态的redo 恢复场景二.非归档下act…

站在原地就是退步——除了死磕通道,云通讯服务商还该做些什么?

受访嘉宾:吴佳钊,杭州云片网络科技有限公司联合创始人、CTO 当前,全球通信云已经步入2.0时代,最大的变化在于通信形式的变革:传统短信语音的通信形式将逐步向包括即时通讯IM实时音视频RTC的互联网通信转变。尤其在5G时…

Cube 技术解读 | 详解「支付宝」全新的卡片技术栈

简介: 魔方卡片(Cube),让 App 首页实现敏捷更新。 CodeHub#7 正式落幕,来自蚂蚁集团的技术专家「京君」与掘金社区的开发者们分享了「支付宝」全新的卡片技术栈——魔方卡片(Cube)。 京君围绕 C…

庖丁解InnoDB之REDO LOG

简介: 数据库故障恢复机制的前世今生一文中提到,今生磁盘数据库为了在保证数据库的原子性(A, Atomic) 和持久性(D, Durability)的同时,还能以灵活的刷盘策略来充分利用磁盘顺序写的性能,会记录REDO和UNDO日志,即ARIES方…

Web 自动化神器,批量下载美图,可直接导入使用

‍‍作者 | 小碗汤来源 | 进击云原生今天为大家分享一款前端自动化操作神器: Automa。Automa介绍它是一款 Chrome 插件,即使你不会写代码,也能按照自己的需求,完成一系列自动化操作。利用它,你可以将一些重复性的任务实现自动化、…

RocketMQ 5.0 POP 消费模式探秘

简介: POP Consumer—使客户端无状态,更轻量! 作者:凯易&耘田 前言:随着 RocketMQ 5.0 preview 的发布,5.0 的重大特性逐步与大家见面。POP Consumer 作为 5.0 的一大特性,POP 消费模式展现…