客如云数据中台建设

简介: 本次分享介绍客如云如何利用阿里云大数据产品来建设数据中台。 客如云是2012年成立的一家公司,覆盖餐饮、零售、美业,还有其他的业态以及服务的一家综合性的SaaS公司。到2020年为止,客如云已经服务了60万商家,帮助60万商家实现了数字化、智能化的改造,接下来我们会覆盖更多的商家。

 

客如云技术总监 李浩

本次分享介绍客如云如何利用阿里云大数据产品来建设数据中台。
客如云是2012年成立的一家公司,覆盖餐饮、零售、美业,还有其他的业态以及服务的一家综合性的SaaS公司。到2020年为止,客如云已经服务了60万商家,帮助60万商家实现了数字化、智能化的改造,接下来我们会覆盖更多的商家。


目前客如云是四中心的架构,我们的研发中心在成都,硬件研发中心在深圳,总部在北京,销售中心在武汉。接下来主要介绍我们的业务范围:客如云是以软硬一体的SaaS收银服务为核心的,所以SaaS收银系统的硬件和软件是我们第一层,是我们的效率工具。第二层,我们和餐饮、零售的友商企业一起打造的人、财、物、客的生态系统。第三层,我们利用增值服务,比如营销、供应链、人效、商业智能、金融服务,还有大数据的应用,去满足各层级的商家的需求。从S1到S5,所有的大小品牌我们是全覆盖的。我们的愿景是帮助客户,帮助商家实现店开天下,客如云来,而我们从中能够更好的服务于商家,帮助商家提效降本,去获得更多的营收,降低更多的成本。
目前客如云整体的系统全部建设在阿里云的服务之上,保证了在较少的资源的情况下,支撑我们现在成为平台级的公司。


接下来介绍一下,我们如何利用阿里云的产品来进行数据中台建设的。大家都知道阿里巴巴的数据中台是3个One的核心,One ID,One Data,One Service。在基础设施的完善之上,首先我们要做到数据集成,所以我们利用了阿里云的DataHub、DataWorks、DTS等产品,把我们的业务数据统一到我们的Hadoop集群里面,然后我们现在再迁移到我们的MaxCompute里面,利用大数据的产品来进行整个数据仓库的建设。MaxCompute帮助我们实现了整个离线数据的计算和存储,包括数仓空间的建设,然后我们利用PAI建设了我们的算法中心和机器学习的样板,利用Flink的技术打造了实时计算的平台。我们在这些实时计算和离线计算的基础之上,建立了统一的查询服务。利用阿里云的Hologres产品,实现了我们的一体式查询的One Service的理念。

在这个基础上,我们保证了我们整个的数据应用,包含我们内部的数据应用,BI的产品,还有外部的数据应用,大屏,还有报表,还有整个的算法,智能推荐、精准营销等这块的整个的实现,建立了我们客如云的数据中台,然后快速的满足了我们的内部用户和外部用户的数据需求。


接下来我们再讲一下,在这个过程中,我们如何利用阿里云的产品来帮助解决我们的哪些痛点问题?

首先我们看到的是我们原先是自建的Hadoop集群,难以维护,因为成本很高。我们经过了一年的努力,把整个Hadoop集群换成了MaxCompute,这样的效果很明显,我们的运维成本降低了1倍,计算速度增加了8倍,保证了我们快速交付ETL等计算处理的能力,给到业务线来使用。

第二个问题,我们遇到了很多数据安全的问题,自建的Hadoop集群没办法做数据审计,所以我们用到了阿里云的敏感数据保护产品SDDP,来进行数据的分级分类,保护我们的产品,实现数据的零泄漏。同时我们自建的Presto集群做交互式查询时和我们的MaxCompute又不能相互融合,我们调研了以后发现Hologres的产品,相对来讲比Presto性能更好一些,所以我们用Hologres的产品代替了Presto,保证了我们可以直接从MaxCompute里查询,使整个交互实现了无缝对接。接着我们遇到了一些数据模型,数据建模的产品,目前还在调研Dataphin产品,实现整个的数据模型的建设。

我们最大的痛点是实时大屏的性能问题,这个时候我们发现用Flink的技术,再加上QuickBI能解决我们的前端和后端的问题。接下来我们以实时大屏为核心,来介绍一下我们怎么样应用的,然后怎么样解决掉这个问题的。


数据大屏我们遇到的难点第一个是我们的数据源太多了,我们用到了MySQL、 RDS、MongoDB、Redis、ES等多种数据来源,我们要把这些数据来源统一的汇聚,解决掉我们的数据源多的问题。第二个是我们的大屏性能方面,现在我们数据量特别大,然后样式又特别多,需求特别复杂,这个时候怎么样去解决掉这个问题。接着是看到这些需求,生成这些数据后,如何快速的在前端展示,这也是一个很大的问题。所以我们在调研QuickBI产品的时候,发现确实是能够解决我们这方面的问题。


我们再来看一下我们是如何解决掉问题的。第一个问题,我们其实主要还是要做数据的治理,源数据的管理,血缘关系,甚至是一些多数据源的处理,减少我们的现有的集群。第二个问题,因为数据量大,现在各类企业其实有着海量的数据,需要解决快速查询的问题,方案就是我们利用阿里云的实时计算平台,基于Flink开源技术,解决了我们整个的查数据速度的问题。我认为整个的阿里云的Flink技术确实是能够更快的查询到想查询的海量的数据,它的性能和高扩展性我们确实是得到了体验,我觉得在这块领域阿里云还是名列第一的。而在整个大数据前端这块,我们发现的问题是渲染慢。但是我们用QuickBI自定义拖拽,快速地去定义数据源,导入到不同的框标里面,可以快速的查询出来。


上面是解决了一些问题,接下来介绍客如云的实时计算平台是怎么样的架构。我们通过4个层,基础数据层,实时计算层、接口层和展示层来架设我们的实时计算平台。重点讲一下我们的实时计算层,计算层这块其实我们有一些需求,不单是当天的数据,比如说商家要看这个月现在为止我们的营业额是多少,他不但需要当天的数据,还需要从8月1号到现在为止,所有的数据。所以它会体现到我们不但要有流表的接入,还要有维表的接入,还要有聚合计算,从而形成了一个数据流。多流的汇聚,实现了我们在接口层的调用的情况下,展示层能够展示到我们当天能满足商家每个维度的需求的数据,就像我举的那个例子一样,能够看到当月到现在为止它的营业额是多少,这样的一个场景。所以说我们实时计算的平台主要是为了满足业务各方面的需求。


接下来分享一下实际应用的场景。我们已经帮着一些菜市场实现了数据大屏。这块的展示主要是当天的销量是什么,哪个销量最好,这样能够帮助商家了解第二天进什么货更合适。这个大屏的应用实际上已经是能够帮助商家在实际的生活场景里面得到很好的体验。


餐饮实时大屏是基于我们现有的数据,展示了一下我们中国餐饮大数据的一些情况,但这是只是代表一部分客人的数据。当然这里面可以说客人的规模越来越大,我们做的也会越来越好,我们就可以展示出来到底中国人民喜欢点什么菜,哪个菜是最好吃的,大家喜欢什么样的口味,我们都可以通过我们的实时数据计算,通过数据挖掘来发现出来。


BI应用主要是为内部客户使用,我们的运营团队、销售团队、研发团队还有其他团队,能够保证我们整个的在数据的分析运营和辅助决策里面起到很大的作用,节省很多的管理层的成本和时间。利用我们的BI产品,可以解决这样的需求。

总结一下主要介绍的三点,一个是客如云是干什么的?客如云是要帮助我们的餐饮、零售、美业的商家,实现店开天下、客如云来的愿景的SaaS公司。第二点是客如云如何利用阿里云的大数据产品来建设客如云的数据中台。第三点是客如云如何利用实时大屏、我们的商家画像产品以及其他大数据应用产品,来赋能商家。

原文链接

本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/513638.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微博机器学习平台云上最佳实践

简介: 本文讲述了微博机器学习平台和深度学习平台的业务功能和云上实践,剖析了阿里云大数据在微博这两大学习平台的架构建设上所起到的作用。 作者:新浪微博数据计算平台系统架构师 曹富强 本文讲述了微博机器学习平台和深度学习平台的业务功…

搞懂异地多活,看这篇就够了

来源:水滴与银弹作者:Kaito阅读本文大约需要 20 分钟。你好,我是 Kaito。在软件开发领域,「异地多活」是分布式系统架构设计的一座高峰,很多人经常听过它,但很少人理解其中的原理。异地多活到底是什么&…

搭建一个微服务商城到底可以有多快?

简介: 极速部署一个微服务电商商城,体验 Serverless 带给您的应用全托管体验。 作者:云原生技术运营 - 望宸 技术实践的门槛不仅在于应用上线后各类问题的排查难度,也在于搭建一个 Demo 应用时的复杂度。 今天我们尝试 3 种方法来…

分享2种规划思维和4个规划方法

简介: 为结果买单,为过程鼓掌。 作者:不拔 每年各个部门都要进行规划,规划能让目标更聚焦,让我们清晰地知道今后我们要做什么、如何去做。并非每个人都会参与规划中去,但需要掌握规划的方法,否…

apache 统计404日志_Apache监控与调优(四)Apachetop监控

除了使用status监控外,还可以使用第三方软件来监控。现在使用的最多的第三方监控软件是apachetop。虽然我们使用status也可以监控到很多信息,但是对于一些统计信息来说,例如统计哪些URL的访问量最大,不同状态码下分别有多少个HTTP…

揭秘 | 2021年移动云API大赛决赛大奖花落谁家?

10月21日,2021年移动云API应用创新开发大赛决赛暨移动云开发者论坛,在苏州圆满举办。现场,移动云开发者社区重磅发布首批MVP名单,同时公布2021年API创新开发大赛决赛获奖名单。中国移动、英特尔、CSDN、PingCAP、各参赛团队等技术…

冷热分离之OTS表格存储实战

简介: 为什么要冷热分离由于2020疫情的原因,在线教育行业提前被大家所重视,钉钉教育已经服务超过21万所学校、700万教师和1.4亿学生用户,每天大量的教育数据产生。整体数据量:随着时间的积累,数据量越来直大…

世界地图可以无限放大_不敢相信!世界地图,你竟然骗了我这么多年...

本文转载自微信公众号:中国国家地理(ID:dili360)原文首发于2018年10月13日,标题为《世界地图,我竟然被你骗了这么多年!》不代表FM93交通之声观点。都说眼见为实,其实眼见到的也不一定为实相信你们很多人都以为世界就像…

WebAssembly + Dapr = 下一代云原生运行时?

简介: 云计算已经成为了支撑数字经济发展的关键基础设施。云计算基础设施也在持续进化,从 IaaS,到容器即服务(CaaS),再到 Serverless 容器和函数 PaaS (fPaaS 或者 FaaS),新的计算形态相继出现。…

Service Mesh 开源实现之 Istio 架构概览

来源:无敌码农作者:无敌码农今天的文章将从更宏观的概念和架构入手,来全面介绍Istio这一最著名的服务网格开源解决方案,以求从整体上将Istio实现服务网格的核心原理阐述清楚!Istio中的关键概念要学习Istio需要先明确以…

mysql外键约束分数_MySQL提高(外键约束)

外键约束1.条件语句的写法在sql中可以通过where 条件语句 来对操作对象进行筛选 -筛选a.比较运算符&#xff1a;&#xff0c;<>,,<,>注意&#xff1a;判断一个字段的值是否为空不用使用和<>&#xff0c;而是使用is null和is not nullselect number from t_co…

Java Map中那些巧妙的设计

简介&#xff1a; 他山之石可以攻玉&#xff0c;这些巧妙的设计思想非常有借鉴价值&#xff0c;可谓是最佳实践。然而&#xff0c;大多数有关Java Map原理的科普类文章都是专注于“点”&#xff0c;并没有连成“线”&#xff0c;甚至形成“网状结构”。因此&#xff0c;本文基于…

java json转xml_关于JSON与XML的区别比较

现在互联网上&#xff0c;最流行的两大传输数据的标准就是json和XML了&#xff0c;关于谁是最好的&#xff0c;一直以来都是人们争论的话题&#xff0c;其实各有各的缺点和优点&#xff1b;1.定义介绍(1).XML定义扩展标记语言 (Extensible Markup Language, XML) &#xff0c;用…

揭秘!阿里实时数仓分布式事务Scale Out设计

简介&#xff1a; Hybrid Transaction Analytical Processing(HTAP) 是著名信息技术咨询与分析公司Gartner在2014年提出的一个新的数据库系统定义&#xff0c;特指一类兼具OLTP能力&#xff08;事务能力&#xff09;和OLAP能力&#xff08;分析能力&#xff09;的数据库系统。 …

mysql对本地文件的读取_Mysql 任意读取客户端文件

load data infile "/etc/passwd" into table test FIELDS TERMINATED BY \n;实现&#xff1a;Mysql Server会读取服务端的/etc/passwd&#xff0c;然后将其数据按照\n分割插入表中&#xff0c;但现在这个语句同样要求你有FILE权限&#xff0c;以及非local加载的语句也…

使用了12个月的苹果 M1 芯片,我发现了它的「致命」弱点

作者 | Attila Vg译者 | 弯月出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;首先&#xff0c;我仍然相信苹果 M1 的芯片在技术上取得了巨大的飞跃&#xff0c;再次站在了创新的最前沿&#xff0c;然而一旦新鲜感消失之后&#xff0c;裂痕就会慢慢显现&#xff0c;…

spi 动态加载、卸载_理解 ServiceLoader类与SPI机制

对于Java中的Service类和SPI机制的透彻理解&#xff0c;也算是对Java类加载模型的掌握的不错的一个反映。了解一个不太熟悉的类&#xff0c;那么从使用案例出发&#xff0c;读懂源代码以及代码内部执行逻辑是一个不错的学习方式。一、使用案例通常情况下&#xff0c;使用Servic…

探秘RocketMQ源码——Series1:Producer视角看事务消息

简介&#xff1a; 探秘RocketMQ源码——Series1&#xff1a;Producer视角看事务消息1. 前言 Apache RocketMQ作为广为人知的开源消息中间件&#xff0c;诞生于阿里巴巴&#xff0c;于2016年捐赠给了Apache。从RocketMQ 4.0到如今最新的v4.7.1&#xff0c;不论是在阿里巴巴内部还…

三大院士、十大数据库掌门人,岳麓对话开启数字经济新时代!

10月23日&#xff0c;第二届“长沙 中国1024程序员节”在湖南长沙盛大开幕。大会以“开源开放、算据赋能——开启数字经济新时代”为主题&#xff0c;囊括岳麓尖峰对话、2021技术英雄大会、18场专业主题论坛/峰会&#xff1b;50企业创新展&#xff0c;联动100海内外高校&#…

java 队列_百战程序员:Java并发阻塞队列

阻塞队列 (BlockingQueue)是Java util.concurrent包下重要的数据结构&#xff0c;BlockingQueue提供了线程安全的队列访问方式&#xff1a;当阻塞队列进行插入数据时&#xff0c;如果队列已满&#xff0c;线程将会阻塞等待直到队列非满&#xff1b;从阻塞队列取数据时&#xff…