基于MaxCompute 衣二三帮助客户找到合适自己的衣服

摘要:本文由衣二三CTO程异丁为大家讲解了如何基于MaxCompute构建智能化运营工具。
衣二三作为亚洲最大的共享时装平台,MaxCompute是如何帮助它解决数据提取速度慢、数据口径差异等问题呢?程异丁通过衣二三数据体系架构,从用户运营应用、商品运营应用以及算法推荐系统三方面给大家剖析了MaxCompute是如何助力衣二三构建智能化运营工具的。

以下是精彩视频内容整理。


衣二三是谁?

衣二三是亚洲最大的共享时装平台。衣二三提供女性服饰包月租赁制服务,会员们在APP上挑选喜爱的衣服,可以在平台上用固定的月费在一整月内不断地换穿衣服,衣二三通过快递将衣服送到客户手中,客户只要会员期有效,就可以一直穿这件衣服,当会员不想穿的时候,衣二三还会通过快递按照约定的时间地点将衣服收回,这样会员就可以继续下新的订单,可以不断地换穿各种衣服。我们的客户从没有毕业的学生到工作多年的白领,多种类型的客户都能从APP上找到合适自己的衣服。
image


如今,电子商务发展非常成熟,线下逛街也是大家喜欢的生活方式,那为什么在这种情况下还要租衣服呢?衣二三为客户解决了以下几个痛点:
1.打开衣橱总是找不到今天想穿的衣服。使用衣二三,用户可以灵活的换装,不断地尝试不同风格;
2.费用高。衣二三标准的月费只有499元,相当于买一件衣服的价格,用户可以用买一件衣服的价格换穿一整月的不同服装。
3.大城市的房屋空间有限,拥有一个衣橱对于很多用户来说更是奢望。衣二三可以回收衣服,帮助用户节约空间,同时还负责清洗衣服,正如宣传语所说的那样——“你负责貌美如花,我负责清洗收发”;
4.卫生问题。衣二三联合福奈特、天天洗衣等共同打造了智能化现代化的洗衣工厂,每一件衣服需要经过多达16道清洗消毒流程,比自己家里洗衣服还要干净;
5.购买和退换问题。衣二三通过体验式的方式帮助用户从款式、尺码等方面找到真正适合自己的衣服,并且允许用户买下来。


为什么使用 MaxCompute?


衣二三的前后端运营比较复杂,前端需要让客户在尽可能短的时间认识我们,了解我们,才能形成转化;后端也是特别复杂,与一般的电商相比,衣二三有明显的异同,常规电商的客户在前端下好单后,会通过订单管理系统,将订单派发到仓储中心,仓储中心会对订单进行拣货、配货、包装、物流等,最终将商品送到客户手中,也可能伴随着一小部分的退货或返修,对于一般电商来讲,整个流程到这里就基本结束了,但是对于衣二三来说,该流程只进行了一半,我们需要对所有的衣服进行回收、清洗和质检,才能够再次上架让客户挑选,如此复杂的运营自然离不开大数据的支持,MaxCompute作为整个数据体系的核心,帮助了衣二三很多。

那么,在未使用MaxCompute前我们遇到了哪些问题呢?主要包括以下几方面:

  • 数据提取速度慢。随着系统不断地变复杂,SQL越跑越慢。
  • 数据口径差异。每个工程师将逻辑都写在SQL里,不同工程师得到的数据结果可能不一样,这就是因为我们没有集中化标准化的数据仓库对每一个数据维度和业务的指标有相应明确的定义,造成所有的逻辑都在SQL中。
  • Python脚本实现基础ETL。作业调度与依赖难于维护与迭代,运维也是比较令人头疼的,修复时间长。
  • 人工数据提取及报表制作。工程师忙于提供各个业务部门的数据支持。
     

这些问题促使我们想要做出改变,起初我们想做一套完整的hadoop全家桶进行替代,但评估后发现其运维代价和资源消耗对于我们的数据团队和运维团队来说,都是比较大的负担,而且很难快速体现价值。后来,我们很幸运的遇到了MaxCompute,从试用开始,我们逐渐把数据仓库和数据体系建构在MaxCompute上。

MaxCompute有哪些好处呢?主要从以下几个维度来分析:

1.MaxCompute是基于云端的大数据仓库,无需复杂作业运维工作
2.数据吞吐量大,查询性能好,支持UDF
3.可视化任务编辑界面,易于上手
4.使用成本低,适合初创公司
5.与阿里云大数据产品生态融为一体,比如RDS,应用层的Quick BI,Blink以及日志服务。


如何应用MaxCompute?

image


衣二三数据体系架构如图所示,最底层是数据源,包括RDS生产数据库和日志服务等,通过日志服务、DataHub等投递到数据计算层;数据计算层以MaxCompute为核心,同时配合我们自己做的脚本和UDF进行数据存储和计算,生成的结果反馈到前端数据应用层;数据应用层是数据分析展示工具,包括YConsole、QuickBI以及DataV等,我们使用DataV做展示业务全局的看板,让我们快速了解全国各地谁在下单、仓储中心的储备情况等。
我们还有包括用户画像、商品画像、爆款识别、衣二三指数和实时人效监控等。


用户运营应用

image

用户运营对于互联网公司来讲,都是极其重要的,它有两个业务指标,一是转化,一是留存。转化是指尽快让客户了解我们的价值,同时形成付费和转化;留存是指让已经成为我们用户的用户在平台上得到好的体验,让用户喜欢这种生活方式并留下来。
我们结合了MySQL数据和用户日志放到MaxCompute中,经过PAI平台,我们自己做了数据分析,包括使用数据挖掘算法和随机森林等的数据维度分析,对我们整个用户运营做了很多量化指标,我们通过邮件日报对运营指标监控,基于这些指标我们开发了自有用户分群体系推进用户精细化运营;基于阿里云机器学习计算平台PAI,我们建立了预测模型,预测用户的转化率等;引入流失预警计算体系后,运营根据用户的流失指数进行精准挽留营销,将会员流失降低了超过50%。


商品运营应用

image

衣二三的每一个商品都有结构化的数据,我们专业的买手会给商品打上20+维度的标签。此外,我们会总结用户行为,用户与商品之间的互动都放在MaxCompute中做相关性分析,形成商品的一系列指标,比如爆款识别,通过爆款识别去预测满足哪些属性和维度的衣服会形成爆款,我们的买手会带着数据工具一起进行采购,极大的提高了运营效率。
我们还结合商品各个表现维度,包括库存深度、出租情况等计算出衣二三指数,它可以对商品进行排名。除了给合作伙伴应有的租赁收益外,我们还会提供数据工具,最大化业务模式的价值。

image

商品的灵魂就是标签,只要将标签做的足够细,才能从结构化上去理解它,去做一些预测性的指标。我们通过商品不同的标签及风格场景热度指数进行备货指导,通过最终商品空置率进行商品调拨及库存关联,通过衣二三指数反映商品热度排行,根据用户行为促进租售转化,完成商品流动闭环。

算法推荐系统

如何让用户在很短的时间内找到适合一个月穿的衣服呢?这就需要推荐算法的支持。
image

衣二三的推荐算法也是基于MaxCompute,把用户对商品的行为通过日志收集到MaxCompute中,对用户进行用户画像,对用户画像进行模型训练,最终落地到商品列表展示给用户。使用推荐系统给我们的业务带来很大提升,选衣页推荐的点击率增加了70%,人均点击数增加了50%;相关单品推荐的点击率增加了150%,人均点击率增加了110%。

总结下来,大数据的魅力大家已经认识到,MaxCompute这样的产品对于初创公司来讲将大数据门槛降的非常低,让大数据能够面向各种各样的公司来贡献力量和发挥价值。谢谢在场各位的倾听,以上就是我的分享。
 

欢迎加入“MaxCompute开发者社区2群”,点击链接申请加入或扫描二维码
https://h5.dingtalk.com/invite-page/index.html?bizSource=____source____&corpId=dingb682fb31ec15e09f35c2f4657eb6378f&inviterUid=E3F28CD2308408A8&encodeDeptId=0054DC2B53AFE745
image

原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/516728.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nexus 3.31.1 maven 私服 搭建篇 linux

文章目录1. Nexus 3 下载2. 解压3. 目录调整4. 重命名5. 创建用户6. 调整家目录7. 指定启动用户8. 环境变量配置9. 刷新环境变量10. 修改工作目录11. 指定jdk12. 修改权限13. nexus启动14. 状态验证15. 浏览器验证16. 登录17. 初始化设置软件版本JDK1.8.0_202Nexus3.31.1Disk s…

Typora简介

Typora简介 一、Typora是什么? ​ Typora 是一款支持实时预览的 Markdown 文本编辑器。它有 OS X、Windows、Linux 三个平台的版本,并且由于仍在测试中,是完全免费的。 ​ Typora 首先是一个 Markdown 文本编辑器,它支持且仅支…

基于MaxCompute InformationSchema进行血缘关系分析

一、需求场景分析 在实际的数据平台运营管理过程中,数据表的规模往往随着更多业务数据的接入以及数据应用的建设而逐渐增长到非常大的规模,数据管理人员往往希望能够利用元数据的分析来更好地掌握不同数据表的血缘关系,从而分析出数据的上下游…

不要再被 Python 洗脑了!!

Python 作为一种解释型技术脚本语言,越来越被认可为程序员新时代的风口语言。 无论是刚入门的程序员,还是年薪百万的 BATJ 的技术大牛都无可否认:Python的应用能力是成为一名码农大神的必要项。 而作为Python初学者来讲,最大的问题…

Nexus 3.31.1 maven 私服 仓库配置篇 linux

文章目录1. 新建仓库概述2. 阿里云代理仓库3. 自己的仓库4. 自己的仓库组5. 效果图1. 新建仓库概述 总共新建3各仓库 一个是国内开源仓库,加速下载 一个是自己的仓库,用于存放自己公司的jar 一个是子类型的仓库,用于将上述两个组成一个地址 …

Struct复杂数据类型的UDF编写、兼容HIVE的GenericUDF编写

一、背景介绍: MaxCompute 2.0版本升级后,Java UDF支持的数据类型从原来的BIGINT、STRING、DOUBLE、BOOLEAN扩展了更多基本的数据类型,同时还扩展支持了ARRAY、MAP、STRUCT等复杂类型,以及Writable参数。Java UDF使用复杂数据类型…

如何跨项目工作空间访问MaxCompute资源和函数?

1、背景介绍 同一个主账号下面的两个工作空间,工作空间名称分别为 A工作空间名称:wei_wwww A工作空间子账号:mc_oss B工作空间名称:wei_mc B工作空间子账号:bigdata_wei 现在B工作空间子账号bigdata_wei需要访问A工作空间子账号mc_oss创建的U…

Nexus 3.31.1 maven 私服 仓库和IntelliJ IDEA 2021.2 实战篇 linux

文章目录一、maven配置1. 私服配置2. 替换后的配置二、IntelliJ IDEA2.1. 创建项目2.2. 指定配置2.3. 下载依赖三、nexus3 监控3.1. 查看依赖版本3.2. 版本对比3.3. aliyun 仓库地址一、maven配置 1. 私服配置 在本地的maven 配置settings.xml内容,用下面内容覆盖…

我把这篇文章给女朋友看,她终于明白什么是「数据中台」了

来源 | 智领云科技责编 | Carol封图 | CSDN 下载自视觉中国这几天,女朋友一直忙着为自己挑选情人节礼物,毕竟直男的审美她也觉得不靠谱。就在昨天,她气冲冲地跑过来问我:为什么有些平台总是推荐一些我不喜欢的东西?为什…

发光的二次元克拉克拉 满足年轻用户个性化、碎片化的文娱需求

克拉克拉(KilaKila)是国内专注二次元、主打年轻用户的娱乐互动内容社区软件。KilaKila 推出互动语音直播、短视频配音、对话小说等功能,满足当下年轻用户个性化、碎片化的文娱需求。随着业务规模增长,海量数据存储与计算的瓶颈也日…

Nexus 3.31.1 maven 私服 服务器配置篇 linux

文章目录一、以服务运行1. 编写配置2. 赋予可执行权限3. 配置自启动4. 启动nexus5. 监控状态6. 停止服务二、配置文件说明2.1. JAVA配置2.2. 自定义配置2.3. 工作/日志 目录修改三、使用nginx代理3.1. HTTP3.2. HTTPS四、其他配置4.1. 配置匿名访问4.2. 更改管理员电子邮件地址…

混合云模式助力斗鱼搭建混搭大数据架构

云栖号案例库:【点击查看更多上云案例】 不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策! 案例背景 2019杭州云栖大会大数据企业级服务专场,由斗鱼大数据高级专家张龙…

架构师技术文档:Redis+Nginx+Spring全家桶+Dubbo精选

最近花了很长的时间去搜罗整理Java核心技术好文,我把每个Java核心技术的优选文章都整理成了一个又一个的文档。今天就把这些东西分享给老铁们,也能为老铁们省去不少麻烦,想学什么技能了,遇到哪方面的问题了 直接打开文档学一学就好…

天弘基金交易数据清算从8小时缩至1.5小时 解决余额宝算力难题

天弘基金作为国内总规模最大的公募基金,阿里云MaxCompute为我们构建了企业级一站式大数据解决方案。MaxCompute对于海量数据的存储、运维、计算能力强大且安全稳定,MaxCompute服务将原本需要清算8小时的用户交易数据缩短至清算1个半小时,同时…

nginx指定配置文件启动及重启

1、验证配置文件 /usr/local/nginx/sbin/nginx -tc /usr/local/nginx/conf/nginx.confor /usr/local/nginx/sbin/nginx -t -c /usr/local/nginx/conf/nginx.conf2、指定配置文件启动 /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf3、指定配置文件重启 …

配置MaxCompute任务消费监控告警,避免资源过度消费

MaxCompute 按量计费资源为弹性伸缩资源,对于计算任务,按任务需求提供所需资源,对资源使用无限制,同时MaxCompute按量计费的账单为天账单,即当天消费需要第二天才出账,因此,有必要对计算任务的消…

Vue3.0 备受热捧!2020 前端开发进阶必读

你好,我是汤小洋。前华为全栈工程师,南京大学软件工程硕士,拥有11年全栈开发及内部培训分享经验。作为一名前端人,学习从不是一件容易的事,这是我一路走过来的真实感受。“只要付出,就有收获”、“只要努力…

Docker 查看日志记录

日志文件对于处理故障十分重要,对于docker容器如何查看日志呢 查看docker容器的日志用到的是docker logs这个命令: 先看下官方给的命令说明 docker logs --help–details 显示更多的信息 –f, --follow 跟踪实时日志–since string 显示自某个timestam…

PyODPS DataFrame 处理笛卡尔积的几种方式

PyODPS 提供了 DataFrame API 来用类似 pandas 的接口进行大规模数据分析以及预处理,本文主要介绍如何使用 PyODPS 执行笛卡尔积的操作。 笛卡尔积最常出现的场景是两两之间需要比较或者运算。以计算地理位置距离为例,假设大表 Coordinates1 存储目标点…

Docker JFrog Artifactory 7.27.10 maven私服(仓库配置篇)

文章目录一、二、 建立远程仓库2.1. 仓库列表2.2. 仓库创建演示2.3. 阿里云仓里调整三、建立本地仓库3.1. 仓库列表3.2. 仓库创建演示四、创建虚拟库4.1. 仓库列表4.2. 仓库创建演示五、创建用户/组/权限5.1. 创建用户5.2. 创建用户组5.3. 创建权限5.4. 获取密文密码5.5. 生成配…