埋点技术:“呵呵,你在网上的一举一动,都在我眼皮子底下”

🍅 作者主页:不吃西红柿 

🍅 简介:CSDN博客专家 & 总榜前十🏆、HDZ核心组成员。欢迎点赞、收藏、评论

🍅 粉丝专属福利知识体系、面试题库、技术互助、简历模板。文末公众号领取


1、什么是埋点

埋点又称为事件追踪(Event Tracking),指的是针对特定用户行为或流程事件进行捕获,处理和发送的相关技术及其实施过程。

埋点为优化产品和运营决策提供数据支撑,几乎每个企业、每个app都需要用到埋点技术。

  • 功能方面:埋点是用来收集用户行为数据。比如想要了解一个用户在APP里面点击了哪些按钮,看了哪些页面,做了哪些事情等,就可以通过埋点来实现。

  • 实现方面:埋点就是通过植入一段代码到某个页面或某个按钮,从而监听用户行为并进行收集上报。

2、埋点基本流程

一般来说,需要这样的流程:

  1. 运营人员提出埋点和指标需求

  2. 埋点研发进行埋点,收集和存储数据

  3. 数据仓库人员进行数据清洗、提供数据指标

  4. 运营根据数据指标,调整业务流程和运营策略

  1. 【埋点采集】通过部署埋点,收集数据

  2. 【数据传输】将埋点收集到的数据,进行传输

  • 实时传输:flume > kafka > db

  • 离线批量传输:jdbc > db

  1. 【数据存储】定义数据存储的库

  • 数据量较小建议采用mysql,oracle等关系型数据库;

  • 数据量较大,建议采用hive,hbase等分布式数据库。定义好数据存储的表结构,属性尽可能采集全面。

  1. 【数据清洗】一般为数据仓库开发人员进行数据ELT

  2. 【数据应用】业务运营人员验证和使用数据

3、埋点采集

3.1 埋点范围

根据业务人员的需求,选取可以衡量需求效果的数据指标,比如页面浏览量,页面转化率,访问人数,访问频次分布等等。明确需要收集哪些维度的数据,按需选择性埋点。

3.2 埋点事件

我们可以对一条业务流程中涉及到的各种操作进行事件埋点,用于了解该业务各操作流程的用户流失率,转化率等情况。通常包括但不限于以下事件:

  • 页面事件:用户访问页面的信息,比如可以通过页面埋点统计页面浏览量(PV),或收集该页面上的接口;

  • 点击事件:用户在页面的点击行为,比如想要收集用户点击搜索按钮时,填入了哪些关键字,就可以在搜索按钮上埋一个点击事件,通过字段keywords上报的值实现分析关键字的目的;

3.3 采集内容

埋点时需要尽可能全面的采集数据,主要包括以下信息:

  • 用户基本信息:描述用户的基本属性信息,包括用户ID,性别,运营商,设备类型等

  • 时间信息:事件发生的时间

  • 行为信息:用户做了哪些行为,比如点击行为,浏览行为等

  • 行为对象信息:用户的行为作用在哪些对象上,比如点击按钮A,浏览页面B,那么A,B就是用户行为作用对象

另外,也可以从4w1h(who,when,where,what,how)五个维度来划分埋点属性

3.4 选择埋点方式

选择后端埋点还是前端埋点

比如像点击、浏览、曝光这些行为便可以用前端埋点,主要是发生在用户与界面的交互;如果是电商中要统计下单成功这个事件,客户端是没有办法知道订单是否成功的。

如果统计的事件里有需要用到后端的数据,也是要进行后端埋点的。

3.5 埋点事件的格式

一般一条埋点数据需要记录:事件ID、事件名(英文名、中文解释)、事件属性(属性英文名、中文解释、属性类型)、埋点形式(前端/后端)、事件触发时机(什么时候投递这个事件)

3.6 埋点报文

报文(message)是网络中交换与传输的数据单元,即站点一次性要发送的数据块。

报文包含了将要发送的完整的数据信息,其长短很不一致,长度不限且可变。简单来说就是用户在App内有一个操作行为,就会上报一组带有数据的字段。这些字段组成一个报文。

4、数据存储

4.1 存储方式

根据埋点数据量和现有平台选择一种最合适的存储方式。

  • Mysql: 使用于数据量较小,优点读写方便

  • ES:现有埋点方案中,阿里日志系统,通过ES查询埋点结果

  • Hbase:适合数据量较大,可考虑使用现有hbase集群。

4.2 存储频率

采用【定时】+【定量】的方式,保证数据时效性和数据平滑处理。

  • 定时:周期触发,进行存储。避免当数据量较小时很长一段时间不存储。

  • 定量:设置阈值,当数据量达到一定量(1k)即进行存储

  • 程序退出:某用户退出登录时,需立马进行存储

5、埋点数据清洗

1、将埋点数据接入到数据仓库(离线或者实时);

2、数据建模进行数据建模和数据清洗,过滤掉脏数据,最终产出数据指标;

3、数据指标通过数据报表、邮件、api等方式对外输出。

6、埋点数据应用

常见埋点分析指标:访问数、访客数、停留时长、页面浏览数、跳出率、转化率。

这些数据指标为运营人员提供了决策依据,帮助其不断调整优化运营政策、业务流程,从而达到最佳效果。

 

添加公众号「信息技术智库」:

🍅 硬核资料:20G,8大类资料,关注即可领取(PPT模板、简历模板、技术资料)
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由各个技术群小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、前端等。

👇👇送书抽奖丨技术互助丨粉丝福利👇👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/494430.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美国斯坦福大学发布2025计划, 创立开环大学, 彻底颠覆全球高等教育

来源:钱塘号《斯坦福大学2025计划》在以设计思考理论著称的斯坦福大学设计学院牵头下正式启动,这次教育改革改变了以往自上而下的方式,代之以师生为主导。与其说《斯坦福大学2025计划》是一个方案,不如说它是一个对未来大学模式进…

语言处理想突破,三座大山必须过

来源:大数据文摘编译:李佳、汤圆、钱天培“我的飞机什么时候到?”把这个问题抛给智能机器人助手。几乎可以肯定,机器立马就懵逼了。“我”是谁?“飞机”是航班还是淘宝上订的模型玩具呢?“到”又是到哪呢&a…

CSDN每日打卡已经2周,进展如何?(送两个CSDN背包)

🍅 作者主页:不吃西红柿 🍅 简介:CSDN博客专家 & 总榜前十🏆、HDZ核心组成员。欢迎点赞、收藏、评论 🍅 粉丝专属福利:知识体系、面试题库、技术互助、简历模板。文末公众号领取 点赞评论 …

趋势 | 人工智能领域十大最具成长性技术展望

来源:搜狐日前,在2018世界机器人大会基础技术与创新论坛中,中国电子学会发布了《新一代人工智能十大成长性技术展望》。经调研走访了一批在新一代人工智能技术及产业方面具备领先水平和特色的龙头企业,拜访了来自于知名高校、研究…

CTex + Texmaker

CTex 套装提供了一个Latex编译环境和相关的库,最大的优点是自动部署,直接就可以用。但是CTex自带的WinEdt和开源的Texmaker比起来在设计方面显得比较粗陋,影响工作效率。 Texmaker 本身只是一个前台软件,但是设计精良。如果已经安…

android之phonegap入门

利用phoneGap可以利用HTML开发安卓应用,是web app的一种,可以有效的提高开发效率,降低开发成本 。 第一步: 开发环境配置以及基本操作请参考其它文档. 新增一个名为 phoneGap 的android项目,将主activity命名为:PhoneGapActivi…

全球第二家 亚马逊“喜提”万亿美金市值 AI或是最大功臣

亚马逊创始人杰夫贝佐斯(Jeff Bezos)来源:网易智能摘要:9月5日消息,美国当地时间周二,全球电商巨头亚马逊(Amazon)股价一度触及史上最高点,促使亚马逊市值短暂达到1万亿美元。不过,在…

苹果/三星/华为纷纷布局人工智能 将AI作为公司发展新动力

来源:手机报在线摘要: 目前,以苹果、三星和华为为代表的手机厂商除了继续探索人脸识别、屏下指纹和柔性显示屏等技术外,也将目标瞄向了人工智能,纷纷将“AI拍照”、“AI芯片”等作为营销热门话题,并通过大力…

量子通信产业化初试,中国筹建千亿级国家实验室

来源:第一财经摘要:一个涉及多地的量子信息科学国家实验室(下称“国家实验室”)正在筹建,长期投资将达千亿元。第一财经从2018年国际量子密码会议上了解到,中国正在筹建的国家实验室涉及合肥、上海和北京等…

Android之自定义控件入门

本文主要讲述了实现安卓button点击变色与利用ViewPager实现图片自动轮播效果 我伞可以看到在很多应用中&#xff0c;安卓按钮按下时与正常时状态是不同的&#xff0c;这种效果也很容易达到。 第一步&#xff1a;创建XML文件定义不同事件的不同效果 <?xml version"1…

理性解读中国科技实力:不震惊式吹捧,也不全盘抹杀

来源&#xff1a;风云之声&#xff08;ID:fyvoice&#xff09;关于中国科技成果&#xff0c;大家一直都在讨论&#xff0c;网上也有很多评论文章。有的&#xff0c;把中国科技实力吹上天&#xff1b;有的&#xff0c;则干脆贬入地。中国在很多领域确实做得不错&#xff0c;与此…

Unity(四):使用场景Ⅰ:建立类型映射

在之前的一篇文章“Unity(三)&#xff1a;快速入门”中&#xff0c;给出了一个简单的示例&#xff0c;让我们对Unity有一个感性的认识。但是&#xff0c;Unity到底是做什么用的呢&#xff1f;一个简单示例并不能解答这个问题。 总的来看&#xff0c;Unity的使用场景主要有以下几…

科技创新2030---“新一代人工智能”重大项目2018年度项目申报指南征稿

来源&#xff1a;财政资金申请摘要&#xff1a; “新一代人工智能”重大项目的凝练布局和任务部署已经战略咨询与综合评审特邀委员会咨询评议&#xff0c;并报国务院批准实施。根据《国务院关于改进加强中央财政科研项目和资金管理的若干意见》&#xff08;国发〔2014〕11号&…

一旦上云,欲罢不能,带大家薅一薅“云羊毛”

一旦上云&#xff0c;欲罢不能。相对于传统服务器&#xff0c;云服务器因为不需要去拉网线、搭机房、交电费等等问题&#xff0c;云服务器提供商往往会提供一整套完整的解决方案&#xff0c;帮助企业和个人用户&#xff0c;快速实现业务部署。 近年来&#xff0c;各大厂也在积…

Android之自定义控件深入

本文主要讲述两个知识点:popwindow的使用和通过继承View实现一个自定义控件&#xff0c;实现点击&#xff0c;手动按钮的效果. popwindow的使用 //定义 popupWindowpopWin new PopupWindow(MainActivity.this);popWin.setWidth(input.getWidth()); //设置宽度popWin.setHeig…

麒麟芯片AI首席科学家,解读AI芯片如何让手机更智能

来源&#xff1a;华为摘要&#xff1a;8月31日&#xff0c;华为发布了新一代顶级人工智能手机芯片——麒麟980&#xff0c;成为全球首款采用7nm制程工艺的手机芯片。麒麟980能做到人脸识别、物体识别、物体检测、图像分割、智能翻译等&#xff0c;实现AI识别质的飞跃。今天&…

协议森林14 逆袭 (CIDR与NAT)

作者&#xff1a;Vamei 出处&#xff1a;http://www.cnblogs.com/vamei 严禁任何形式转载。 IPv4由于最初的设计原因&#xff0c;长度只有32位&#xff0c;所以只提供了大约40亿个地址。这造成了IPv4地址的耗尽危机。随后&#xff0c;IPv6被设计出来&#xff0c;并可以提供足够…

认知神经科学:美陆军高度关注的人工智能与生物科技的交叉学科领域

来源&#xff1a;天大神经工程近年来&#xff0c;随着“第三次抵消战略”的深入推进&#xff0c;美军重点部署人工智能、生物科技等前沿技术领域发展&#xff0c;寻求获取新的领先优势。作为人工智能与生物科技的交叉学科领域&#xff0c;认知神经科学具有颠覆未来作战样式的巨…

Android之自定义属性

安卓自定义属性主要有3个步骤 在values文件夹新建attrs.xml文件中声明属性&#xff0c;包括属性名和格式&#xff0c;format常用属性有string ,integer,reference等 <?xml version"1.0" encoding"utf-8"?> <resources><!-- 声明属性集…

log4j的配置方法

一、 介绍 Log4j是Apache的一个开放源代码项目&#xff0c;通过使用Log4j&#xff0c;我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务 器、NT的事件记录器、UNIX Syslog守护进程等&#xff1b;我们也可以控制每一条日志的输出格式&#xff1b;通…