数据分析入门

B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili

一、岗位:数据分析师

Q1 数据分析师在公司做什么工作? 

数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况;

通过对用户精细化分析,找出增长点,强化核心业务或开拓新业务。 

Q2 数据分析师使用什么工具?

使用sql对接数据源,excel对接业务人员。python在生产力方面与同行拉开差距。

Q3 数据分析师需要具备什么技术能力?

1.业务能力。在熟知业务的基础上,设计更加有价值的监测指标与用户埋点,获取更有价值的数据,为后续分析打下基础。

2.Excel、Sql、Python等分析软件。主要用于已获取数据的自动整合、监测、分发等,用来减轻人工的工作量。

3.统计学、数据分析报告、业务能力等。分析客观数据,得出分析结论。

4.BI平台。在该平台中完成上述工作,需要掌握平台的使用方法。

5.机器学习、搭建指标体系等相关知识。用于支撑核心业务增长或开拓新业务线。

6.行业报告分析。用于行业、数据探索。 

业务可以通过积极参与业务会议等方式掌握。和运营相比,掌握业务全局。

sql等工具通过系统学习和使用掌握。和表哥表姐相比,对业务有更深的掌握,通过数据分析总结。

数据分析通过系统的学习掌握。是数据分析师结果产出物,直接效益的体现。

python通过系统的学习掌握,用于加强自身竞争力,成为领域专家。

Q4 如何进行学习规划?

 

列出所需的技术栈,根据市场需求与自身特点(对自身是优势)分出优先级。

Q5 到达新公司后,如何迅速了解业务?

1.获得公司架构图。从中了解部门怎么设置,业务怎么开展。从用户到下订单的整个业务流程中,各部门如何参与,负责哪些业务。重点看运营架构、产品架构。

2.获取业务数据表。作为用户使用。获得主表、用户行为。

二、如何获得数据:指标体系与用户路径

Q1 指标可以用来干什么?

建立指标体系目的是获得全面而充足数据支撑,通过分析,从而发现问题、或得出主观问题的结论。 

优秀的指标体系在制定每个指标时,会与业务目标密切关联,紧密围绕活动策略,数据结果可以有效的衡量产品的健康程度与策略是否有效。  

 

Q2 指标包含什么构成要素?

Q3 面对混乱的指标数据时,如何将其定量比较?

指标之间因为计数单位、数据量、计算方式等量纲的不同,导致无法直接进行比较。

基于此问题,通常采用归一化标准化两种方法来去除量纲。 

  • 归一化:通过对同一组的统计量做统计,使该组数值在0-1之间变化。公式:(当前值-最小值)/(最大值-最小值)。归一化后,不同组数据即可做出比较。
  • 标准化:在计算一组数据的方差后,通过开根号的方式去除该组数据的量纲。 

Q4 如何拆分指标?  

1.在宏观上,从指标本身类型和获得复杂度来说,包括基础指标、复合指标和派生指标。

2.当聚焦在产品的不同生命周期阶段时,会产生各阶段的重点关注指标。

3.当细化到每个具体的业务时,从业务工作的拆分来讲,可根据业务的不同分为不同的指标类。 

4.对于互联网产品来说,会特别关注以下指标。 

5.从用户行为的角度来看,通过用户在关键路径上的一系列行为,为每个行为拆分测量指标。

Q5 如何分析用户路径?

视频类用户路径

电商购物用户路径 

内容平台用户路径

三、指标数据的分析 

Q1 获得指标数据后,可以分析什么信息? 

1.分析不同类型业务在整个业务中的占比情况

2.分析业务的增长趋势 

3.通过与自己、他人进行比较,分析业务的增长率和竞争力  

4.通过画象限的方法,分析出强势和弱势的业务  

5.通过对头部流量的分析,分析流量投入的集中程度 

6.通过对地域、用户、业务的维度分析,分析不同维度的用户对业务的偏好。  

TGI指数:在某个活动中,目标群体在总人群中的占比

——地域维度

——用户维度

——业务维度

06 复杂指标数据的影响因素有什么

指标的影响因素包括产品本身素质和用户群体两方面影响。

产品本身素质包括用户流量、转化率、成功率、价格等多项产品因素组成;用户群体为目标群体的群体特性。

用户群体作为对最为影响产品成功的部分,对受众群体做出细分,并进行完善的用户画像来研究。


四、分析的进行:统计

Q1 如何判断数据是否稳定?

描述统计学用于研究单个变量的集中趋势与离散趋势。 


选择一个数值来作为中心

Q2 确定中心数时,如何保证数据的代表性?



方差=[(数值1-平均数)²+(数值2-平均值)²+…]/N 

用来直观的对比离散程度的高低

标准差²=方差。去除方差的量纲,更精准的提现离散趋势

极差=(最大-最小) 。提现数据的偏差程度

偏差、方差共同描述离散程度。

Q3 如何判断数据范围?



Q4 如何找到异常值?

当数据服从正态分布,使用3σ原则

当数据不服从正态分布,使用箱线图


1.从小到大排列已有数据

2.选取25%,50%,75%,100%位距的数值

3.计算四分位距IQR,从而获得箱线图中箱子的长度;箱线图为数据提供3倍IQR的容错量。

IQR=Q3-Q1;上界=Q3+1.5IQR;下界=Q3-1.5IQR

4.根据数值画出箱线图,极限外的数据排除为异常数据

Q5 根据当前数据,如何预测接下来的趋势?

五、分析结果的运用

Q1 如何获得问题的结果?



1.罗列关联的数据(不同分析角度寻找不同数据)

2.列出公式,计算单位供给能力

3.列出公式,计算需求量

4.计算供给量


Q2 如何进行事件的策划?

人、时、地、事、因、做、果

把项目实际落地的具体手段。

策划产品活动案例

思考的基础是信息。若缺少信息,通过提问获得基础数据和细节。如:定价、产品价值、用户画像等。



分析付费点案例

拆分维度案例


Q3 如何分析用户的增长和留存?

常规模型:分析用户增长和留存的模型AARRR


拼多多模式:RARRA模型

留存——激活——传播——变现——注册

游戏化思路


游戏化用户增长策略:八角模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/111550.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3 + axios 中断取消接口请求

前言 最近开发过程中,总是遇到想把正在请求的axios接口取消,这种情况有很多应用场景,举几个例子: 弹窗中接口请求返回图片,用于前端展示,接口还没返回数据,此时关闭弹窗,需要中断接…

【网络】网络编程套接字(一)

网络编程套接字 一 一、网络编程中的一些基础知识1、认识端口号2、认识TCP协议和UDP协议3、网络字节序 二、socket编程1、sockaddr结构2、简单的UDP网络程序Ⅰ、服务器的创建Ⅱ、运行服务器Ⅲ、关于客户端的绑定问题Ⅳ、启动客户端Ⅴ、本地测试Ⅵ、网络测试 一、网络编程中的一…

泛微全新低代码平台e-builder在沪发布,超千名与会者共商数字化转型

10月18日下午,泛微低代码平台体验大会在上海顺利举办,大会以“智能、协同、全程数字化”为主题,吸引了上千位政府及企事单位的信息化负责人参与。 活动现场,参会者身临其境地体验了泛微低代码平台,了解了泛微低代码平…

WebDAV之π-Disk派盘 + 密码键盘

密码键盘是一款密码管理器,可以存储和管理需要受保护的数据。为方便日常使用,同时也是一款安全输入法,帮您安全便捷地填写账号密码、通用内容、卡包信息。 密码键盘使用军事级的 PBKDF2 有损加密算法保护您的根密码,使用军事级的 AES 加密算法保护您的存储数据。云端再额外…

分类预测 | MATLAB实现基于BiLSTM-AdaBoost双向长短期记忆网络结合AdaBoost多输入分类预测

分类预测 | MATLAB实现基于BiLSTM-AdaBoost双向长短期记忆网络结合AdaBoost多输入分类预测 目录 分类预测 | MATLAB实现基于BiLSTM-AdaBoost双向长短期记忆网络结合AdaBoost多输入分类预测预测效果基本介绍模型描述程序设计参考资料 预测效果 基本介绍 1.MATLAB实现基于BiLSTM-…

华为数通方向HCIP-DataCom H12-831题库(多选题:1-20)

第01题 如图所示,路由器所有的接口开启OSPF,图中标识的ip地址为设备的Loopback0接口的IP地址,R1、R2,R3的Loopback0通告在区域1,R4的Loopback0通告在区域0、R5的Lopback0通告在区域2,下列哪些IP地址之间可以相互Ping通? A、10.0.3.3和10.0.5.5 B、10.0.4.4和10.0.2.2 …

【CANoe】XML Test Module使用实例

文章目录 一、实操步骤1、增加XML Test Module节点2、配置XML Test Module节点3、XML Test Module节点增加CAPL脚本(.can文件)4、文件夹结构5、使用仿真节点开始测试6、测试结果与测试报告7、同理,在Test Setup也可如此操作 一、实操步骤 1、增加XML Test Module节…

【ubuntu】常用软件安装

【ubuntu】常用软件安装 前言安装搜狗输入法安装flameshot截图软件总结 前言 Ubuntu 是一个基于 Linux 内核的开源操作系统,它提供了简单易用的界面和丰富的功能,广受开发者和普通用户的喜爱。博主时常也需要经常切换Ubuntu系统进行开发和学习&#xff…

SEM和SD的区别和联系,以及其计算方法

http://t.csdnimg.cn/aHe99http://t.csdnimg.cn/aHe99

【vue3】传送组件、Teleport

把test里的内容传送到test2 //test1.vue <template><div>test1<Teleport v-if"flag" to".aa">test1的内容</Teleport></div></template><script setup langts>import { ref,reactive,onMounted } from vueconst…

2023前端面试题总结

给大家推荐一个实用面试题库 1、前端面试题库 &#xff08;面试必备&#xff09; 推荐&#xff1a;★★★★★ 地址&#xff1a;web前端面试题库 Html5和CSS3 常见的水平垂直居中实现方案 最简单的方案当然是flex布局 .father {display: flex;justify-content…

在线JSON转EXCEL工具

全天下的柔情共十分&#xff0c;你占八分。你喊我名字那晚的凉风秋月算一分&#xff0c;其余所有占一分。 推荐 在线JSON转Excel工具 - WeJSON 工具简介 在线JSON转Excel工具&#xff0c;可以快速将JSON数组数据一键转换为Excel格式&#xff0c;方便数据的可视化和交流。 所…

Java中过滤器与拦截器的使用

目录 Filter过滤器 Filter作用时机 Filter的使用 过滤器链 过滤器执行顺序 测试 Filter实现简单登陆验证 Interceptor拦截器 Interceptor的使用 Interceptor的拦截路径 Interceptor执行时机 Interceptor实现登录验证 Filter与Interceptor区别 Filter过滤器 Filter…

25.1 MySQL SELECT语句

1. SQL概述 1.1 SQL背景知识 1946年, 世界上诞生了第一台电脑, 而今借由这台电脑的发展, 互联网已经成为一个独立的世界. 在过去几十年里, 许多技术和产业在互联网的舞台上兴衰交替. 然而, 有一门技术却从未消失, 甚至日益强大, 那就是SQL.SQL(Structured Query Language&…

【C++面向对象】1. 类、对象

文章目录 【 1. 类 & 对象的定义 】1.1 类的定义1.2 对象的定义 【 2. 类的成员 】2.1 数据成员2.2 成员函数类的内部定义成员函数类的外部定义成员函数成员函数的访问实例 【 3. 类的访问修饰符 】3.1 public 公有成员3.2 private 私有成员3.3 protected 保护成员3.4 继承…

【离线/并查集】CF1213 G

想起来好久没写题解了&#xff0c;随便写一下把 感觉写多了div3后面的题就变得简单了&#xff0c;div3似乎没什么思维含量&#xff0c;甚至有时候能开出div3的2100.... 心血来潮写一下这个*1800的题解&#xff0c;思路一下就出了&#xff0c;但是一开始多了个log被卡了&#x…

【R】数据相关性的可视化

一千零一技|相关性分析及其可视化&#xff1a;copy&paste&#xff0c;搞定 .libPaths(c("/bioinfo/home/software/miniconda3/envs/R4.0/lib/R/library")) #data("mtcars") library("PerformanceAnalytics") # pdf("test.pdf") #…

惊艳!这些独特的搜索引擎你都知道吗?

随着互联网的普及和发展&#xff0c;搜索引擎已经成为我们日常获取信息的重要工具。然而&#xff0c;当我们想要寻找一些特定类型的信息时&#xff0c;普通的搜索引擎可能无法满足我们的需求。这时&#xff0c;一些特殊的搜索引擎便能派上用场本。 文将介绍几种常用的特殊搜索引…

EDID详解

文章目录 字节含义一些概念YCC位 文章目录 字节含义一些概念YCC位 字节含义 EDID通常由128个字节组成&#xff0c;这些字节提供了关于显示器的各种详细信息。以下是EDID中每个字节位表示的一般含义&#xff1a; Header&#xff08;头部&#xff09;: 字节0: Header&#xff…

hue实现对hiveserver2 的负载均衡

如果你使用的是CDH集群那就很是方便的 在Cloudera Manager中&#xff0c;进入HDFS Service 进入Instances标签页面&#xff0c;点击Add Role Instances按钮&#xff0c;如下图所示 点击Continue按钮&#xff0c;如下图所示 返回Instances页面&#xff0c;选择HttpFS角色…