数据科学与大数据(3)

数据分析,它不应该是在一个不适合的工具下生搬硬套8ccc0f4c52e4411792a0f4cdc151834c.jpg

 工具为具体的场景服务,换一个场景大概率会很鸡肋,对于一个成熟的分析师来说,十八般武艺样样精通到后期为常态,不要产生工具上的路径依赖,不要想着学一个工具就一朝鲜吃遍天,你可以对某个工具深入钻研,但这种钻研不能阻碍你根据场景灵活学习和使用新工具。不会使用报表,就无法理解业务背后的逻辑,不会批量自动化的BI和Python操作就无法为更大规模的业务团队提供数据支持4956bb9d82784a72a4bdaa5e877377bc.jpg

 数据表达它是基于数据化的表图文说明事实表达观点。常见的问题有两个:79f843b0561a4d7889e226e90beb5219.jpg

 e2e7b171b6e84b1ba282e88401920d1e.jpg

 fd03c5b338284a978c3705bf7ae5bea2.jpg

66802443c9ed4b3e971c2a9c2de29e18.jpg bb80d8c523b2438ebeba8bd2ae84eccf.jpg

 

表达的原则1.要客观做出的图表文都要基于事实准确清晰,不能让人看了数据还有歧义。2.是直观做出的图表一定要让人一目了然,图表并不是越复杂越好复杂,会增加理解的难度。一个成熟的分析师有制作复杂图表的能力,更要懂得合理的使用。3.高效增加每次表达中的有效信息密度,基于数据提升效率。

数据表达的形式和载体:f656dfe07d364cc9b1eb51a593ee4970.jpg

 表达的格式:84a7ef651ef648a4ac0fb6a8f3dd9af0.jpg

 专业的表达:d971a68c3ae34d8194ad1681a2a12a47.jpg

 完善图表常用九大形式:33f3c86d40b941df983d17541695c6cc.jpg

 最常见的为长度。柱状图上配上折线也挺好的

数值型数据和类别型数据:0b3523aa8f8f41e7b315391e7532b191.jpg

 如何出思路?就是先给自己提几个问题,然后在图表里找答案,根据问题和观点选择合适的图表类型,其次是做出图表后,再进行视觉图形的优化添加和调整就好d62c5121a3594447b816afc25507030e.jpg

9beb94950d55403a87aeea83238f6ea7.jpg 

2d7134556fd94ca69073661d575cd96d.jpg 

945ce4dc8e614041ae66989218470b2c.jpg 

294f0aefccc1480897d6f15743403912.jpg

 c57780dcc85f44c3b7968586b01a7f8d.jpg

5fd7f85ee52844d8a81a0ad79a59d755.jpg

 093eabf559eb4a4fbe47636969011698.jpg

 

优化视觉图形组合,制造出有效信息密度更大的高效图表,例如:

 ab550a756d7e4616b6dd06beff210f75.jpg

ff55589212934ad0a147c8374a2af86c.jpg 

 但记住:客观直观永远是高效的前提

a0f0708cedd142cc9bacb3f73a81165d.jpg

 在以后的学习生活中牢记学习时的慢就是实战时的快

48937a9d648d41c7aab2516564323e9a.jpg

 第3个阶段1.提出关键数据,时间,日期要准确说明年月日。2.对于大数值和小数点过长的数据要四舍五入并给出合适量级的单位。3.视对象使用术语和缩略语,不要跟业务转业指标,也不要跟技术说行业黑话。4.说大白话,语言表达越直白越简单越好,千万不要兜圈子。

记住我们面对很多问题时的认知和解决方案,会极大地影响我们在数据分析之路的成长,甚至是很长一段时间的职业发展。

9cacde9a15a14f9bac1fe24fc59deee8.jpg

 第1个问题会决定我们专业的上限及成长的速度,第2个问题会将数据分析的价值最大化,第3个问题是薪资涨幅。

通过正确的学习方式提升知识储备和能力,是解决一切问题的最好方式,一定要搭建起属于自己的知识框架!只要你乐于解决问题,善于解决问题,如果善于解决问题就不会有问题难到你了,在学习过程中先学自己用得上的,有学习的需求,也有实践的场景。

学习知识解决问题都需要花时间,没有人能在有限的时间里积累起解决无限问题的知识框架:7e942bee530d4ff6b0e043f88e83816e.jpg

 先充分理解别人的框架进行内化,然后看已有的框架能不能解决问题,其次果断学习新知识去解决问题,然后学会后进行总结,归纳到自己的框架里,最后甚至放弃原有框架重新搭建一个b8d26045ed2c4d70ab9f6cd1d7c75d37.jpg

 形成自己的知识框架,是我们深入学习所有专业技能时的必经阶段,更是进行创新的前提条件。在经过了什么样的事情之后,迫切发现自己无法解决这类问题,所以需要学习知识,更新自己的知识框架,以解决相应的问题,而在解决问题中明显发现自己成长了,这也便是这件事本身的意义,就是我们成长的过程,遇到问题时不应该把它视为障碍,而是应该把它视为我们成长的机会。

数据分析永远只是一门强力辅助技能,他能:量化业务到底做了多少、发现业务有哪些问题、算出市场规模判断竞品动作指导业务要做多少,又该怎么做,但他永远都无法替代业务的执行过程33d09b5e9538466b87ef65291b8b03b6.jpg

 

牢记问自己三个问题:9caa6c7a07694ffa8feb6a0f4aa3718c.jpg

 借助数据分析为我们带来更大的职业发展空间和更多的选择机会,关注我,和我一起奔赴下一场山海!

398f90af06c140d99c5643fad2384194.jpeg

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/1998.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IDEA更换新版本启动没反应

目前安装了新的IDEA(压缩包方式),由于老版本的IDEA还在用,所以并没有删除,但是安装完后发现点击idea64.exe后没有反应,于是网上找了好多方法最后解决了 下面是我的解决过程 新版本:IntelliJIdea2024.1 老版本: Intelli…

ubuntu系统安装配置gitlab+Jenkins+发布持续集成持续部署保姆级教程。

1、服务器环境 名称 系统 IP 备注 gitlab ubuntu20.04.2图形化 192.168.26.130 要求有6G的内存 Jenkins Ubuntu20.04.2图形化 …

Pytorch下张量的形状操作(详细)

目录 一、基本操作函数 二、分类:维度改变,张量变形,维度重排 2.1维度改变 2.2张量变形 2.3维度重排 三、实例 一、基本操作函数 在PyTorch中,对张量的形状进行操作是常见的需求,因为它允许我们重新组织、选择和…

大模型训练及推理【硬件选型指南】及 GPU 通识

我们在做大模型应用部署时(如训练、微调、RAG),往往需要在前期就分析好硬件选型指标,或者我们给客户报方案之前,可能你已经有了一个方案,但是由于实践经验缺乏,不知道在硬件上该如何评估并上报。…

CTF练习-BUUCTF(1~25)

文章目录 Crypto题目1 一眼就解密题目解题思路flag 题目2 md5题目解题思路flag 题目3 Url编码题目解题思路flag 题目4 看我回旋踢题目解题思路1解题思路2flag 题目5 摩丝题目解题思路flag 题目6 passwd题目解题思路flag 题目7 变异凯撒题目解题思路flag 题目8 Quoted-printable…

AJAX——封装_简易axios

1.简易axios_获取身份列表 需求:基于Promise XHR 封装 myAxios函数,获取省份列表展示 步骤: 1.定义 myAxios函数,接收配置对象,返回Promise对象 2.发起XHR请求,默认请求方法为GET 3.调用成功/失败的处…

Python与数据库连接

新建表boss create table 创建表 Code import pymysqlcon pymysql.connect(hostlocalhost,\userroot,\password,\port3306,\dbbusiness) cursorcon.cursor() cursor.execute(create table if not exists boss(id int auto_increment primary key,name varchar(20)not null…

WPF2 样式布局

样式布局 WPF中的各类控件元素, 都可以自由的设置其样式。 诸如: 字体(FontFamily) 字体大小(FontSize) 背景颜色(Background) 字体颜色(Foreground) 边距(Margin) 水平位置(HorizontalAlignment) 垂直位置(VerticalAlignment) 等等。 而样式则是组织和重用以上的重要工具。…

Docker基础+虚拟化概念

目录 一、虚拟化简介 1、虚拟化概述 2、cpu的时间分片(cpu虚拟化) 3、cpu虚拟化性性能瓶颈 4、虚拟化工作 4.1虚拟机工作原理 4.2两大核心组件:QEMU、KVM 4.2.1QEMU: 4.2.2KVM: 5、虚拟化类型 ①全虚拟化: …

国内开通chatgpt plus会员方法

ChatGPT镜像 今天在知乎看到一个问题:“平民不参与内测的话没有账号还有机会使用ChatGPT吗?” 从去年GPT大火到现在,关于GPT的消息铺天盖地,真要有心想要去用,途径很多,别的不说,国内GPT的镜像…

微软如何打造数字零售力航母系列科普02 --- 微软低代码应用平台加速企业创新 - 解放企业数字零售力

微软低代码应用平台推动企业创新- 解放企业数字零售力 微软在2023年GARTNER发布的魔力象限图中处于头部领先(leader)地位。 其LCAP产品是Microsoft Power Apps,扩展了AI Builder、Dataverse、Power Automate和Power Pages,这些都包…

Vue3 Vite配置环境变量

Vue3 Vite配置环境变量 相关文档配置.env文件vite.config.jspackage.json 使用 相关文档 Vite 官方中文文档:https://cn.vitejs.dev/环境变量和模式:https://cn.vitejs.dev/guide/env-and-mode.html#env-file在配置中使用环境变量:https://c…

SCADA系统通过巨控GRM模块实现OPC协议远程监控PLC

SCADA系统和PLC不在同一个地方,需要远程监控和控制PLC,可以通过巨控GRM模块来实现,通过OPC协议转巨控服务器远程读写PLC寄存器,从而完成远程监控PLC。 要实现SCAKDA系统远程监控PLC,关键是要实现SKADA能通过互联网访问…

都2024 年了,可以卸载的VS Code 插件

在 VS Code 中,庞大的插件市场提供了丰富多样的扩展功能,以增强编码体验和效率。然而,如果你安装了很多插件,就可能会导致: 性能下降:过多的插件可能导致 VS Code 的启动速度变慢,特别是在启动或…

[2021最新]大数据平台CDH存储组件kudu之启用HA高可用(添加多个master)

今天在做kudu高可用的时候没有参考官网,直接按照常规方式(添加角色—>编辑属性—>启动)结果发现报错?然后参考了一下文档之后发现这玩意儿还有点玄学,做一下记录。 1.添加两个master。kudu master有leader和foll…

用云手机运营TikTok有什么好处?

在数字化浪潮的推动下,社交媒体平台正重塑商业推广与品牌建设的面貌。TikTok,这款全球热门的短视频应用,已经吸引了亿万用户的瞩目。对于出海电商和品牌推广而言,借助云手机运营TikTok,能够解锁更多潜在可能&#xff0…

【Linux开发 第十二篇】搭建JavaEE环境

搭建开发环境 搭建javaEE环境 搭建javaEE环境 在Linux下开发JavaEE需要安装软件包: 安装jdk 安装步骤: 在opt目录下创建jdk目录通过xftp上床到jdk目录中进入到jdk目录中,解压jdk压缩包在/usr/local下创建java目录将解压完成的jdk文件移动…

【MySQL | 第六篇】数据库三大范式

文章目录 6.数据库设计三大范式6.1第一范式6.2第二范式6.3第三范式6.4反范式设计 6.数据库设计三大范式 6.1第一范式 第一范式(1NF):确保每列的原子性(强调的是列的原子性,即列不能够再分成其他几列)。实际上,第一范式…

react学习(一)之初始化一个react项目

React 是一个用于构建用户界面(UI)的 JavaScript 库,用户界面由按钮、文本和图像等小单元内容构建而成。React 帮助你把它们组合成可重用、可嵌套的 组件。从 web 端网站到移动端应用,屏幕上的所有内容都可以被分解成组件&#xf…

在React Router 6中使用useRouteLoaderData钩子获取自定义路由信息

在 React Router 6 中怎么像vueRouter一样,可以在配置路由的时候,定义路由的元信息(附加信息)?答案是可以的。稍有些复杂。核心是通过为每个路由定义了一个 loader 函数,用于返回自定义的路由信息,然后通过useRouteLoaderData 钩子…