十三.youyiku分析案例(数分)

目录

youyiku分析案例(数分)

大框操作

1.销售情况随着时间的变化

2.不同产品的销量

柱状图(bar)改颜色+排序

seaborn库(柱)

--排序

3.每个城市的人喜欢的购物方式

4-不同年龄段的购物方式

添加标签段及值

--创建新表

对标签分别计算

绘图分析


youyiku分析案例(数分)


import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
​
plt.rcParams["font.sans-serif"] = "SimHei"
plt.rcParams["axes.unicode_minus"] = False
​
df_data = pd.read_csv("../data/uniqlo.csv")

大框操作

--快速操作描述
df_data.describe()对数据进行大体的计算.
df_data.info()查看标签及数据类型.
df_data.shape查看几行几列.
df_data.head(10)读取几行数据.

1.销售情况随着时间的变化

# 1、销售情况随着时间的变化
# print(df_data.shape)
# df_data["wkd_ind"].unique()         #"wkd_ind"标签下的数据去重.--进行查看.
reven = df_data.groupby("wkd_ind")["revenue"].mean()    #分组操作,对wkd_ind标签进行分组,并展示revenue标签的平均值.
reven
plt.figure(figsize=(6,4),dpi=150)   #展开画布。
plt.bar(reven.index,reven.values)   #柱状图,直接传宽(标签名)和高(对应值)。
plt.show()

df_data.groupby("wkd_ind").revenue.describe()   #分组后,对revenue标签进行大体计算。

2.不同产品的销量

# 2、不同产品的销量
df_data["product"].unique()     #对标签product进行去重--查看.
​
types = df_data.groupby("product").revenue.describe()       #对produce进行分组,对revenue进行大体计算.
# types
plt.figure(figsize=(6,5),dpi=150)
plt.bar(types.index, types["mean"])         #这里的高只获取大体计算时的平均值.
plt.show()

柱状图(bar)改颜色+排序

types = df_data.groupby("product").revenue.mean().sort_values(ascending=False)      #.sort_values(ascending=False)进行排序.(默认是True,升序)
# types
plt.figure(figsize=(6,5),dpi=150)
plt.bar(types.index,types.values,color=["red","orange","green","yellow"])   #指定柱状图(bar)的颜色.(随机.)
plt.show()

seaborn库(柱)

# pip install seaborn
import seaborn as sns   #基于matplotlib,有些操作会简单点.
plt.figure(figsize=(6,4),dpi=150)
sns.barplot(x="product",y="revenue",data=df_data)       #分别设置x,y轴的标签名,并给出数据从哪来的(data=)
#默认是取平均值.
plt.show()

--排序
plt.figure(figsize=(6,4),dpi=150)
sns.barplot(x="product",y="revenue",data=df_data,order=df_data.groupby("product").revenue.mean().sort_values(ascending=False).index      #这里排完序后,获取的是对象,我们直接按照标签排就可以了(.index)
)

3.每个城市的人喜欢的购物方式

df_data.head()
df_data["channel"].unique()
df_data['city'].unique()
​
df_data.groupby(["city","channel"]).revenue.mean()
plt.figure(figsize=(6,4),dpi=150)
sns.barplot(x="city",y="revenue",data=df_data,hue="channel",      #图例.estimator=sum,      #参数默认求平均值,这参数自己改.order=df_data.groupby("city").revenue.sum().sort_values(ascending=False).index    #排序,按sum.
)
plt.show()

4-不同年龄段的购物方式

plt.figure(figsize=(6,4),dpi=150)
sns.barplot(x="age_group",y="revenue",hue="channel",data=df_data,order=df_data.groupby("age_group").revenue.sum().sort_values(ascending=False).index
)
plt.show()

添加标签段及值

df_data.head()
#无--->在最后字段进行添加;        有---->进行修改.
df_data["price"] = df_data["revenue"] / df_data["quant"]        
df_data["margin"] = (df_data["revenue"] / df_data["quant"]) - df_data["unit_cost"]
df_data.head()

--创建新表

--上面我们创建了新的字段,现在我们就可以创建新的二维对象.

df_data_new = pd.DataFrame({"城市":df_data["city"],"品牌":df_data["product"],"利润":df_data["margin"],"成本":df_data["unit_cost"],"单价":df_data["price"]
})
df_data_new

对标签分别计算

分组+标签分别计算

datas = df_data_new.groupby("城市")["利润","成本","单价"].mean()
datas

绘图分析

plt.figure(figsize=(7,5),dpi=150)
width = 0.2     #柱的宽度.(下面都要传参)
x = np.arange(len(datas.index))     #传x轴的坐标.(看下面) ---  x轴有多少个值,先弄出来.
plt.bar(x,datas["利润"],width=width,label="利润",color="red")
plt.bar(x+width,datas["成本"],width=width,label="成本",color="green")
plt.bar(x+width*2,datas["单价"],width=width,label="单价",color="orange")
#  这里每个柱x轴都要偏移一下,更美观.(柱的间隔)
plt.xticks(x+width,labels=datas.index)  #x轴标签名的间隔.
plt.legend()
plt.show()


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/784030.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

session反序列化漏洞2——ctfshow web263

题目链接 https://ctf.show/challenges#web263-723 解题思路 进去先是一个登录框 目录扫描一下发现存在源码泄露 查看源码 index.php error_reporting(0);session_start();//超过5次禁止登陆if(isset($_SESSION[limit])){$_SESSION[limti]>5?die("登陆失败次数超…

智过网:中级安全工程师一年能挣多少钱?工资高吗?

中级安全工程师的年收入是广大从业者非常关心的问题。毕竟,了解自己所处行业的薪资水平,不仅有助于规划个人职业发展,还能为日常生活中的决策提供重要参考。那么,中级安全工程师一年究竟能挣多少钱呢?工资又是否算高呢…

[leetcode] 100. 相同的树

给你两棵二叉树的根节点 p 和 q ,编写一个函数来检验这两棵树是否相同。 如果两个树在结构上相同,并且节点具有相同的值,则认为它们是相同的。 示例 1: 输入:p [1,2,3], q [1,2,3] 输出:true示例 2&a…

YOLOV5训练自己的数据集教程(万字整理,实现0-1)

文章目录 一、YOLOV5下载地址 二、版本及配置说明 三、初步测试 四、制作自己的数据集及转txt格式 1、数据集要求 2、下载labelme 3、安装依赖库 4、labelme操作 五、.json转txt、.xml转txt 六、修改配置文件 1、coco128.yaml->ddjc_parameter.yaml 2、yolov5x.…

第1章.提示词:开启AI智慧之门的钥匙

什么是提示词? 提示词,是引导语言模型的指令,让用户能够驾驭模型的输出,确保生成的文本符合需求。 ChatGPT,这位文字界的艺术大师,以transformer架构为基石,能轻松驾驭海量数据,编织…

嵌入式第一部分-第一集:ARM那些你得知道的事

ARM:Advanced RISC Machine,先进精简指令集机器 ARM公司只做设计,不生产。 国内IC生产厂商:华为海思、全志、瑞芯微、MTK(联发科) 扩展:ARM的商业模式了解。 使用三星S5PV210开发板进行视频的讲…

大数据 - Hadoop系列《五》- HDFS文件块大小及小文件问题

系列文章: 大数据- Hadoop入门-CSDN博客 大数据 - Hadoop系列《二》- Hadoop组成-CSDN博客 大数据 - Hadoop系列《三》- HDFS(分布式文件系统)概述_大量小文件的存储使用什么分布式文件系统-CSDN博客 大数据 - Hadoop系列《三》- MapRedu…

LeetCode算法——数组/字符串篇

对刷过的算法进行总结,所用解法都是最符合我个人逻辑的,以后再刷的话就看这篇帖子了 # 代码随想录——数组理论基础 首先要知道数组在内存中的存储方式,这样才能真正理解数组相关的面试题 数组是存放在连续内存空间上的相同类型数据的集合 …

IntelliJ IDEA 2023 for Mac 好用的Java开发工具

IntelliJ IDEA 2023是一款由JetBrains开发的强大的集成开发环境(IDE)软件,适用于多个编程语言。它旨在提高开发人员的生产力和代码质量,具有以下多种特色功能: 软件下载:IntelliJ IDEA 2023 v2023.3.6中文激…

2d导入人物素材进行分割后设置图层

1、设置分辨率大小 2、相机调整大小,要符合场景 3、选择2D sprite 编辑器 或者 点击这个也行 4、分割图像 5、设置过滤模式 6、图层设置

CAJViewer8.1下载地址及安装教程

CAJViewer是中国学术期刊(CAJ)全文数据库的专用阅读软件。CAJViewer是中国知识资源总库(CNKI)开发的一款软件,旨在方便用户在线阅读和下载CAJ数据库中的学术论文、期刊和会议论文等文献资源。 CAJViewer具有直观的界面…

Modbus协议介绍

Modbus存储区 从机存储数据,那么肯定要有一个存储区,那就需要文件操作,我们都知道这文件可以分为只读(-r)和读写(-wr)两种类型 并且存储的数据类型可以分为 :布尔量 和 16位寄存器 布尔量比如IO口的电平高低,灯的开关…

金仓方案 | 全国高速联网收费系统国产化升级进行时

近年来,国家提出了交通强国建设战略,鼓励在交通领域加强自主创新,推动产业转型升级。高速公路收费系统作为高速公路行业的核心,也是交通领域信息技术应用创新的重中之重,自主可控问题成为系统建设和运营的关键难点。 2…

[机器学习]练习闵可斯基距离

闵可斯基距离(Minkowski distance)是一种用于衡量向量空间中两点之间距离的方法。它是曼哈顿距离和欧几里得距离的一般化形式。闵可斯基距离使用一个参数 p 来调整计算方法,其中 p 是一个大于 0 的实数值。 在二维空间中,闵可斯基…

可控占比闪烁电路

1启动Q0.0 亮一秒歇一秒循环执行 定时器设置为2秒 使用指令LD> T0 k10 控制亮和灭时间

mysql 用户管理-权限管理

学习了用户管理,再学习下权限管理。 3,权限管理 权限管理主要是对登录到MySQL的用户进行权限验证。所有用户的权限都存储在MySQL的权限表中,不合理的权限规划会给MySQL服务器带来安全隐患。数据库管理员要对所有用户的权限进行合理规…

腾讯2024实习生在线笔试-0331

Q1 小红的图上染色 小红拿到了一个无向图,其中一些边被染成了红色。 小红定义一个点是“好点”,当且仅当这个点的所有邻边都是红边。 现在请你求出这个无向图“好点”的数量。 注:如果一个节点没有任何邻边,那么它也是好点。 …

2、Cocos Creator 下载安装

Cocos Creator 从 v2.3.2 开始接入了全新的 Dashboard 系统,能够同时对多版本引擎和项目进行统一升级和管理!Cocos Dashboard 将做为 Creator 各引擎统一的下载器和启动入口,方便升级和管理多个版本的 Creator。还集成了统一的项目管理及创建…

【MySQL】内外连接——内连接、外连接、左外连接、右外连接、内外连接的区别、左外连接和右外连接的区别

文章目录 MySQLMySQL表的内连接和外连接1. 内连接2. 外连接2.1 左外连接2.2 右外连接 3. 内外连接的区别4. 左外连接和右外连接的区别 MySQL MySQL表的内连接和外连接 MySQL 中的内连接(INNER JOIN)和外连接(包括左外连接 LEFT JOIN 和右外连…

考研数学|听完一遍汤家凤基础,1800都没思路,怎么办?

看了我这篇回答,保证你可以顺利的做1800题! 如果你听了汤家凤老师的课,但是做题没思路,请不要担心,也不要急着换老师,你很有可能是方法错了。 请你反思一下: 1、你是不是听完课立刻就去做题。…