Python数据分析大作业(ARIMA 自回归积分滑动平均模型) 4000+字 图文分析文档 销售价格库存分析+完整python代码

资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

完整代码分析

同时销售量后1000的sku品类占比中(不畅销产品)如上,精品类产品占比第一,达到66.7%,其次是香化类产品,占比11.90%,远远小于精品类产品,酒水类产品占比7.3%,有税商品免税其他商品和电子类产品分别占比6.40%、6.40%、1.3%,

将数据按照毛利进行排序,毛利前1000和后1000的sku品类占比如下,

可以发现按照毛利排序,各品类的sku数量占比区别不如按照销量排序的各品类sku数量占比那么大,其中按照毛利排序的sku前1000,品类sku占比最大的是香化类,其次是精品类,它们占比分别达到33.2%和31.5%,其中占比最小的是免税商品其他类,说明该品类的毛利率相对较小,而毛利率较大的为精品类和香化类,这和品牌有一定关系,人民生活正在慢慢变好,精品类商品能满足大部分人民的精致生活,同时香化类产品受众多为女性,商品需求大,毛利也高。对于毛利sku后1000的商品,其中有税商品和精品类和香化类商品仍然占领霸主位置,原因可能由于对于精品类和香化类的部分商品经常打折来吸引顾客,所以这部分商品的毛利较低,sku后1000商品品类占比最大的为有税商品,占比达到33.00%,由于考虑到税额加上顾客的消费能力,这部分的商品毛利相对低一点,同时香化类和精品类占比也达到25.9%和25.6%,占比最小的为电子产品,占比为1.3%。

分析sku销量前1000和销量后1000商品的毛利率,得到毛利率的条形图如下,

从上图可以发现sku前1000商品的毛利率大概在0.2到0.5左右,而sku后1000的商品的毛利率大部分在0.4到0.5左右,可以认为销量高的商品其毛利率未必会比销量低的商品的毛利率高,这给我们销售商品很有启示,对于商品售卖我们未必要一定去打折扣吸引顾客(当然折扣对部分顾客有一定吸引力),对于畅销品我们就没必要去打折,因为商品本身可能就供不应求,这样通过畅销品的提高整个商场的利润,对于不畅销商品,我们也不一定要去打折,对于不畅销商品,可能其受众较小,而对于那部分受众来说,这对于其他人最不畅销的商品对于他们来说可能是必需品,所以也没必要打折,通过保证毛利,也能提高商场的利润。

价格分析

首先将各品类下的大类进行区间划分,拟定划分6个区间,然后计算每个品类下每个大类的每个价格区间的个数,各品类商品的大类价格区间条形图如下,

上面4个品类,精品品类、免税其他品类、香化品类、有税品类的价格区间如图,取免税其他品类进行分析说明,首先免税其他品类下面有六个大类,对这六个大类进行区间划分,划分6个价格区间,其中条形图的高度为对应区间的个数,对于所有的大类,其位于低价位的价格区间个数是最多的,说明大多数人的消费能力有限,会偏向于低价位的商品,对于精品品类,其类下的高级珠宝在各个价格区间中价格区间个数相对其他大类会更多一点,说明高级珠宝受价格的影响相对较小,因为高级珠宝的受众基本是固定的,这些顾客不管价格高或者低都是能够消费的起,所以价格对他们影响不大。对于香化类,价格区间个数很大一部分都在最低价格区间内,随着化妆品行业兴起,很多爱美的顾客都选择购买化妆品,但大多数人的消费能力有限,所以低价格的化妆品成为了畅销产品,而且低价格的化妆品价格区间个数远远高于高价格的价格区间个数。对于酒水和电子品类,其对应的大类只有一个,如下所示,对于这两个品类,可以发现酒水品类的低价位远远比其他价位的多,说明便宜酒水的受众很多,而昂贵酒水受众较少,所以对于低价位酒水可以通过促销来促进购买,对于高价位酒水则可以定高价保证利润。对于电子产品,其中等价位及以下的销售区间个数比较多,相当于珠宝酒水来说,人民更愿意在电子产品上花钱,这也是科技给人们带来的便捷之处,但高价位的电子产品的区间个数仍是较少,和人们的消费习惯和消费能力有关。

接着查看各品类下的各大类的畅销产品价格区间的折扣率,这里在每一个品类中选取一个大类的价格区间折扣进行分析,对于有税品类下的个人洗护大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(35.877, 56.5] 0.6818181818181818

(56.5, 77.0] 0.640625

(77.0, 97.5] 1.0

(97.5, 118.0] 0.8571428571428571

(118.0, 138.5] 0.0

(138.5, 159.0] 0.5

最畅销产品价格区间(56.5, 77.0]

最不畅销产品价格区间(118.0, 138.5]

从上面可以发现最畅销产品价格区间位于低价区间,但其折扣率为0.6,算是较高了,而最不畅销的价格区间,其折扣率为0,结合前面的分析,对于低价产品,我们可以减小我们的折扣率来提高利润。对于不畅销的产品我们可以进行适当的折扣来促进购买,对于电子品类下的家居大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(32.326, 3875.875] 0.9583333333333334
(3875.875, 7696.5] 0.978021978021978
(7696.5, 11517.125] 0.9745347698334965
(11517.125, 15337.75] 1.0
(15337.75, 19158.375] 1.0
(19158.375, 22979.0] 1.0
最畅销价格区间(7696.5, 11517.125]

最不畅销价格区间(19158.375, 22979.0]

和有税品类不同的是,最不畅销产品价格区间为最贵的价格区间,而且最不畅销的产品价格区间达到了百分百,而最畅销产品的价格区间位于中等价位价格区间,折扣率也比较高。说明对于电子产品这一类相当难以进行修补的产品来说,人们更倾向于贵一点的,可能这和人们的消费理念和消费能力有关, 一般来说电子产品作为非易换品,人们更倾向于买好一点,用久一点,所以出现最畅销的反而不是价格最低的。对于精品品类下的服装大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(38.19, 410.342] 0.08333333333333333

(410.342, 780.273] 0.09401709401709402

(780.273, 1150.205] 0.016129032258064516

(1150.205, 1520.137] 0.058823529411764705

(1520.137, 1890.068] 0.3333333333333333

(1890.068, 2260.0] 0.11764705882352941

最畅销产品价格区间(780.273, 1150.205]

最不畅销产品价格区间(1520.137, 1890.068]

同上面一样,最畅销产品价格区间位于非位于最低价价格区间,而最不畅销的产品价格区间位于中间价位价格区间,因为对于服装类来说,每一个人都有需求,而对于消费能力不够的消费者来说,他们大多会选择网购而不会选择去商城购物,而大多数人选择去商城购买衣服的都是具有一定的消费能力,但他们消费能力也是有限,所以最畅销的价格区间是中等价位偏下,而中等价位偏上的价格区间对于消费能力不足的消费者来说性价比不高,而对于消费能力足够的消费者来说又不上档次,所以这个价位处于一个比较尴尬的位置。对于这个区间的产品可以稍微的促销提高销量。

对于酒水品类下的进口酒水大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(6.66, 9378.333] 0.27345591702027344
(9378.333, 18722.667] 1.0
(18722.667, 28067.0] 0.05555555555555555
(28067.0, 37411.333] 0.0
(37411.333, 46755.667] 0.0
(46755.667, 56100.0] 0.0
最畅销价格区间(6.66, 9378.333]
最不畅销价格区间(9378.333, 18722.667]

和上面品类不一样的是,最畅销的产品位于最低价价格区间,由于低价酒类的受众较多,而10000元以下的酒对于普通消费人群来说也不便宜,所以这个价位最畅销,同时折扣也较低,对于最不畅销的商品,是在第二低价价格区间,折扣率为1,而最高价位的酒折扣率为0反而不是最不畅销的价格区间,因为高价酒的受众较少,同时他们也有能力进行消费,所以不需要进行折扣。而最不畅销的价格区间是不受低端客户和高端客户的喜爱,所以不畅销。

对于香化品类下的个人洗护大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(59.07, 215.0] 0.09813084112149532
(215.0, 370.0] 0.0729483282674772
(370.0, 525.0] 0.10810810810810811
(525.0, 680.0] 0.0425531914893617
(680.0, 835.0] 0.25
(835.0, 990.0] 0.10526315789473684
最畅销产品价格区间(215.0, 370.0] 
最不畅销产品价格区间(680.0, 835.0]

同上面一个,畅销产品为虽为低价产品,但其并未是最低价产品,该产品折扣率低,同时不畅销产品为高价产品,但也并非是最高价区间产品,折扣率也低。说明价格并不是决定畅销和不畅销的唯一因素,对于洗护类产品,由于关乎自身皮肤健康,所以相当中等价位的产品比较畅销,对于免税其他商品的书写工具大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(5.879, 2215.883] 0.24
(2215.883, 4412.707] 0.36363636363636365
(4412.707, 6609.53] 0.0
(6609.53, 8806.353] 0.3333333333333333
(8806.353, 11003.177] 0.0
(11003.177, 13200.0] 0.0
最畅销价格区间(5.879, 2215.883]
最不畅销价格区间 (8806.353, 11003.177]
对于书写工具,由于需求较大,人民对其没有过多要求,能写就行,所以人民会倾向于较低价的产品,所以其最畅销的价格区间为最低价价格区间,而最不畅销的是倒数第二贵的价格区间,同样这个区间基本只有有强大消费能力的人去购买,而这类人往往会挑选最贵的去买,所以其成为最不畅销的产品价格区间。

库存分析

 资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

分析各品类下各大类的sku数,以条形图展现,如下

通过分析各大类的sku数可以判断哪些大类商品需要更多的库存,哪些大类商品需要的库存少,对于有税商品中的干杂大类,香化品类中的护肤大类,免税其他品类的玩具大类以及精品品类下的珠宝和钟表大类,他们sku数比较多,可以多放些库存以免缺货。

接着根据28法则,分析各品类下sku金额以及累计金额,结果如下,

从上面的表中可以发现,免税其他品类和有税品类的前20%的商品金额大概占比总的商品金额的60%,而其他四个品类大概占比了80%,符合28法则。

分析每个品类下的期初期末以及平均库存,结果如下

免税其他品类的营养保健类、干杂类库存较多,而期初库存全为0,根据上面的分析,书写工具和玩具的sku数较多,可以加大这两类库存

进口酒类期初库存也为0,可以加一些期初库存

精品品类的珠宝和钟表类的sku数较多,而上方珠宝的库存较少,可以加大该类的品类库存

对于家居品类,可以加一些期初库存。

对于有税商品,干杂类珠宝sku数较多,可以加大珠宝类的库存,根据上图,珠宝类的库存较少,可以加强库存。

标题

对于香化品类,护肤和香水大类的sku数较多,而上图香水库存较少,可以加强该库存。

使用价格区间来分析库存。

通过分析最畅销库存以及最不畅销库存来调配商品。由于品类过多,选取一部分分析,结果如下。

 有税品类的个人洗护类:

                

电子品类:

精品类

酒水类

对于这六个品类,除了有税品类下的个人洗护类的不畅销价格区间的库存相对多一点外,其他的最不畅销的价格区间的商品库存都比最畅销的商品库存低许多,说明在不同价格区间的库存来说,库存的配比没有问题,对于精品类,由于其占商品销售很大一部分,所以需要着重的分析,首先需要提高畅销产品的库存,但不一定要减小不畅销产品的库存,因为对于精品类来说,其最不畅销的产品销量可能比其他的类要高,所以可以选择增大畅销产品的库存,同时不动非畅销品的库存。而其他四个看起来正常,他们的库存远远多于最不畅销产品的库存量,在一定程度上认为是合理的。

分析有效库存的各品类的库存数

上图为总库存,有效库存,无效库存的条形图,发现有效库存占总库存的绝大多数,接下来分析不同品类下的库存数量,

有税品类的库存如下,有税品类下干杂类sku最多,其库存也最多,库存配比无误

电子类,电子类占销售比例也较大,其库存也算较多,库存配比无误,

精品类库存图如下,精品类下钟表和珠宝的sku较多,而下面珠宝的库存不多,可以适当提高其库存,相对减少其他库存

 资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/5030.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-8.1

前言: 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM(MX6U)裸机篇”视频的学习笔记,在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

使用opencv改变图片大小

使用opencv改变图片大小 图片的宽度和高度效果代码 图片的宽度和高度 宽度:图片的宽度指的是图像从左边缘到右边缘的水平跨度。在数字图像中,宽度通常是以像素(pixels)为单位来度量的。高度:图片的高度指的是图像从上…

【go项目01_学习记录day01】

博客系统 1 vscode开发go项目插件推荐1.1 CtrlShiftP(俗称万能键) :打开命令面板。在打开的输入框内,可以输入任何命令。1.2 开发时,我们需要经常查阅 Go 语言官方文档,可惜因国内访问外网不稳定&#xff0…

[Java EE] 多线程(五):单例模式与阻塞队列

1. 单例模式 单例模式是校招中最长考的设计模式之一,首先我们来谈一谈什么是设计模式: 设计模式就好像象棋中的棋谱一样,如果红方走了什么样的局势,黑方就有一定地固定地套路,来应对这样的局势,按照固定地套路来,可以保证在该局势下不会吃亏. 软件开发也是同样的道理,有很多…

Linux基础-socket详解、TCP/UDP

文章目录 一、Socket 介绍二、Socket 通信模型三、Socket 常用函数1 创建套接字2 绑定套接字3、监听连接4、接受连接5、接收和发送数据接收数据发送数据 6、关闭套接字 四、Socket编程试验1、源码server.cclient.c 2、编译:3、执行结果 五、补充TCP和UDP协议的Socke…

OpenAI 新推出 AI 问答搜索引擎——SearchGPT 震撼登场

您的浏览器不支持 video 标签。 OpenAI-SearchGPT 近日,OpenAI 曝光了自己的一款令人瞩目的 AI 问答搜索引擎——SearchGPT。这款搜索引擎带来了全新的搜索体验,给整个行业带来了巨大的压力。 SearchGPT 支持多种强大的功能。首先,它能够通过…

分布式与一致性协议之Raft算法(三)

Raft算法 如何复制日志 你可以把Raft算法的日志复制理解成一个优化后的二阶段提交(将二阶段优化成了一阶段)。优化后减少了一半的往返消息,也就是降低了一半的消息延迟,那日志复制的具体过程又是什么呢? 首先,领导者进入第一阶段…

【Redis 开发】多级缓存,本地进程缓存Caffeine

多级缓存 多级缓存本地进程缓存CaffeineCaffeine三种缓存驱逐策略 多级缓存 Redis处理并发的能力是非常强大的,但是tomcat的支持并发的能力跟不上Redis的性能,导致整体性能的下降 Redis缓存失效时,会对数据库产生冲击,之间再无屏…

LeetCode1017题:负二进制转换(原创)

【题目描述】 给你一个整数 n ,以二进制字符串的形式返回该整数的 负二进制(base -2)表示。注意,除非字符串就是 "0",否则返回的字符串中不能含有前导零。 示例 1: 输入:n 2 输出&…

基于Springboot的数字化农家乐管理平台(有报告)。Javaee项目,springboot项目。

演示视频: 基于Springboot的数字化农家乐管理平台(有报告)。Javaee项目,springboot项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系…

踏上R语言之旅:解锁数据世界的神秘密码(四)

文章目录 前言一、多元线性回归1.多元线性回归模型的建立2.多元线性回归模型的检验 二、多元线性相关分析1.矩阵相关分析2.复相关分析 三、回归变量的选择方法1.变量选择准则2.变量选择的常用准则3.逐步回归分析 总结 前言 回归分析研究的主要对象是客观事物变量间的统计关系。…

选择内核注意力 SK | Selective Kernel Networks

论文名称:《Selective Kernel Networks》 论文地址:https://arxiv.org/pdf/1903.06586.pdf 代码地址:https://github.com/implus/SKNet 在标准的卷积神经网络中,每层人工神经元的感受野被设计为具有相同的大小。神经科学界已经广…

使用OkHttp 缓存 API 调用提高Android应用性能

使用OkHttp 缓存 API 调用提高Android应用性能 坦率地说,我们都遇到过这样的情况——焦急地刷新应用,看着加载图标不停地旋转,等待那个至关重要的 API 响应。这样的等待我们已经是炉火纯青了,是吧?手指有节奏地轻敲屏…

《R语言与农业数据统计分析及建模》——多重共线性和逐步回归

一、多重共线性 多重共线性:在多元线性回归时,多个自变量之间存在高度相关关系,时模型估计失真或难以估计准确的情况。 一般地,多元线性回归中自变量间应尽量相互独立。常规模型诊断方法难以检测多重共线性。 1、案例解释 作物产…

ActiveMQ 反序列化漏洞 (CVE-2015-5254)

一、漏洞描述 Apache ActiveMQ 是由美国阿帕奇(Apache)软件基金会开发的开源消息中间件,支持 Java 消息服务、集群、Spring 框架等。属于消息队列组件(消息队列组件:分布式系统中的重要组件,主要解决应用耦合、异步消息…

数据库|TiDB-Server API的高效应用指南

一、API介绍 1.Status 显示TiDB 连接数、版本和git_hash 信息 tidb-server_ip:status_port/status { "connections": 0, "version": "5.7.25-TiDB-v6.1.1", "git_hash": "5263a0abda61f102122735049fd0dfadc7b7f822" } 2.St…

mysql-sql-练习题-4-标记

标记 连续登录2-7天用户建表排名找规律 最大连胜次数建表只输出连胜结果输出所有连续结果 连续登录2-7天用户 建表 create table continuous_login(user_id1 integer comment 用户id,date_login date comment 登陆日期 ) comment 用户登录表;insert into continuous_login val…

LT2611UX四端口 LVDS转 HDMI2.0,带音频

描述LT2611UX 是一款面向机顶盒、DVD 应用的高性能 LVDS 至 HDMI2.0 转换器。LVDS输入可配置为单端口、双端口或四端口,具有1个高速时钟通道和3~4个高速数据通道,工作速率最高为1.2Gbps/通道,可支持高达19.2Gbps的总带宽。LT2611UX 支持灵活的…

002 springCloudAlibaba Sentinel流控-关联

当与A关联的资源B达到阀值后,就限流A自己 文章目录 FlowLimitController.javaSentinelServerApplication.javaServletInitializer.javaapplication.yamlpom.xmlpom.xml 启动Sentinel8080 - java -jar sentinel-dashboard-1.7.0.jar 启动微服务8401 启动8401微服务…

72、栈-每日温度

思路&#xff1a; 第一种方法&#xff0c;双循环&#xff0c;第一层循环拿出一个元素&#xff0c;第二层循环寻找最近比当前大的元素位置。 第二种方法&#xff1a;使用栈来实现。 初始化&#xff1a; int[] ans 用来存储每一天之后多少天温度会升高。Stack<Integer> 用…