数据分析案例-二手车用户数据可视化分析(文末送书)

 

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

1.项目背景

2.数据集介绍

3.技术工具

4.导入数据

5.数据可视化

文末推荐与福利


1.项目背景

        二手车市场作为汽车行业中的重要组成部分,一直备受关注。随着社会经济的不断发展和人们生活水平的提高,越来越多的消费者选择购买二手车。这一趋势使得二手车市场的规模不断扩大,也引起了人们对二手车市场的关注和研究。

        在二手车市场中,用户数据是一个极具价值的研究对象。通过对二手车用户数据的深入分析,可以揭示出用户的购车偏好、消费习惯、区域分布等重要信息。这些信息对于汽车生产企业、销售商以及政府部门来说都具有重要意义。例如,汽车生产企业可以根据用户数据来调整产品结构和定价策略;销售商可以根据用户数据来开展精准营销和销售服务;政府部门可以通过对用户数据的分析来指导相关政策的制定和调整。

        此外,通过对用户数据进行可视化分析,可以更直观地展现数据之间的关联性和趋势变化。通过可视化手段,决策者可以更清晰地了解用户的行为特征和市场变化趋势,从而更准确地制定相应的战略和政策。

        因此,对二手车用户数据进行可视化分析具有重要的理论和实践意义。这不仅有助于深入了解二手车市场的运行情况和用户特征,还能为相关利益方提供决策参考,推动二手车市场的健康发展。

2.数据集介绍

        数据集来源于Kaggle,原始数据集为美国二手车市场用户数据,共有7906条,18个变量,各变量含义如下:

Sales_ID(销售ID)

name(二手车名称)

year(购车年份)

selling_price(二手车当前销售价格)

km_driven(总行驶公里数)

Region(使用地区)

State or Province(使用的州或省)

City(使用城市)

fuel(燃料类型)

seller_type(谁在出售汽车)

transmission(汽车的变速器类型)

owner(业主类型)

mileage(汽车行驶里程)

engine(发动机功率)

Max_power(最大功率)

torque(转矩)

seats(座位数)

sold(二手车是否售出)

3.技术工具

Python版本:3.9

代码编辑器:jupyter notebook

4.导入数据

首先导入数据可视化用到的第三方库并加载数据

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
from plotly.offline import iplot 
import warnings
warnings.filterwarnings('ignore')df = pd.read_csv("UserCarData.csv")
df.head()

查看数据大小

查看数据基本类型 

查看数值型变量的描述性统计

查看非数值型变量的描述性统计

统计缺失值情况 

 

 统计重复值情况

5.数据可视化

# 二手车名称分析
print(f"Most Used Sold Car '{df['name'].value_counts().idxmax()}'")
print(f"Lowest Used Car Sold '{df['name'].value_counts().idxmin()}'")
iplot(px.bar(df['name'].value_counts()[:20],labels={'value':'Count','name':'Name'},color=df['name'].value_counts()[:20].index,text_auto=True,title='Top Used Cars Sold'
))

# 二手车年份分析
print(f"Most Year Used Sold Car '{df['year'].value_counts().idxmax()}'")
print(f"Lowest Year Used Car Sold '{df['year'].value_counts().idxmin()}'")
iplot(px.bar(df['year'].value_counts()[:20].sort_index(ascending=False),labels={'value':'Count','year':'Year'},color_discrete_sequence=['#c72320'],text_auto=True,title='Top Year Used Cars Sold'
).update_xaxes(type=('category')))

# 地区分析
iplot(px.pie(values=df['Region'].value_counts(),names=['Central','West','East','South'],title='Region where Sold Used Car'
).update_traces(textinfo='label+percent'))

# 省或州分析
print(f"Top State or Province where Sold Used car '{df['State or Province'].value_counts().idxmax()}'")
print(f"Least State or Province where Sold Used car '{df['State or Province'].value_counts().idxmin()}'")
iplot(px.bar(df['State or Province'].value_counts().sort_values(ascending=True)[:30],orientation='h',color=df['State or Province'][:30].index,title='Top State or Province Sold Used Car',labels={'value':'Count'}
))

# 城市分析
print(f"Top City where Sold Used car '{df['City'].value_counts().idxmax()}'")
print(f"Least City where Sold Used car '{df['City'].value_counts().idxmin()}'")
iplot(px.bar(df['City'].value_counts().sort_values(ascending=False)[:20],color=df['City'][:20].index,title='Top City Sold Used Car',labels={'value':'Count'},text_auto=True
))

# 燃料分析
print(f"Top Fuel Used in Used car '{df['fuel'].value_counts().idxmax()}'")
print(f"Least Fuel Used in Used car '{df['fuel'].value_counts().idxmin()}'")
iplot(px.pie(values=df['fuel'].value_counts(),names=['Diesel','Petrol','CNG','LPG'],title='Fuel Used in Used Car'
).update_traces(textinfo='label+percent'))

# 卖家类型分析
print(f"Most Type of Seller '{df['seller_type'].value_counts().idxmax()}'")
iplot(px.pie(values=df['seller_type'].value_counts(),names=['Individual','Dealer','Trustmark_Dealer'],title='Types of Seller Used Cars'
).update_traces(textinfo='label+percent'))

# 变速器类型
iplot(px.pie(values=df['transmission'].value_counts(),names=['Manual','Automatic'],title='Types of Transmissions Used in Used Sold Cars'
).update_traces(textinfo='label+percent'))

# 业主类型分析
print(f"Most Owner Sold Used Cars '{df['owner'].value_counts().idxmax()}'")
iplot(px.pie(values=df['owner'].value_counts(),names=['First Owner','Second Owner','Third Owner','Fourth Above Owner','Test Drive Car'],title='Owners of Used Cars'
).update_traces(textinfo='label+percent'))

# 转矩分析
iplot(px.bar(df['torque'].value_counts().sort_values(ascending=False)[:20],orientation='h',color=df['torque'][:20].index,title='Top Torque Used in Used Sold Cars',labels={'value':'Count','torque':'Torque'}
))

# 行驶里程分析
plt.figure(figsize=(15,6))
sns.kdeplot(df['mileage'],fill=True)
plt.xlabel("Mileage")
plt.show()

文末推荐与福利

《AI绘画教程:Midjourney使用方法与技巧从入门到精通》免费包邮送出3本!

内容简介:      

       本书介绍了当前AI绘画领域极具人气的绘画工具——Midjourney,并全面系统地讲述了Midjourney绘画的基本应用技能和相关领域的实战案例。

        全书共分为11章,第1章介绍了Midjourney的基础知识;第2章至第6章讲解了Midjourney 绘画的基础技能,包括Midjourney的注册、登录与订阅流程,Midjourney绘画初体验,使用Midjourney的提示词、指令、参数的方法,以及Midjourney生图方式与实战;第7章至第10章为Midjourney 绘画的实战应用,讲解了Midjourney在设计、绘画、摄影、创意生图等领域的应用,提供了实际案例以供借鉴;第11章为扩展部分,介绍了Midjourney社区的氛围及社区成员之间交流学习等相关知识。

编辑推荐:           

一本书读懂Midjourney绘画,让创意更简单,让设计不再难!

零基础快速入门:Midjourney基础操作+构建有效提示词+精准生图+案例驱动

提示词速查宝典:涵盖平面设计+产品设计+室内设计+建筑设计+时尚设计+工业设计+绘画材料和技法+绘画主题+绘画风格+CG插画+摄影主题+摄影技术等提示词速查手册

超值附赠:超全领域的提示词速查表,Midjourney指令和参数速查表等

  • 抽奖方式:评论区随机抽取3位小伙伴免费送出!
  • 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!
  • 活动截止时间:2024-3-9 20:00:00
  • 京东链接:https://item.jd.com/14002721.html

    当当链接:http://product.dangdang.com/29685117.html

 名单公布时间:2024-3-9 21:00:00 

 

资料获取,更多粉丝福利,关注下方公众号获取

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/723398.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【深度学习笔记】计算机视觉——风格迁移

风格迁移 摄影爱好者也许接触过滤波器。它能改变照片的颜色风格,从而使风景照更加锐利或者令人像更加美白。但一个滤波器通常只能改变照片的某个方面。如果要照片达到理想中的风格,可能需要尝试大量不同的组合。这个过程的复杂程度不亚于模型调参。 本…

leetcode 11.盛最多水的容器

题目链接:https://leetcode.cn/problems/container-with-most-water/ 题目描述 给定一个长度为 n 的整数数组 height 。有 n 条垂线,第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线,使得它们与 x 轴共同构成的容器可以…

【unity实战】事件(Event)的基本实战使用

文章目录 最终效果前言一、素材二、角色金币交互1. 拾取金币2. 显示金币数UI 完结 最终效果 前言 之前我们介绍过委托的用法,具体可以跳转:【unity小技巧】委托(Delegate)的基础使用和介绍 这期来讲讲事件,使用你会发…

【SpringBoot3.x教程02】SpringBoot配置文件详解

前言:什么是配置文件 SpringBoot的配置文件是指用于定义和管理SpringBoot应用程序配置的文件。这些配置文件允许开发者调整和控制应用程序的行为,而无需改变代码。主要有两种格式的配置文件: 1、application.properties:这是一种使…

华金证券2024:以“芯”助先进算法,以“算”驱万物智能

本文选自“以芯助先进算法,以算驱万物智能”。 一、半导体景气度有望迎来复苏 从半导体行业景气度来看,在经历了2022、2023年的去库存周期 后,半导体销售额有望在2024年迎来复苏。据WSTS数据显示,全球半导体产品销售总额从1999 年…

OJ_一端进,两端出

题干 C实现 #include <stdio.h> #include <list> #include <vector>using namespace std;int main() {int n, k;scanf("%d%d", &n, &k);vector<int> insertVec(n);for (int i 0; i < n; i) {scanf("%d", &insert…

四、西瓜书——支持向量机

第六章 支持向量机 1.间隔与支持向量 支持向量机的原理是寻找与支持向量具有最大间隔的划分超平面。支持向量机具有一个重要性质: 训练完成后,大部分的训练样本都不需保留,最终模型仅与支持向量有关. 首先&#xff0c;超平面的方程为&#xff1a; 点到超平面的距离为&#xff…

单表练习12.0

一个学生表 分别记录姓名&#xff0c;年龄&#xff0c;性别&#xff0c;班级&#xff0c;语文&#xff0c;数学&#xff0c;英语字段 create table student2( id int primary key , name char(20), sex char(10), age int(3), mobile char(20), class char(10), engli…

男子失眠焦虑、胸闷气短发作,多次跑医院,检查结果却显示无异常!

植物神经紊乱指的是人体内部的自主神经系统失去平衡&#xff0c;导致一系列的生理和心理方面的异常状态。人体的自主神经系统分为交感神经系统和副交感神经系统&#xff0c;它们共同调节心血管系统、消化系统、呼吸系统、内分泌系统等器官的功能。当这两个系统的平衡被打破&…

IPSEC---VPN

文章目录 目录 文章目录 一.TCP/IP 协议的缺点 二.IPsec诞生背景 IPsec可提供安全服务 三.IPsec协议簇 IPsec的两种工作模式 传输模式 隧道模式&#xff1a; IPsec的安全协议 AH 协议:鉴别头协议 ESP协议&#xff1a;封装安全载荷协议 AH与ESP对比 AHESP报文&#xff1a…

【Python】Python注册微服务到nacos

Python注册微服务到Nacos 1.Nacos部署 github 的nacos项目的发布页&#xff08;Releases alibaba/nacos GitHub &#xff09;&#xff0c;选择所要下载的nacos版本&#xff0c;在nacos下方的assets中选择安装包进行下载。 解压nacos安装包到指定目录。 tar -zxvf nacos-ser…

国产通讯芯片D3232介绍,要用于工控主板、工业控制器、程序烧录下载器、仿真器、新能源充电桩等众多涉及RS232通讯的产品

一、应用领域 D3232芯片主要用于工控主板、工业控制器、程序烧录下载器、仿真器、新能源充电桩等众多涉及RS232通讯的产品。 二、基本特性 D3232芯片由两个线路驱动器、两个线路接收器和双电荷泵电路组成&#xff0c;具有HBM>15kV、CDM>2kV的ESD保护能力&#xff0c;并且…

element-ui plus v2.60 终于修复了 radio checkbox 取值不明确的问题,label value 值

element-ui plus v2.60 终于修复了 radio checkbox 取值不明确的问题&#xff0c;label value 值 昨天想反馈这个关于 label 和 value 的问题的时候&#xff0c;发现新版本已经修正这个问题了。 一、ElementUI 旧版关于 label 和 value 的问题 从之前 element-ui 用过来的&a…

两天学会微服务网关Gateway-Gateway网关限流

锋哥原创的微服务网关Gateway视频教程&#xff1a; Gateway微服务网关视频教程&#xff08;无废话版&#xff09;_哔哩哔哩_bilibiliGateway微服务网关视频教程&#xff08;无废话版&#xff09;共计17条视频&#xff0c;包括&#xff1a;1_Gateway简介、2_Gateway工作原理、3…

Sublime Text 格式化Json文件 之 Pretty Json

需要使用到 Pretty Json插件。 一、安装方法 sublime 下&#xff0c;按快捷键 Comand control p&#xff0c; 输入install Package,然后回车 等几秒钟&#xff0c;加载启动进程完毕后弹出的页面中输入pretty json, 然后回车 等待几秒钟&#xff0c;可以查看Sublime 最下面的…

HUAWEI 华为交换机 配置 MAC 防漂移 防MAC伪造示例

组网需求 某企业网络中&#xff0c;用户需要访问企业的服务器。如果某些非法用户从其他接口假冒服务器的MAC 地址发送报文&#xff0c;则服务器的 MAC 地址将在其他接口学习到。这样用户发往服务器的报文就会发往非法用户&#xff0c;不仅会导致用户与服务器不能正常通信&…

【粉丝福利】一本书讲透ChatGPT,实现从理论到实践的跨越!大模型技术工程师必读

&#x1f33c;一、前言 OpenAI 在 2022 年 11 月推出了人工智能聊天应用—ChatGPT。它具有广泛的应用场景&#xff0c;在多项专业和学术基准测试中表现出的智力水平&#xff0c;不仅接近甚至有时超越了人类的平均水平。这使得 ChatGPT 在推出之初就受到广大用户的欢迎&#xf…

在Windows 10和11中打开事件查看器的11种方法,总有一种适合你

Windows事件查看器是一个功能强大的工具,可以记录电脑从启动到关机的所有过程。你可以使用它查看有关应用程序错误、不同系统服务生成的警告的详细信息,以及有关驱动程序和服务状态的信息。这就是为什么当你需要识别或解决计算机或设备上的问题时,Windows 11和Windows 10事件…

【金九银十】,架构师花费近一年时间整理出来的安卓核心知识

面试经历 主要是根据回忆总结的&#xff08;会有遗漏点&#xff09;。 1. 腾讯&#xff08;QQ音乐&#xff09; 腾讯面试涉及到的范围也很广&#xff0c;甚至问到了C、Kotlin Flutter &#xff0c;也具有一定挑战性的&#xff0c;以下包括腾讯腾讯安卓客户端三面&#xff0c…

国创证券|降准对股市的影响,利好哪些板块?

降准是指央行下调金融机构存款准备金率&#xff0c;是一种宽松的钱银政策&#xff0c;会添加社会上的流动资金&#xff0c;然后推动股市上涨&#xff0c;对股市来说是一种利好&#xff0c;其间利好以下板块&#xff1a; 1、利好房地产板块 央行降准会进步银行可贷资金&#x…