🤵♂️ 个人主页:@艾派森的个人主页
✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+
目录
1.项目背景
2.数据集介绍
3.技术工具
4.导入数据
5.数据可视化
文末推荐与福利
1.项目背景
二手车市场作为汽车行业中的重要组成部分,一直备受关注。随着社会经济的不断发展和人们生活水平的提高,越来越多的消费者选择购买二手车。这一趋势使得二手车市场的规模不断扩大,也引起了人们对二手车市场的关注和研究。
在二手车市场中,用户数据是一个极具价值的研究对象。通过对二手车用户数据的深入分析,可以揭示出用户的购车偏好、消费习惯、区域分布等重要信息。这些信息对于汽车生产企业、销售商以及政府部门来说都具有重要意义。例如,汽车生产企业可以根据用户数据来调整产品结构和定价策略;销售商可以根据用户数据来开展精准营销和销售服务;政府部门可以通过对用户数据的分析来指导相关政策的制定和调整。
此外,通过对用户数据进行可视化分析,可以更直观地展现数据之间的关联性和趋势变化。通过可视化手段,决策者可以更清晰地了解用户的行为特征和市场变化趋势,从而更准确地制定相应的战略和政策。
因此,对二手车用户数据进行可视化分析具有重要的理论和实践意义。这不仅有助于深入了解二手车市场的运行情况和用户特征,还能为相关利益方提供决策参考,推动二手车市场的健康发展。
2.数据集介绍
数据集来源于Kaggle,原始数据集为美国二手车市场用户数据,共有7906条,18个变量,各变量含义如下:
Sales_ID(销售ID)
name(二手车名称)
year(购车年份)
selling_price(二手车当前销售价格)
km_driven(总行驶公里数)
Region(使用地区)
State or Province(使用的州或省)
City(使用城市)
fuel(燃料类型)
seller_type(谁在出售汽车)
transmission(汽车的变速器类型)
owner(业主类型)
mileage(汽车行驶里程)
engine(发动机功率)
Max_power(最大功率)
torque(转矩)
seats(座位数)
sold(二手车是否售出)
3.技术工具
Python版本:3.9
代码编辑器:jupyter notebook
4.导入数据
首先导入数据可视化用到的第三方库并加载数据
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
from plotly.offline import iplot
import warnings
warnings.filterwarnings('ignore')df = pd.read_csv("UserCarData.csv")
df.head()
查看数据大小
查看数据基本类型
查看数值型变量的描述性统计
查看非数值型变量的描述性统计
统计缺失值情况
统计重复值情况
5.数据可视化
# 二手车名称分析
print(f"Most Used Sold Car '{df['name'].value_counts().idxmax()}'")
print(f"Lowest Used Car Sold '{df['name'].value_counts().idxmin()}'")
iplot(px.bar(df['name'].value_counts()[:20],labels={'value':'Count','name':'Name'},color=df['name'].value_counts()[:20].index,text_auto=True,title='Top Used Cars Sold'
))
# 二手车年份分析
print(f"Most Year Used Sold Car '{df['year'].value_counts().idxmax()}'")
print(f"Lowest Year Used Car Sold '{df['year'].value_counts().idxmin()}'")
iplot(px.bar(df['year'].value_counts()[:20].sort_index(ascending=False),labels={'value':'Count','year':'Year'},color_discrete_sequence=['#c72320'],text_auto=True,title='Top Year Used Cars Sold'
).update_xaxes(type=('category')))
# 地区分析
iplot(px.pie(values=df['Region'].value_counts(),names=['Central','West','East','South'],title='Region where Sold Used Car'
).update_traces(textinfo='label+percent'))
# 省或州分析
print(f"Top State or Province where Sold Used car '{df['State or Province'].value_counts().idxmax()}'")
print(f"Least State or Province where Sold Used car '{df['State or Province'].value_counts().idxmin()}'")
iplot(px.bar(df['State or Province'].value_counts().sort_values(ascending=True)[:30],orientation='h',color=df['State or Province'][:30].index,title='Top State or Province Sold Used Car',labels={'value':'Count'}
))
# 城市分析
print(f"Top City where Sold Used car '{df['City'].value_counts().idxmax()}'")
print(f"Least City where Sold Used car '{df['City'].value_counts().idxmin()}'")
iplot(px.bar(df['City'].value_counts().sort_values(ascending=False)[:20],color=df['City'][:20].index,title='Top City Sold Used Car',labels={'value':'Count'},text_auto=True
))
# 燃料分析
print(f"Top Fuel Used in Used car '{df['fuel'].value_counts().idxmax()}'")
print(f"Least Fuel Used in Used car '{df['fuel'].value_counts().idxmin()}'")
iplot(px.pie(values=df['fuel'].value_counts(),names=['Diesel','Petrol','CNG','LPG'],title='Fuel Used in Used Car'
).update_traces(textinfo='label+percent'))
# 卖家类型分析
print(f"Most Type of Seller '{df['seller_type'].value_counts().idxmax()}'")
iplot(px.pie(values=df['seller_type'].value_counts(),names=['Individual','Dealer','Trustmark_Dealer'],title='Types of Seller Used Cars'
).update_traces(textinfo='label+percent'))
# 变速器类型
iplot(px.pie(values=df['transmission'].value_counts(),names=['Manual','Automatic'],title='Types of Transmissions Used in Used Sold Cars'
).update_traces(textinfo='label+percent'))
# 业主类型分析
print(f"Most Owner Sold Used Cars '{df['owner'].value_counts().idxmax()}'")
iplot(px.pie(values=df['owner'].value_counts(),names=['First Owner','Second Owner','Third Owner','Fourth Above Owner','Test Drive Car'],title='Owners of Used Cars'
).update_traces(textinfo='label+percent'))
# 转矩分析
iplot(px.bar(df['torque'].value_counts().sort_values(ascending=False)[:20],orientation='h',color=df['torque'][:20].index,title='Top Torque Used in Used Sold Cars',labels={'value':'Count','torque':'Torque'}
))
# 行驶里程分析
plt.figure(figsize=(15,6))
sns.kdeplot(df['mileage'],fill=True)
plt.xlabel("Mileage")
plt.show()
文末推荐与福利
《AI绘画教程:Midjourney使用方法与技巧从入门到精通》免费包邮送出3本!
内容简介:
本书介绍了当前AI绘画领域极具人气的绘画工具——Midjourney,并全面系统地讲述了Midjourney绘画的基本应用技能和相关领域的实战案例。
全书共分为11章,第1章介绍了Midjourney的基础知识;第2章至第6章讲解了Midjourney 绘画的基础技能,包括Midjourney的注册、登录与订阅流程,Midjourney绘画初体验,使用Midjourney的提示词、指令、参数的方法,以及Midjourney生图方式与实战;第7章至第10章为Midjourney 绘画的实战应用,讲解了Midjourney在设计、绘画、摄影、创意生图等领域的应用,提供了实际案例以供借鉴;第11章为扩展部分,介绍了Midjourney社区的氛围及社区成员之间交流学习等相关知识。
编辑推荐:
一本书读懂Midjourney绘画,让创意更简单,让设计不再难!
零基础快速入门:Midjourney基础操作+构建有效提示词+精准生图+案例驱动
提示词速查宝典:涵盖平面设计+产品设计+室内设计+建筑设计+时尚设计+工业设计+绘画材料和技法+绘画主题+绘画风格+CG插画+摄影主题+摄影技术等提示词速查手册
超值附赠:超全领域的提示词速查表,Midjourney指令和参数速查表等
- 抽奖方式:评论区随机抽取3位小伙伴免费送出!
- 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!)
- 活动截止时间:2024-3-9 20:00:00
京东链接:https://item.jd.com/14002721.html
当当链接:http://product.dangdang.com/29685117.html
名单公布时间:2024-3-9 21:00:00
资料获取,更多粉丝福利,关注下方公众号获取