基于kaggle公开数据集,对谷歌应用市场的APP情况进行数据探索和分析。
from kaggle:
https://www.kaggle.com/lava18/google-play-store-apps
分析思路:
0、数据准备
1、数据概览
2、种类对Rating的影响
3、定价策略
4、因素相关性分析
5、用户评价
6、总结
0、数据准备
(1)模块及数据导入
导入所需数据模块:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
import seaborn as sns
导入数据,并检查数据的完整性:
review=pd.read_csv(r'D:\Users\wuxiao\Desktop\数据分析\数据分析案例\google-play-store-apps\googleplaystore_user_reviews.csv')
app=pd.read_csv(r'D:\Users\wuxiao\Desktop\数据分析\数据分析案例\google-play-store-apps\googleplaystore.csv&