一 对比其中两列数据的方式
import seaborn as snssns.kdeplot(data['charge'], shade = True, hue = data['sex'])
sns.kdeplot
是 Seaborn 库中用于绘制核密度估计图(Kernel Density Estimate,简称 KDE 图)的函数。核密度估计是一种非参数统计方法,用于估计概率密度函数的形状。
参数解读:
-
data: 输入的数据。可以是 Pandas DataFrame 或 Numpy 数组。
-
x, y: 选择绘制 KDE 图的变量。如果只有一个变量,可以将其传递给
x
。如果有两个变量,可以同时传递给x
和y
,这时会绘制二维的联合核密度估计图。 -
shade: 控制是否在 KDE 图下方填充颜色。默认为
True
,即填充颜色。 -
color: 指定 KDE 图的颜色。
-
vertical: 如果设置为
True
,则绘制垂直的 KDE 图。 -
cumulative: 如果设置为
True
,则绘制累积密度图。 -
common_norm: 如果设置为
False
,每个观测值的核密度估计都将独立进行归一化。 -
fill: 控制是否填充图形区域。
-
legend: 控制是否显示图例。
-
multiple: 如果设置为
stack
,则绘制多个 KDE 图。 -
label: 图例标签。
这只是一些主要的参数,具体的参数可能根据 Seaborn 版本的不同而有所变化。
二 示例代码
import seaborn as sns
import matplotlib.pyplot as plt# 创建示例数据(这里以单变量为例)
data = [1, 2, 2, 3, 3, 3, 4, 4, 5]# 使用 Seaborn 绘制 KDE 图
sns.kdeplot(data, shade=True, color='blue')# 添加标题和标签
plt.title('Kernel Density Estimate Plot')
plt.xlabel('Values')
plt.ylabel('Density')# 显示图形
plt.show()