文章目录
- 启动
- 数据导入
- 绘图
启动
众所周知,pandas是Python中著名的数据挖掘模块,以处理表格数据著称,并且具备一定的可视化能力。而pandasGUI则为pandas打造了一个友好的交互窗口,有了这个,就可以像使用Excel一样使用pandas了,非常便捷。
安装过程很简单,用pip即可。
pip install pandasgui
安装完成后,从【pandasgui】中导入show函数,直接调用,就会弹出一个窗口。
from pandasgui import show
show()
如下图所示,点击菜单栏中的【setting】->【Context Menus】,可将PandasGUI添加到右键菜单或者开始菜单等位置,便于快速启动。
数据导入
在PandasGUI的菜单栏中,点击【Edit】->【import】即导入csv, xlsx等格式的数据。
此外,也可以导入Python命令行中的数据,以【pandasgui】中自带的泰坦尼克数据集为例,只需将其作为show函数的参数,即可在弹出的窗口中显示对应数据
from pandasgui.datasets import titanic
show(titanic)
其最左侧是数据列表,目前只导入了泰坦尼克数据;中间是数据筛选界面;右侧是数据区。
其数据区出现四个选项卡,对应pandasGUI的四个功能
- DataFrame 数据表,双击表头可以对此列进行排序,点击右键可弹出菜单;双击数据区,可更改单元数据。
- Statistics 数据的统计情况
- Grapher 画图
- Reshaper 数据的整体操作,比如旋转、合并、截取等。
如果数据导入时遇到下面的错误
'bokeh.plotting' has no attribute 'Figure'
只需更改pandasGUI的【utility.py】文件,将下面代码中的Figure改为figure即可。
import bokeh.plottingif issubclass(type(fig), bokeh.plotting.Figure):return "bokeh"
绘图
pandasGUI提供了许多绘图类型,包括散点图、线图、条形图、直方图、箱线图、小提琴图、3D散点图、热图、等高线、饼图、蜡烛图以及词云。
以小提琴图为例,点击进入【Grapher】选项卡后,用鼠标将【sex】拖动到中间【x】坐标后的输入框中,将【age】拖动到【y】后的输入框,然后点击上方的Violin,即可自动完成小提琴图的绘制,左右两个“小提琴”分别表示男性和女性的年龄分布。
pandasGUI基于plotly完成图形的绘制,有着良好的交互性,当鼠标掠过图像时,其右上角有一组功能按钮,可对图像进行保存、缩放等操作。
若拖动新的数据到 x , y x,y x,y轴后面,则绘图数据可被覆盖;若双击输入框,则输入框会被清除。此外,数据下方有一些按钮,点击【Reset】可清空所有输入框中的数据。