优秀的python开发工具有很多,比如pycharm,spder,ipython,jupyter以及很多编辑器的插件等。但是如果利用python来做数据分析的话,要是有一款类似Rstudio的工具就好了,Rstudio是非常人性化的工具。之前有一个Redeo项目,想模仿Rstudio开发类似的python版本,不过不太完善,现在好像没了。其实,目前的新版Rstudio就支持python脚本运行。作为优秀的开源数据分析软件,R与python一直在数据分析领域不断竞争,python有rpy2包,想在python中运行R,这边R也开发了reticulate包支持python。
环境配置
1、安装python运行环境,推荐Anaconda。
https://www.anaconda.com/distribution/
2、安装R与Rstudio
R官网:https://www.r-project.org/
官方网站:https://www.rstudio.com/
3、安装reticulate包。
install.packages("reticulate")
install.packages("Rcpp")
开启python环境
测试安装环境
#加载reticulate包
library(reticulate)
#检查您的系统是否安装过Python
py_available()
#选择python版本
#use_python("/anaconda3/bin/python")
#指定包含Python virtualenv的目录
#use_virtualenv()
#指定Conda环境的名称
#use_condaenv()
#启动python命令行
repl_python()
>>> import numpy as np
>>> import pandas as pd
其实也可以在R中直接使用python,不过逻辑稍微麻烦一下,也可以实现自动补齐。
library(reticulate)
os "os")
os$getcwd()
os$chdir("../Desktop/")
os$listdir()
一个案例
为何要在Rstudio中运行python呢,因为Rstudio中可以在代码窗口中直接运行代码,而且可以实现自动补齐,图片在绘图窗口中显示,并且可以保存历史记录等,非常方便。
1、新建一个python脚本。
2、在里面写几段绘图代码。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df2 = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df2.plot.bar();
plt.show()
df2.plot.bar(stacked=True);
plt.show()
3、逐条运行。
写在最后
目前Rstudio中运行python虽然很方便,但还是有很多不完善的错误,可能会遇到很多不可预知的错误。很多时候,方便并不一定都是好事,而且重要的不是工具,而是如何使用这工具,如果是高手,即使用记事本也可以写程序,所以,更重要的还是学习程序语言本身。
---------- END ----------
(添加作者微信,请注明单位姓名)
您可能还会感兴趣的生物信息暑期班(北京站)开始报名基因学苑文章列表(201906)上传数据,直接分析,1T内存服务器来了手把手教你生信分析平台搭建专栏合集生物信息重要资源站点合集不会编程,如何进行批量操作一个人全基因组完整数据分析脚本一个细菌基因组完整分析脚本如何在Linux下优雅的装X