前不久,JetBrains团队发布了Datalore,这是一款基于云的web应用程序,用于构建机器学习模型并在Python中创建丰富的可视化。
最新的测试版本旨在简化构建机器学习模型的流程,并帮助开发人员进行数据分析。由于Datalore的智能编码辅助功能,丰富的增量计算和内置工具,对于数据科学家而言,处理复杂数据变得比以往任何时候都容易。机器学习是关于Python的,Datalore也不例外。
Datalore
Datalore提供了许多工具,尽可能提高机器学习生产力。易于使用的代码编辑器具有智能代码完成,检查,快速修复和导航功能。它可以检查程序员的工作,并利用这些自动化流程加速代码写入过程。
基本上,一旦程序员点击了一个特定意图,Datalore会自动上传、训练、测试、分割数据集,进行图形设计甚至生成新的代码。
这个新工具还可以让程序员更轻松地了解机器学习模型如何随着多次编辑而发生变化。由于其增量式计算,如果将一些变量或参数更改为模型,则可以预测会发生什么。屏幕右侧的输出始终反映最新结果,便于实时检查。
Datalore配备了几乎所有的Python机器学习工具,包括numpy,pandas和sklearn内置库。同时,Datalore还提供了两个高级内置库——基于ggplot的R实现:datalore.plot和一个可以交互式将图片添加到datalore.geo_maps分析中的库。
开发人员可以根据模型的计算需求选择实例,实例从中等(4GB RAM)到超大(61 GB RAM)规模不等,如果确实需要增加可用计算能力,JetBrains也提供额外选项。
此外,Datalore还附带了基本内置数据集和文件管理器。由于自动保存功能,不会丢失任何数据,历史文件可确保永远不会丢失重要的工作文件。程序员还可以实时远程访问工作簿和代码编辑器,添加代码并撰写评论。
如果有兴趣试用Datalore,需要注册JetBrains帐户。不过,他们也有面向学生和创业公司的折扣版本以及开源项目许可证。目前,Datalore仍在开发中,因此所有反馈都可以通过Datalore论坛进行。